無損音樂和有損音樂的概念大家應該都非常清楚,我也不多廢話。

雖然大家都知道有損音樂損失了音質,但是對於究竟損失了什麼,沒有多少人有了解有損音樂在保證了一定音質的情況下又大幅度減少了文件體積,肯定是按照某個規律來進行的,如果隨便刪減信息肯定會有很大失真。於是本文就來簡單介紹一下有損音樂的「損失」規律

要了解有損音樂的損失內容,我們需要先了解一些人耳聽覺的特性

首先,簡單的介紹一下聽覺掩蔽效應

掩蔽效應可以歸類為三種:絕對掩蔽,時域掩蔽,頻域掩蔽 要了解有損音樂的損失內容,我們需要先了解一些人耳聽覺的特性

首先,簡單的介紹一下聽覺掩蔽效應

掩蔽效應可以歸類為三種:絕對掩蔽,時域掩蔽,頻域掩蔽

1.絕對掩蔽

人的聽覺系統對於聲音頻率信號的感知範圍從20Hz~20kHz,在此頻率範圍內的聲音信號,只要能量足夠大,就能被人的聽覺系統捕獲。對於每個頻率的信號

而言,存在著一個相應的聽覺閾值。在沒有任何其他噪音干擾的條件下,某一頻率的信號的能量大於其相應的聽覺閾值,那麼這個信號才能夠被聽到。

上面的說法可能比較繁瑣,簡單的來說,就是聲音必須達到了某一個最小強度,才能夠被人聽到,沒有達到這個最小強度的聲音,人是聽不到的。不同頻率

的聲音的這個最小強度不同。

於是,我們可以通過實驗把不同頻率的這個最小強度都測試出來,然後畫在一張圖上,就得到了人耳可聽最小響度曲線

這個最小響度曲線只表明了人耳可聽最低的限度,現在讓我們用同樣的思維方式思考一下。如果要讓人耳對於幾個不同頻率的聲音感受到的響度一樣,這些頻率的聲音要達到多少強度呢??

當然,這也是可以通過實驗測試出來的,綜合數據,畫在一個圖內,又可以得出一條曲線。我們把多個不同響度的曲線放進一張圖內,就是常說的等響曲線圖了

一般取聽覺響度為40方的這條曲線當作參考,把這條曲線倒置,就是常用的A計權網路(A聲級),實踐證明,不論雜訊強度高還是低,A計權都能很好的反映人對雜訊響度和吵鬧的感覺;而且,A計權同人耳的聽力損傷程度也能夠對應的很好,即A聲級越高,損傷也越嚴重。我們經常看到的耳機或者是音箱的頻響曲線,都是經過A計權處理後的曲線,如果你看到哪個的曲線是很平直沒有什麼起伏的(特別是在高頻),那麼這條曲線就很可能是沒有經過計權的曲線了,和實際的聽感差距會很大,不能夠當作參考標準。

需要注意的是,等響曲線只是實驗室測量少數人得出的結果。不同人的身體條件不同,對於聲音的感受能力也不同,所以大部分人的聽覺特徵不會完全吻合等響曲線,但是大致的走向會是基本一樣的,誤差也不會太多。

2.時域掩蔽

時域掩蔽指的是能量較強的聲音信號可以掩蔽其前或其後或同時出現的能量較弱的音頻信號的現象。對於其前的聲音信號的掩蔽稱為超前掩蔽,其後出現的信號的掩蔽稱為滯後掩蔽,同時出現的信號的掩蔽稱為即時掩蔽。

即時掩蔽的作用時間與掩蔽信號的持續時間一樣長,而超前掩蔽與滯後掩蔽則是即時掩蔽在時間上的延伸效果。在時間線上,越向兩端延伸,效果的程度越弱。

按照常理,後出現的信號對於先出現的信號是沒有掩蔽作用的,但是由於人的聽覺系統還有大腦的反應滯後以及聲音信號前後的關聯性,使超前掩蔽也會出現。

超前掩蔽的作用時間一般很短,在20ms左右,而之後掩蔽的作用時間可以持續150ms。

舉個栗子,日常生活中談話時,如果旁邊的汽車突然響起斷續的鳴笛聲,我們也會聽不清楚對方的談話內容

時域掩蔽主要是因為聽覺系統和大腦對於聲音的反應滯後產生的,所以和上面的絕對掩蔽相同,不同人的大腦反應速度不同,所以掩蔽的持續時間也不會一樣

3.頻域掩蔽

一個強純音會掩蔽其附近頻率同時發聲的弱純音,這種特性稱為頻域掩蔽。頻域掩蔽就是時域掩蔽中的即時掩蔽,只是它是在頻域中之研究掩蔽效應。

為了能方便理解,這裡舉例說明。如果一個1000Hz的純音比另一個900Hz的純音響度高18dB,那麼900Hz的音將被1000Hz的音掩蔽,但是如果要讓這個1000Hz的純音去遮蔽距離較遠的1800Hz的一個純音的話,那麼1000Hz音就必須要高出1800Hz的音45dB!實際情況下聽到的聲音中比較少碰到這種高出45dB的情況,頻域的掩蔽效應主要集中體現在附近的頻率上。

通過深入的研究實驗發現,掩蔽閾值在以掩蔽信號頻率為中心的一個狹小頻帶內是一個常數,這個狹小頻帶就被稱為以該信號位中心的臨界頻帶。臨界頻帶的帶寬隨著中心頻率的變化而變化,掩蔽效應也隨之變化,這種變化是非線性的,而非線性關係在研究和表達上很不方便。研究者們使用了一個經驗公式來解決這個問題,掩蔽曲線與臨界頻帶的關係變成了線性關係。這個公式比較複雜這裡就不做論述。

其實大家理解了上面三個概念以後,不難想像到有損音樂是如何對「無損」音樂進行縮減而又保持一定的音質的

研究者們綜合以上三個掩蔽效應,再加上一些其他因素,建立起了一個數學模型,人體聽覺心理學模型(Perceptual Model)

在MP3的編碼過程中,通過使用聽覺心理學模型對原始無損信號進行計算,濾除掉理論上會因為掩蔽效應而聽不見的信號,只留下那些會被聽到的信號,這一過程就是「有損」的過程了。

有損音樂「損失」的就是上面提到的三種會被掩蔽掉的信號

通過對心理學模型的精度進行調整,可以不同程度地濾除掉信號,濾除的信號多了,雖然能減少總信息量節約空間,但是勢必會造成較大的失真。

MP3的編碼過程中,以CBR(固定碼率)為例,規定一個數據流量(比如常見的320kbps),然後從最高精度的心理學模型開始試起,進行編碼,得出一個結果,然後判斷這個結果的數據流量是否超過了規定的流量,如果超過了,則換下一個模型進行編碼,濾除更多的信號進行嘗試,知道數據流量符合規定流量。MP3編碼就是這樣不停地進行try and error。

MP3的編碼過程還有很多很多,多相濾波分頻帶,子帶分別輸出樣本,數據流包裝成幀,Huffman編碼進一步壓縮體積。。。。等等等等

前面也說了,本文只是向大家介紹有損和無損的差別,對於這些涉及演算法的知識,只能請大家自行搜索相關知識了 .最後,我想說的是,不同人對於聲音的感知能力不同,聽覺心理學模型不能滿足所有人,只能取一個居中的模型。如果某人對聲音的感知能力超過了這個模型的預期,那麼他就有可能聽出「有損」和「無損」的差別來了。要區別出有損和無損的差別對回放設備也有要求,如果你的回放設備解碼能力不佳,放大部分失真不夠低,電聲轉換部分又有一個較大失真的話,經過這幾層失真,無論原始信號是什麼,等你聽到都變成「有損」了,無論你聽覺能力多好,也是無法分辨出無損和有損的差別的。聲音的感受能力是可以進行訓練的,個人經驗,就上面的時域掩蔽來說,一個訓練有素的鼓手的聽覺時域掩蔽效應的影響肯定不會有普通人那麼大。就欣賞音樂的角度而言,我們沒有必要去刻意進行這種訓練,但是我們要知道,不能因為自己聽不出音質的還壞就認為別人也沒有能力聽出音質好壞 . by參照耳機吧@希維爾的精粹


這有什麼好問的,自己買張票,去大劇院聽一場不就好了。實在窮,晚上12點去小區里聽聽蛐蛐叫,蚯蚓鳴

N年前一直用標準音質:無損音質有什麼好的,幾十兆一首,還要付費。。。

前段時間:翻出來一個torrent,一千多首APE無損歌曲,順便用格式工廠轉 普通,低,高品質MP3和APE對比一下

現在:為什麼要聽標準音質。。占空間就占空間吧。。。

補充:自己搜XXX無損(APE、WAV、FLAC格式等等,30-50MB),然後用格式工廠轉低品質,普通,高品質(分別大概1-2MB,3-5MB,9-12MB),稍微放大些音量,用耳機聽,尤其是背景伴奏,然後你就明白了。


推薦閱讀:
查看原文 >>
相关文章