超过的部分应该听不见吧?这么大的频响有什么意义?


这个问题感觉已经回答过很多次了。然而浏览了一下目前已经有的8个答案,居然都没有说出重点。

首先给一个很简短的评语:先不要说超过20000Hz能不能听见,你先问问这个标称频响20-20000Hz的耳机,接近20Hz以及20000Hz的时候它真的发得出声音吗?

所以本人的回答也从两个方面来进行:人的听觉,和耳机的频响。

首先谈一下人的听觉范围,所谓的「20-20kHz」

看知乎的人不一定都是声学专家,所以先从最基本的开始。所谓Hz,是时间t的倒数单位,也就是说,t的单位是秒s,而给秒取倒数,就得到了Hz,也就成了1/秒,也就是每秒的次数。那么,20Hz也就是每秒20次的意思。声音是一种振动,但凡振动都有周期,也就是有了频率,所谓20Hz的声音,也就是每秒振动20次的意思。

人耳是通过耳膜被外界空气传来的振动所激励,从而推动三根小听骨所组成的杠杆结构,将频率不变、振幅增大的振动形式传递到耳蜗的卵圆窗,耳蜗内的液体在振动中扰动毛细胞,造成基底膜两侧电压差,从而有电流产生并被送入听神经。振动被转化为不同频率的电信号送入脑神经网路,而振动所产生的压力从耳蜗上的另一个椭圆窗被释放。这是一个完全由硬体实现的过程。既然是硬体,就有线性度,有频响曲线,所以也就有了实验测得的所谓可听范围。

可能很多人都知道有一个东西叫做等响度曲线:

这个曲线的意义在于,让作为普通人的我们明白,人耳并不是一个线性(线性的「线」是直线的意思,也就是说,一个系统如果是线性的,那么它的输入和输出函数在坐标系里会是一根直线,也就是不依赖于频率的等比例输出)系统,它在不同频率上也有不同的灵敏度。比如这张图上,一根红线所代表的就是一个主观的响度,那么60phon(phon是心理声学的响度单位,0phon代表恰好听不到,100phon代表耳朵能承受的最大音量)的响度曲线上我们可以看到,一个20Hz的声音要大约110分贝,而大约16kHz的声音只要大约68分贝,我们的耳朵会认为这两个声音响度是一样的。

这里的分贝值是绝对的物理量。也就是说,要让我们听到一个20Hz的声音和一个16kHz的声音一样响,用来驱动耳机发声单元的电流值是不同的,耳机振膜的振幅也是不同的。

也许你会说16kHz和20kHz之间相差了4000Hz,怎么会有这么大的缺口?那么这里还需要再补一课:人耳对频率的认知居然也不是线性的。而是对数形式的。

频率高,我们就会觉得声音高,反之则低。然而频率高低之间的差异却并不是线性地反映到我们对声音高低的认知中去。举例:我们知道,一个八度之间是两倍的频率关系。也就是说,20Hz高一个八度是40Hz,而1000Hz高一个八度不是1020Hz,而是2000Hz。这样看来,频率越高,其相对我们对声音高低认知的差距就会越大。20kHz只比16kHz高了1.25倍。1.25倍是什么概念呢?差不多就是一个大三度,也就是我们唱的do re mi里面的do和mi之间的距离而已。

当然了,用于音乐的主音的频率,以钢琴为例,最低的是A2,频率大约为27.5Hz,最高音是c5,频率大约4186Hz。不在这个频率范围内的声音,很难产生音乐旋律的感觉。然而音乐的欣赏离不开人耳对高达约20kHz频率声音的认知,是因为声音里面有泛音,也正是泛音决定了乐器的音色。比如下图是小提琴上拉出单音g,#g,a和b的频谱:

图片来源:Michael M?ser, Technische Akustik

图上可以看出,这四个不同的音高,在频率能量的分布上看起来极为相似(音色相似),而我们人耳对于其音高的认知则十分明显(能量最集中的频率点不同)。这是因为听觉系统具有极高的时间解析度,对于极细微的时间结构(TFS,temporal fine structure)也能明确分辨。

我在我的专栏里写过一篇文章:

萌吴:我们真的能听到21kHz的声音吗??

zhuanlan.zhihu.com图标

在这篇文章里指出了,因为所谓20Hz到20kHz的听觉范围是用单音的方法测得,而近年来已经有学者通过对比包含高频内容和不包含高频内容的音乐素材发现,不论性别、年龄和听音经验,人耳都有区分这些素材的能力。研究的方法很简单,就是业界常用的ABX方法:被试者在软体界面上点击A、B、X三个按钮聆听其所播放的声音素材,然后在A和B中选择与X相同的那个素材。通常被试被要求连做18次(当然,ABX每次都随机改变),如果做对的次数高于12次,就可以认为他「蒙对」的概率很低。这些高频内容甚至能够达到21kHz。如何解释这种现象呢?用直白一点的话来说,就是:一个20kHz的正弦波单音(因为正弦波代表的是简谐振动,其物理特性决定了按照简谐振动发出的声波没有泛音,在频谱上只有一个频率,所以在实验中被广泛应用作单音,或纯音)你听不见,但一个铃铛的声音被理想地录下来,做成两个版本,一个理想高保真(这里就要用到频响超过20kHz的耳机,因为铃铛振动时必然有超过20kHz的频率部分),另一个切掉了20kHz以上的频率,你是可以分辨出这两个录音的!事实上,对于铃铛、镲等这类高频能量集中的金属乐器的敲击声,其高频部分冷峻的音色极大依赖于16kHz左右以上的部分。当大约16kHz左右开始被切掉(high cut)时,我们通常能听出十分明显的音色变化。而这些频率的部分,就是我们所说的TFS。

正是因为人耳对于TFS极为敏感,音响系统才需要尽量保证在可听范围内的线性输出,否则很容易被认为失真。所以,接下来我们进入下一个环节——

耳机频响范围超过20kHz并不是为了耍酷

上面已经说了,虽然我们人耳的「频响」范围不是线性的,但到了高频部分,对于TFS的认知却是毫不含糊的。这也就要求,耳机要在这些频率范围的线性度一定要非常好,要尽可能真实地还原这些部分。

所以,不管是提问者,还是回答者,好像都认为一个耳机标称20-20000Hz,那么它的频响在20Hz处就突然从无到有,然后一直挺拔地保持到20000Hz处,而在20001Hz处就猛然崩塌?我把你们这种idea画了个图:

不管你是学文科,理科,还是工科,我请问你,上图这种频率响应,可能吗?有这样的耳机吗???如果有,一定推荐给我,我砸锅卖铁也要去买一副啊!

事实上,现实中存在的耳机的频率响应是这样的:

图片来源:Jens Blauert, Communication Acoustics

这三个图分别是图说中两副耳机和一个扬声器在40个被试阻塞耳道中的频率响应传递函数。像中间这个,拜亚动力的DT-990,已经算是频响非常好的耳机了,主观听感线性度已经一级棒了。而从线性角度来审视的时候,则会看到从大约4000Hz开始有明显的崎岖和非线性。

再来一张来自网路的图,可以更直观地解释耳机作为一种物理振动的实现者,在频率响应上的非线性度:

假设你是这副耳机的制造者,当你对它进行测试并得到上图的频率响应后,你可以理所当然地标称它的频响范围是20Hz到20000Hz。但是它的线性度如何呢?几乎没有哪个厂商会把它印在包装盒上了。当然了,我也没有见过真正傻到只把线性度好的范围当作频响范围来推销的厂商。当然,专业提供实验设备的除外。事实上专业的音响设备在铭牌上甚至也会画上频响曲线。

所以,明确了这一点,也就不难理解,为什么可能有的耳机标称5Hz到80000Hz的频响。因为,5Hz其实比20Hz低了2个八度,而80000Hz比20000Hz高了2个八度。一来,在频响范围两侧各拓宽2个八度,这从一般声音的泛音范围来看,在物理属性上也并不是一个宽得夸张的范围;二来,就算我们用这副耳机不是听音乐,而是听正弦波单音,从它拓宽的频响范围也可以知道,它的频响曲线必定比上图要宽广,也就意味著在我可感知的20Hz到20000Hz范围内,它的线性度必然更好,因为它的线性度急速衰减发生在两侧5Hz和80000Hz附近,而这里是超越我可听范围的地方。

我又画了一副图:这只是一副简化了的示意图,蓝色的曲线表示某频响标称20-20kHz的耳机的频响曲线,红色的是标称5-40kHz频响的某耳机的频响曲线。我们忽略在频响范围内的崎岖,只看两侧的极值处:红色的耳机明显在人类可听范围内线性度更好。

综上:

  1. 在一个复杂的声音里(尤其是音乐),16kHz以上乃至21kHz部分的TFS是完全可以被人耳清晰识别、并作出是否失真的判断的。复杂声音也恰恰是绝大多数消费者用耳机听的内容。这就要求耳机在20kHz甚至更高频率处也要有极好的线性频响。
  2. 耳机标称20Hz-20000Hz频率响应,并不代表它的频率响应在这个范围内——尤其是在两端——也是线性的。事实上,越靠近极值,它的频响就越差。甚至可能有的耳机在20000Hz处只能测得极其微弱的响应,却也依然可以标称达到了20000Hz的频响。
  3. 因为耳机振膜的物理属性,它在所标称的频响范围两侧极值处必然有极大的衰减(其实这里恰恰应该反过来理解:因为在这两个值处有衰减,所以才标称这两个值为极值)。这就像一个倒扣过来的盘子——这是自然规律。那么,频响范围越宽,这个盘子就越大,而当它极大地大过我的可听范围时,可能在我可听范围的两端极值处就可以得到相对更好的线性度。


通俗的讲,通常如果一个单元按照-6dB算截止频率20kHz,那么在接近20kHz的部分就不会表现太好。何况有很多厂家是按照-10dB标的。也就是说,如果频响标称20kHz,实际上在20kHz已经衰减10dB了,也许从10几k就开始衰减了。

但高频做到100kHz是什么鬼呢?


国外著名声学论坛,ASR的某位大神,用来测试dac和amp的测试报告,设定发听觉范围极限就是最低0hz,最高到20000hz,我不明白为什么20000hz以上仍然对人耳有意义,有人能替我解答一下吗?


是这样的,先说结论: 这个指标很有用。

单纯的20000hz正弦波理论上来说人耳确实无法听到,但是实际的音频波形并不是标准的正弦波,而是由无数个从低到高频率的正弦波叠加而成。所以对于不规则波形来讲理论上说所需要高频分量有可能达到无穷大(可以类比一下无穷级数的概念)。这也说明了高频延伸好的耳机(频响范围大于20000,可达到35000,45000甚至更高的这种耳机)演绎出来的声音更加还原,更加保真。具体提现就是声音更加细腻,更加顺滑,音色更加准确。

至于低频的下潜,这个实际测量中并不是标了20hz就是声音到了20hz以下就突然消失,20hz以上突然就跟1khz响度一样了。真正的指标是20hz可以达到小于多少多少db的衰减,在这个范围内可以认为低频下潜范围在20hz。但是我们都知道耳机低频的截止不是戛然而止,而是一条缓降的曲线。标著下潜到20hz的耳机可能在35甚至50hz就开始下降了,造成50hz以下响度很小显得下潜不到位。但是如果这个时候靠抬高低频来增大响度的话往往抬高的是一个比较高的频段比如25-100hz。这个时候就会感觉低频量上去了,下潜不到位,还原也不到位。


没有意义。或者说,意义就是让你花钱啊

要不你说布加迪威龙跑到500时速时拐不了弯又煞不住车有什么意义

耳机还更恶劣一点,因为布加迪威龙指不定还真有无聊的富商拿去盐湖赛车场跑个500时速

但是耳机呢?我们先想一个简单的问题:我们录音的麦克风能捕捉20kHz以上,20Hz以下的声音吗?

看看录了无数现场演唱会和演奏会的传奇麦克风U47是个什么参数:

也就20-20kHz。那你指望作为回放器材的耳机20kHz以上的声音从哪来?莫不成通过脑放正式踏入玄学领域?

也许厂商会说:频响范围广说明我振膜用的好哇,单元好哇

但你要合计合计这些厂商标榜的频响范围有多大水份,21kHz能出声音就说明频响达到了21kHz?

要不要这么不要脸。看看严谨、正儿八经的耳机商(声学研究机构?)音特美是怎么说的:

「在20Hz至16kHz之间具有92%以上的响应精度」

没有精度的频响范围能算频响范围?真是欺负烧友都是聋子


推荐阅读:
相关文章