因為聲音是一種在自然界範疇內十分微弱的能量,它幾乎唯一的作用就是影響我們的聽覺器官,從而傳播信息。所以聲學的研究主要是為了人的聽覺服務的。因此,現在前沿的聲學研究主要有兩個大方向:一個是聲音本身的投射,另一個就是人類的聽覺認知模式。

聲音的投射技術領域

1、聲音的方向性投射。這個問題現在有些公司已經在做了,用2D的揚聲器陣列實現聲音內容的分區域投射,比如在左側播放英語,在右側播放德語,而互不干擾。目前的難點在於演算法、高頻聲波的屏蔽,目前這個技術還不成熟,效果不甚理想。

在一個閉合空間里實現聲音的方向性投射,在不同位置只能聽到某一種聲源,互不干擾。圖片來源:wagen-eins.de

在這裡要注意明確方向性投射和指向性投射的區別。現在應用已經比較廣泛的指向性揚聲器,是能夠把聲音具有極強指向性地向某一個範圍進行投射。這種投射無法避免不同揚聲器之間內容的相互干擾,和方向性投射其實是不同級別的概念。原因是,在室內環境,聲音總有地面和牆面的反彈,這是揚聲器指向性再好也無法避免的尷尬結果。方向性投射是,在向某一個區域輸出該聲源內容的同時,還主動屏蔽其它區域輸出的聲源內容。所以,方向性投射一旦可以完美實現,將不僅僅可以控制聲音的角度,更可以控制——

2、聲音的距離投射。比如廣場舞大媽,想要把廣場舞的音樂聲控制在幾十米的範圍內,超出這個範圍之後音量就大幅衰減。這個其實也可以通過上面一條裡面談到的方向性投射技術來實現,但是因為上面那個技術還不成熟,這個就耽擱了。個人認為,只要方向性投射成熟應用了,距離投射肯定是迎刃而解的問題。因為超出距離的聲音,只要進行屏蔽即可,但這種大範圍環境的聲音主動屏蔽現在還做不到。

3、用揚聲器陣列實現3D聲。這個看起來似乎沒啥技術含量,但是事實是,目前實驗室環境里模擬帶有頭部跟蹤和頭部相關傳遞函數HRTF的模擬環境都是用耳機實現的。頭部跟蹤和頭部相關傳遞函數HRTF的意思是,當聆聽者轉動頭顱,ta可以真切感受到周圍聲場的變化,身臨其境。因為人類的聽覺模型建立在雙耳模型上,每個人都對自己的腦袋、肩膀、身高等有自己的心理聲學模型,靠這個模型來評估傳入雙耳的聲音信號,從而判斷聲源的距離、空間位置,當前所處房間的大小等。在通常的居住環境里,用揚聲器播放的聲音內容會在室內牆壁和地面的反射過程中受到二次渲染,帶上這個空間的聲學特性後再進入聽者的耳朵。這樣一來,音響工程師在製作聲音內容時所規劃的空間感、距離感等元素就被污染了。目前,只有通過戴耳機的方式才能避免這種污染;但通常的耳機因為不帶有頭部跟蹤和HRTF(轉動頭部時整個聲場也跟著一起轉動,就破壞了臨場感),其真實性和臨場感又比揚聲器方案差很多。

人類聲音認知領域

1、人對距離的聽覺感知。現在比較前沿的課題是,人在只能聽到的前提下(比如盲人),如何利用聲音來判斷自己距離某個物體的遠近。比如,盲人站在一個走廊里,通過踏腳,或者用舌頭弄出響聲的方式,聽回聲來判斷走廊的長度。聽覺認知的研究到最近幾年為止都停留在人能聽到多少頻率、多高的聲壓級等這些很基礎的步驟,對於距離和空間認知的研究是最近幾年才興起的。

2、音樂聲學。可能很多人,尤其是不學音樂的人都意識不到的一個問題。音樂家,尤其是演奏家們,往往注重的是演奏中對自己技術的控制、對樂句的處理和樂器的操控等;但他們很少關注聲學和人類聽覺認知的話題。音樂本身是一門科學,這一點也不假。但是要將一個演奏呈現在某個特定的場所時,就必須同時考慮這個場所的聲學環境。很多音樂家都面臨過這樣的問題,平時自己在琴房演練非常好的作品,到了演出大廳時就完全是另一種音響效果和感覺。一些經驗豐富的音樂家,比如歌唱家,會知道在比較大的劇院、周圍牆壁吸收聲音比較嚴重的劇院演唱時,需要適當增加輔音的發音力度,使得自己聲音里高頻的部分可以傳得更遠一些。合唱團在演出當天,必須在所演出的場所進行走台、綵排,這其實是讓團員們熟悉場所的聲學環境。等等等等,類似的例子非常多。然而這些技法僅限於音樂家自己的經驗,是一種樸素的口口相傳的教學。音樂聲學是一門新興的科學,這好像是人們最近幾年才開始意識到的。將音樂聲學系統化地普及到音樂教育中去,是一種趨勢,目前它還僅限於音樂老師們的個人經驗,沒有成為一門音樂演奏者的必修課。


1.低頻聲波的指向性控制。高頻可以通過陣列方式實現指向性控制。低頻聲波波長很長,控制較為困難。

2.聲音的傳播距離控制。可以起到避免牆面反射,避免漏音,保護隱私等作用。

3.點聲源的還原。可以精確實現基於物體的聲場重建。比如像3d電影一樣,感受到一顆子彈從遠處射過來。

4.聲學超材料。用於高效率吸聲,聲隱身,聲聚焦等。算是目前學術界非常熱門的課題。工業應用還不成熟。


2020年9月5 再更新一下我的一些思考

所謂的聲學超材料到底超在哪裡呢?meta到底哪裡meta了呢?我看過的所有聲學超材料的文章,其實在聲學經典教材都能找到。聲學超材料方向,我覺得一方面做物理的人需要反省是不是沒學過聲學教科書就出來改變世界了,是不是存在大量的製造辭彙的現象,是不是overclaim了太多的東西。

聲學,無非就是發聲,控制聲波,錄音,這三個方面的核心問題是什麼?所謂的聲學超材料到底對解決這些問題有沒有領先於傳統方法的思路和內涵?我覺得是沒有的。

很簡單的例子,我舉一個電聲的核心問題:喇叭的發聲效率取決於Volume velocity的響應,箱體共振點fc以下由於箱體剛性問題發聲效率指數降低,有超材料能在寬頻上解決fc以下的發聲效率問題么?(寬頻指大於兩個倍頻程)。令人神奇的是,很多超材料文章(可能超過1000篇,並且不少在PRL和Nature字刊)都以亥姆霍茲共振器這種等效於倒向管和被動輻射振膜的東西作為「超材料」,一頓分析猛如虎,好像改變世界似的,其實都是些很平凡的,教科書解釋過的玩意。並且很多文章存在overclaim,他們嘴裡所說的寬頻是用絕對頻率帶寬很衡量的,例如1GHZ,左右1MHz有效,它們就敢說寬頻。實際上應該用相對帶寬衡量,即帶寬/中心頻率(類似Q),超過經典系統Q值的才能被稱為寬頻,這個潛規則在傳統雜誌遵循的比較好,在物理雜誌真的是一言難盡。

這裡也勸大家,少關注這些垃圾,特別是工業領域,別看這些玩意,浪費時間。不過我不反對搞學術的人在這方面灌水混溫飽。已經溫飽的人學術從業人員就別這麼無聊了,多關注核心問題,而不是天天煉丹。

----------------------------------------

2020年5月25

更新一下:喬治亞理工那個組做的超材料非常有意思,這個組的review也做的好,比那些垃圾煉丹組流弊太多了。

.................................................

聲學是個交叉學科,另外語音識別什麼的不是聲學,是信號處理和cs

航空:前沿的人都在沿著飛機雜訊路標繼續前進,包括劍橋,南安普頓,PSU,MIT這些組。裡面的問題特別多,例如噴流雜訊控制,湍流激勵的雜訊,預混燃燒的熱聲震蕩等等。航空雜訊現在是學界主流。無論是聲源端還是傳播端。跟流動結合的很緊密,問題都很複雜。實驗,理論和計算做的人都很多。實驗基本大公司和核心的學校才做的起,小組只能做做縮尺模型和簡單的模型,例如薄板的湍流激勵透聲,顫振等等。理論上沒啥突破,還是60年前的那些玩意。計算方面主要是計算氣動聲學(CAA)這塊搞的人多。

水聲:水聲之所以重要是因為海里可用的通訊和探測手段幾乎只有聲波,這方面涉密,不談

超聲:超聲可能可以大體分為三個方向,能量,信號及驅動。

能量方面就是超聲清洗,碎石什麼的,

驅動什麼的類似drug delivery,也可以用於操控微型結構

信號就是成像和檢測,超聲的穿透性較差,如何兼顧穿透性(低頻超聲)和解析度(高頻超聲)是個很大的問題。造影劑的研究也挺多的,造影劑用來增強散射,也用來增強非線性諧波。超聲的前沿的問題可能是非線性,傳播效率等。

可聽聲:可聽聲範疇里的研究包括電聲,雜訊,心理聲學等等。

電聲:電聲研究的人少,都是工業界在做,學界的人興趣不大,因為那裡面工程性遠大於科學性。但這方面大家接觸的最多,可能大部分對聲學的認知都是電聲,我就多扯扯電聲。

(1)定向發聲。定向發聲有兩種,第一種是westervelt開創的parametric array,現在有幾家公司有成品了,用途比較窄,但是原理很漂亮,就是利用超聲的指向性,在兩束超聲的疊加區域利用非線性原理解調兩束超聲的差頻,這個差頻就是可聽聲。第二種就是beamforming,有些人可能不叫beamforming,但這玩意跟天線里的beamforming是一回事,就是多束聲波聚合到某個區域。這種方法對聲波來說太笨了。

(2)器件發聲效率:頻率高的時候揚聲器或者耳機單元的振膜會出現模態,意思就是整塊膜不是整體運動的,而是每個局部的運動模式不一樣,工業界的比較喜歡叫分割振動,比較形象。分割振動會導致振膜推動的體積流接近於0,所以在某些中高頻會導致發聲效率很低,具體表現就是頻率響應曲線有個坑。平面振膜是很好的解決方案,但是這玩意因為電磁耦合強度太低,總體發聲效率低。比較艱難的解決方案是不斷的各種方法去加強振膜的整體性,鍍各種亂七八槽的鍍膜或者多層結構,但是這也帶來了其他問題,例如振膜動質量越大發生效率越低,不可能無限鍍膜,總要保持振膜的動質量在比較小的水平。這方面業界做的好,學界會折騰一些新奇的但是目前沒啥卵用振膜結構。

(3)揚聲器發聲效率:剛說的是器件,現在說揚聲器整體發聲的問題。體積和低頻下潛這個矛盾是箱體低頻設計永遠的主題。不考慮其他因素的情況下,體積越小,箱體共振頻率越高。小音箱如何做到超低頻的有效頻響目前還沒有新的方法,都是用古老的導向管,被動振膜等等或者強行用dsp+功放EQ。有一些比較新但是潛力有限的方法,例如靜電吸附材料什麼的。

(4)骨傳導效率。骨傳導的問題在高頻衰減。聲音通過皮膚肉體和骨骼才傳到人體的感聲補位,高頻衰減會很厲害。這玩意還真不好弄。

-------------------------------------------

雜訊控制:研究可以大體分為聲源端,傳播端的控制。聲源端就是研究各種東西的發生機理,例如航空發動機(風扇)為代表的主動發聲的旋轉機械,飛機翅膀等被動激勵的振動源。傳播端分為主動和被動控制。被動控制沒什麼好做的,該有的東西都在教科書上。主動降噪目前多用在耳機上,降噪舒適度是個很好的方向。看知乎的吐槽,蘋果目前似乎也搞不定。

雜訊吸收和發聲效率的問題其實是一樣的。發聲由於體積限制,無法有效發出很低頻的聲音,雜訊吸收也是,小體積的吸聲器無法吸收低頻的聲音。

材料方面,

很多搞傳統聲學材料的人已經絕望的離開學界了,比較慘。現在所謂的前沿流行煉丹煉出一些結構計算等效參數,那些等效參數很吸引眼球其實都是扯淡。我覺得靜電吸附材料是個很好的方向,不過我不太了解,不提。

超材料把路帶歪了,傳統聲學的人其實不大看得上做超材料的,有一部分激烈的人認為他們都是忽悠。但是這個方向有些有意義的工作。例如法國的fink的工作,他試圖構造一個sink(對應source,聲源),讓所有雜訊都往sink里跑,裡面需要特殊材料非常超前。

懶,未完待續


2020-11-30,無聊,來點評一些超材料文章

Sheng,2020,science. 這篇文章純粹是審稿人是物理圈子,他們不太懂。如果你們按惠根斯原理去理解就簡單了。惠根斯「波前任何一點都是聲源」。那麼膜在反共振時候不同部分的速度是不同的,注意,因為我們一般講體積流連續,所以是用速度去分析。那麼當一半的膜向後運動,一半向前,組合起來對於下游輻射來說其實是一個偶極子聲源。用這個角度去看,你會發現喇叭振膜在反共振點也超材料,驚不驚訝?有興趣的可以去翻翻結構聲的書,比這玩意靠譜多了。另外偶極子只是在管道(waveguide)里不輻射聲能量,在自由空間還是可以的,所以自由空間下這種結構沒有bandgap,對於傳統降噪也沒有任何應用的潛力。

Jin Yun, APL,蜂窩+膜結構。這人吧,就是懂裝不懂,然後迷惑大眾後灌水,我不信一個傳統聲學出身的不懂這玩意。為嘛一個膜固定在蜂窩結構上會低頻隔聲遠超mass law定律呢?因為這時候mass law本來就不適用。一張平面膜,被粘上後,相當於被蜂窩結構分成了無數的小振膜,小振膜具有非常大的等效剛度,所以這裡是等效剛度在起作用,導致低頻隔聲非常好。但凡去翻翻Fahy的教科書都能知道一個固定的彈性振膜,低頻隔聲就是剛度決定的(stiffness law),這玩意沒啥好研究的。而且這玩意肯定沒用。他們的實驗是把蜂窩固定後在管道里做的,注意這個固定。只有固定了stiffness law才會生效。而現實時間是無法做到完美固定的,這玩意,例如放到飛機機艙裡面去,肯定啥效果都沒有,閉著眼睛我都能猜到。還一個勁的吹, 當然這種混溫飽的行為我們也不用過多批判。真實應用里隔聲很難的,不是這些偽學術上的小伎倆能做的。


以後有空繼續開噴


1、語音識別、語義識別,是聲學的一個重要分支。

2、自適應有源降噪,大面積依然是難題。

3、從廣譜雜訊中識別並提取語音信號,現在不到30%。

4、激光聲學 。有聲音調製激光,用激光傳輸加密的聲音。

5、次聲波應用,測量、武器、醫療。

6、海洋聲學,海底探測、聲道研究、弛豫過程、趨光性、強幹擾、海洋水文、海洋運動、海嘯

7、超聲波載波新應用:石油勘探、石油密度測試、石油脫硫、污水處理、腫瘤切除

前沿,是相對的,今天的前沿,明天就成為一般。


可能回答的有點偏,前不前沿不知道,但確實是難點。遠場語音識別技術,具體指去混響,降噪和語音分離,兩個角度,一是如何打通前後端,二是雖然dnn搬到前端以後取得了性能的提升,但如何保證實時降噪分離,尤其是多通道dnn降噪分離。數據集評價指標和baseline的規範化。相比於cv和nlp,speech的底子還很弱。


這個問題 本身就是個前沿,要麼大家一起補補課??


聲可視化


通過聲音動物個體識別?如江豚


聲學超材料應該算是前沿問題。


煲機是否有用(狗頭


推薦閱讀:
相关文章