通用微科技CEO王云龙:打造语音交互全产业链,抢占5G入口

當今社會,雞尾酒會已經成了人們很常見的社交活動,但這個看似簡單的活動卻成爲了國內外聲學領域專家學者的難題——雞尾酒會問題。當前語音識別技術已經可以以較高精度識別一個人所講的話,但是當說話的人數爲兩人或者多人時,語音識別率就會極大的降低,這一難題被稱爲雞尾酒會問題。

在多人同時說話的場景下追蹤並識別某一個特定說話人的語音,在自動語音識別技術大規模推廣應用中,雞尾酒會問題是亟待解決的關鍵問題之一。各大聲學、AI公司紛紛推出解決方案希望能解決這個難題。

大洋彼岸的學霸團隊

GMEMS(通用微科技)就是這樣一家公司,它採取了軟硬件結合的方式,提出了領先的端測語音交互解決方案,開創性地解決了在高噪聲環境下,語音信號的完整攝取問題,也就是之前提到的雞尾酒會問題。

CEO王雲龍博士告訴億歐:“之所以能解決這一問題得益於通用微強大的研發實力。”億歐瞭解到,通用微在硬件、軟件和算法三大方面均有極強的實力。”

在硬件方面,通用微科技可以做到集IC、MEMS設計以及封裝於一體,擁有自主研發MEMS硅麥克風芯片,產品已經經過數次更新換代。目前供貨的主力產品爲信噪比66dB的GMEMS2.0芯片。全球領先的信噪比爲70dB、動態範圍達到135dB以上的GMEMS2.5芯片也即將在2019年下半年進入量產。

GMEMS更是計劃推出採用顛覆式四振膜新架構的GMEMS3.0,信噪比同平臺實測可以達到76dB 到 80dB。王雲龍表示:“GMEMS3.0將超越樓氏、歌爾聲學、意法半導體等大公司的同類產品,達到行業領先的水平。”

在軟件方面,通用微科技擁有語音處理、自適應波束形成、聲紋識別三大核心技術,通過自適應機器學習聲譜分析能有效分離用戶聲音源、干擾、背景噪聲、回聲,且無需調試因動態噪聲、回聲、非穩態信號源帶來的問題。軟件的聲學設計容錯率和信號非穩態容忍度都很高。通過聲紋庫的訓練,軟件能有效識別用戶的聲音,能有效的解決雞尾酒會問題和魯棒性問題。

此外,在算法方面,通用微採用全球領先的深度學習算法可以輕鬆解決端測的語音交互功能,將實現包括微型傳感陣列、喚醒功能、降噪、消除回聲、語音增強等功能。同時算法還有喚醒率高、所需喚醒詞數據量小、喚醒準確率高的優勢,相比於市面上的同類算法更優秀。

通用微擁有強大的技術實力源於背後強大的技術團隊。CEO王雲龍博士介紹,目前公司有150多人,核心研發團隊位於美國。公司研發大約有近40人。公司首席科學家李細林來自清華、CTO吳廣華來自伯克利加州大學、VP盧延禎來自英國謝菲爾德大學。加上自己,公司四位核心創辦人均是博士,從而保證了公司技術的持續領先。

深耕行業,打造語音交互全產業鏈

除了核心人員的“學霸”背景外,GMEMS能取得領先地位,與創始人王雲龍的經歷也密不可分。王雲龍博士告訴億歐,他是一名連續創業者。早在2003年國內各產業都相對落後的時候,王雲龍博士就開始在基於MEMS的聲學微型傳感器方面進行研發,所研發的產品最終被各大品牌筆記本電腦(如聯想、戴爾等)和手機(如小米、聯想、魅族、索尼等)使用,王雲龍博士並沒有因爲自己的成績而止步不前,他重新以一個創業者的身份繼續在這個行業摸索,積累了大量的經驗。

作爲行業資深者的他,沒有選擇和大多數聲學前端器件廠商一樣,只從事產業鏈的某一環節的生產。王雲龍帶領的通用微從算法切入,涉足芯片、傳感器、麥克風陣列等環節,採用全產業鏈生產的商業模式,提供了一整套智能語音入口的聲學硬件解決方案。

被問到採用這樣的模式會不會加大研發難度的問題,王雲龍笑着說,之所以選擇這樣的商業模式,主要還因爲半導體行業上游公司被國外壟斷,往往議價權較弱,越往產業上游公司能分到的利潤就越少。在聲學前端器件產業上游,從晶圓廠商及芯片廠商,到MEMS麥克風廠商及IC廠商,再到麥克風陣列廠商,所能獲得的收入及利潤往往是遞增的。

除此之外因爲MEMS麥克風整體市場較小,僅有10億美元左右,作爲關鍵環節的MEMS麥克風,現階段即使每年有幾十億顆的銷量,利潤也不是很可觀。向MEMS麥克風傳感器的下游環節切入,很可能是通用微的必選之路。這種發展路徑在音頻器件領域也已被許多大公司證明。

王雲龍博士也提到,聲音降噪及MEMS麥克風行業是一個比較難的行業,第一他不像其他行業那樣容易產生利潤,即使產生利潤也相對較少。第二技術難度巨大,有非常多的“坑”。

“我就是在這些大坑中摸爬滾打過來的,就是在不斷的填坑。”王雲龍博士笑着說道。

雖然行業很難,但是王博士憑藉着自身多年的經驗與堅持,通用微還是取得了不錯的成績。日前通用微科技幫助位於美國的世界最大的家電芯片供應商推出全球第一個基於微控制器(MCU)的語音控制解決方案。據瞭解,該解決方案在2019年2月25日前已經通過了亞馬遜的Alexa語音服務(AVS)認證, 使原始設備製造商(OEM)能夠快速、輕鬆、廉價地爲其產品添加語音交互功能,爲終端客戶便捷使用Alexa豐富的語音體驗。

根據通用微科技與該家電芯片廠商簽訂的戰略合作協議,通用微科技爲該解決方案獨家提供了整個聲學前端,包括噪聲抑制、回聲消除、波束形成和打斷喚醒等聲學前端功能。另外,根據客戶的需求,通用微科技也可以提供通過AVS認證的Alexa喚醒詞或定製其他的喚醒詞。

通用微科技CEO王云龙:打造语音交互全产业链,抢占5G入口

圖:採用通用微語音交互解決方案的亞馬遜的Alexa

5G來臨,搶佔智能家居入口

在自身取的巨大成功的同時,作爲連續創業者的王雲龍博士也有些經驗想分享給後來的創業者。王雲龍博士說道:“我十分贊同農村包圍城市這項決策,運用到企業上也是這樣。初創公司和品牌合作的時候,先不要總想着和大品牌合作,可以先從小企業合作起,這樣可以讓產品有個落地驗證的過程。硅麥也是如此,比如和華爲、OPPO這些公司合作,不是說性價比最高他們就買了,而是說如果你的東西出了質量問題能不能妥善處理減少損失。比如你買了一個智能冰箱,智能冰箱語音交互只是一部分的功能,即使語音交互壞了冰箱本身的功能還在,所以產品的安全性十分重要,要先保證產品的質量。”

隨着目前科技的飛速發展,5G的到來也近在眼前,智能家居是5G落地的一個重要場景,據前瞻產業研究院數據顯示,2016年,我國智能家居市場規模達605.7億元,同比增長率50.15%。預計未來幾年內智能家居將迎來爆發,到2018年,智能家居市場規模將達1396億元。在2020年前,中國有望成爲亞洲最大的智能家居市場。如此大的市場對各個行業的重要性不言而喻。

語音輸入作爲智能家居的重要入口也一直被智能音箱行業內各個玩家所爭奪,例如百度的小度、阿里的天貓精靈、小米的小愛同學等等。對此在美國生活多年的王雲龍博士卻認爲中國和美國國情不同。“中國人的生活情況與居住習慣和美國不同。”王雲龍說,中國人很少有美國人非工作時間之外的生活文化,中國版的Echo很可能不是智能音箱,而更可能是耳機。據瞭解,目前通用微已和一些著名品牌耳機廠商建立合作,爲他們提供完整的聲音解決方案。王雲龍希望在即將到來的5G時代,國內的端側語音交互技術能取得進一步的成功。

相关文章