有了低功耗算法加持,手機語音助手不再那麼雞肋嘍~

- shenzhenware-

北京時間 4 月 10 日下午,OPPO Reno 新機發佈會舉行,OPPO Reno 系列的第一款手機也正式揭開面紗。

除了全面無孔屏、10 倍混合光學變焦等這些設計和技術,Reno 所搭載的 OPPO 新一代語音助手 Breeno 也備受關注:它比以往都具備了更加智能、主動、貼心的能力,能在合適時候,提供恰到好處的服務,比你男友更瞭解你的生活起居。

比如,它會在你飛機登機提示登機口信息,會在電影開場時提醒你將手機調成靜音模式,甚至幫你找到圖片上衣服的購買鏈接……

值得稱道的是,Breeno 的體貼還是全天候不斷線的:不管任何時候,只要是開機,我只要對手機喊一句「小布小布/hey Breeno」,它會即刻響應。只要從聲音中認出我是它的主人,它就會聽我的命令播報天氣、播放音樂,或者給朋友發個微信紅包,所有操作一步即可到位。

更重要的是,這期間我完全不必碰手機去長按某個按鍵,甚至不必在百忙之中給手機進行面部/指紋解鎖,簡單到就像跟身邊的一位朋友對話,一出聲就打開了手機的話匣子。

這一革新的交互方式,大大的簡化了過去啓動手機語音助手的操作。這讓我更相信,躺在手機的語音助手不再是一個雞肋的存在,而且距離鋼鐵俠的 Jarvis 更近了一步。

是什麼樣的技術方案,讓手機語音助手的問題得到了解決?

近年來,隨着語音交互在各種設備上「遍地開花」,語音助手也成爲各品牌新機的標配。對手機廠商來說,這不僅僅是爲了增加一個宣傳賣點,更重要的是背後商業策略層面的考量——爲其 AIoT 生態的關鍵入口做準備。

如前面提到的,大部分手機語音助手的體驗並不那麼友好,導致用戶使用頻率普遍不高,這一問題也恰恰成爲各廠商構建宏偉藍圖路上的一個「絆腳石」。

OPPO Reno 手機能夠實現息屏喚醒語音助手,從本質來看,是解決了目前大部分手機的痛點,即語音助手時刻在線的功耗問題。

有了低功耗解決方案作爲保障,語音助手可以在手機後臺一直處於低功耗運行,確保能夠聆聽和被及時喚醒,同時確保不會給手機帶來額外的運作負擔。

事實上,能做到這樣的手機公司 OPPO 也不是第一家。手機語音助手的先行者——蘋果公司從 iPhone 5S 開始就加入一枚「協處理器」 M7,該芯片通過與低功耗算法適配,可確保手機在睡眠狀態下持續監測用戶運動狀態。

直到 iPhone 6S 發佈時,該系列更新至 M9,第一次實現了手機息屏狀態下「Hey Siri」的直接語音喚醒功能。要知道,前幾代 iPhone 只有在插電源的時候下才允許這樣操作。

隨着蘋果同類型的方案應用在了 H1 芯片上,第二代 AirPods 也增加了語音喚醒 Siri 的功能,並與 iPhone 組成了業界的「王炸組合」。

那麼,OPPO Reno 這一低功耗算法方案的技術原理是怎樣的,又是如何實現低功耗算法與麥克風、DSP 處理器的軟硬配合?我們從背後的「功臣」思必馳那裏,得到了解答。

在前端信號處理、低功耗語音喚醒、聲紋二次喚醒驗證等前端技術,以及 APP + 雲端的對話交互上,OPPO Reno 應用了思必馳的語音技術方案。

讓手機實現鎖屏狀態下語音喚醒,技術原理是怎樣的

具體而言,結合 OPPO Reno 手機語音助手的表現來看,思必馳的低功耗算法在設備端上實現的原理和步驟如下:

第 1 步:在息屏、鎖屏狀態下,手機處於待機狀態,運行思必馳低功耗算法的 DSP 芯片檢測到喚醒詞時,產生中斷信號。

第 2 步:主控芯收到喚醒指令,對喚醒詞的音頻數據做二次喚醒聲紋驗證。完成驗證後,點亮屏幕,拉起語音助手,根據命令執行相應操作或調用相應的服務。

第 3:當聲紋與原註冊信息不匹配時,設備無法被喚醒。更換由註冊過聲紋信息的用戶發號語音指令,才能喚醒語音助手。

也就是說,這一過程包含了一級低功耗喚醒,二級喚醒聲紋驗證,所以設備一直處於低功耗運行的狀態,使得設備整體功耗更低。

值得一提的是,針對手機像智能音箱那樣會同樣存在「設備音樂聲太大喚不醒」的問題,思必馳在該方案中融合了回聲消除 AEC 算法,避免揚聲器聲音影響語音識別,從而實現更準確的喚醒。

以上這些還只是思必馳低功耗算法應用的其中一個方面,其實現還涉及思必馳的全鏈路語音技術

與大部分手機語音助手類似,OPPO 語音助手 Breeno 在被喚醒後,可執行命令控制、技能這兩類的操控,前者包括調整音量、手機亮度等操作,後者主要泛指電話、導航、音樂播放等服務。而這些服務的實現,均通過思必馳 DUI 開放平臺定製,包括對話交互邏輯設計,技能定製等(導航、娛樂)。

基於思必馳與 OPPO 這兩家平臺的雲端-雲端的連接,語音交互和提供服務反饋的過程中,音頻信號轉化的需求信息會通過 OPPO 的 Breeno 雲端平臺傳輸到思必馳 DUI 平臺,從而調用思必馳提供的雲端語音技術服務,實現信號接收方和反饋方的無縫連接。

讓低功耗算法技術落地,背後都經歷了什麼?

作爲一家技術導向型公司,思必馳一直以來專注語音交互技術的研究,同時,將這些技術在產品端真正實現落地,是思必馳作爲一個企業的使命。過去,思必馳的技術曾服務於阿里、騰訊、360、京東方、小米、海爾、長城、一汽大衆等大客戶。

△ 應用了思必馳語音解決方案的代表性產品

在與思必馳的交談中,我們瞭解到,技術落地並不是一個與產品簡單結合的過程,尤其軟硬件的打磨程度和深度更關係到產品體驗的好壞。

我們試圖挖掘兩家廠商之間合作背後的故事,思必馳智能穿戴產品業務負責人劉洪彬則用了一句話簡單扼要的總結:

這是一個相互成就的過程。兩家公司的合作已經深入到了系統層面,把產品體驗做到極致,才能達到足夠好的效果。

一方面,思必馳提供滿足算力要求的低功耗算法,並將通過平臺定製的服務打磨好,其中就包括更深入的二級命令操作,比如通過 Breeno 收發微信消息,這是蘋果 Siri 目前都無法做到的。

△ Breeno 能幫你讀取/發送微信消息,甚至還能發紅包

另一方面,OPPO 將設備產生的數據分享給思必馳,包括用戶在交互中產生數據、以及異常數據會同步推送到雙方的後臺。

而基於這些數據,思必馳就可以進行數據標註和模擬訓練,產生新的聲學模型,從而進一步優化 OPPO 手機的語音交互體驗,爲日後持續給用戶提供產品體驗升級打下良好的基礎。

除手機之外,低功耗算法技術如何應用在耳機上?

除了手機之外,語音助手在手錶、耳機、平板、翻譯機等設備上的應用逐漸變得廣泛,這些設備也對低功耗、隨時待命的語音助手也提出了要求。

而思必馳打造這套低功耗算法的初衷就是將這一技術覆蓋到更多的應用場景中,而不僅僅只是手機。

對於這套應用十分廣泛的方案,思必馳也有自己堅持的原則:「我們不會去打造一個通用型的方案,因爲每個垂直場景對應的服務需求不一樣,而我們打磨的服務也會因此而變得更細分、深入。」

前不久,順豐科技推出了輔助收派員處理日常收派件工作的藍牙耳機「小豐」,該智能終端設備就應用了思必馳前端信號處理、低功耗喚醒、語音識別、語義理解、語音合成、智能對話的全鏈路語音技術。

△ 順豐「小豐」耳機

基於自家的 DUI 開放平臺,思必馳提供了與場景匹配的對話、技能定製服務,包括耳機端與手機 APP 內容的完整對接,從而實現打電話、接收訂單提醒、快件攔截通知等功能。

△ 順豐「小豐」耳機應用了思必馳的低功耗解決方案

過去繁瑣的操作,如今都可以實時在線同步完成,收派員的操作體驗和工作效率大大提升了。這樣一來,過去通用型藍牙耳機在該場景中「智能不足」的短板,得到了解決。

新技術在隨行場景之外的應用空間有多大?

類似的,思必馳低功耗算法同樣能夠應用在旅遊場景中,比如智能導遊,設備可以根據當地景點自動播放背景介紹。此外,在翻譯和運動場景,也會有廣闊的應用空間。

劉洪彬向深圳灣透露:在這些細分領域和應用場景上,思必馳均已尋求到行業客戶,一起打磨產品體驗,以及新技術的探索與研究。軟硬一體的解決方案,加速低功耗產品的落地與研發週期。

那麼,在隨行場景之外,還有哪些應用空間呢?思必馳 CMO 龍夢竹表示:隨着客戶認可度越來越高,這一技術有望被應用在智能家居中的智能冰箱、空調等,尤其是進入井噴式增長階段的 AI 電視。

△ 長虹 CHiQ 人工智能空調搭載思必馳爲其打造的個性化技術方案,可聽聲識人

作爲 IoT 的中心設備,AI 電視因智能語音的加持,目前存在着普遍高功耗的問題。這必定是一個需要改進的方向,而低功耗算法就是最契合的解決方案,龍夢竹進一步指出。 在資源服務上,除自身後端資源合作之外,思必馳還打通多家智能家居平臺,可實現多設備的互聯互通。

每一個技術的每一個鏈條和分支,都蘊藏着許多有待挖掘的應用,而這些應用場景的想象空間也遠比我們想象中的要大。

這不禁讓我們眼前一亮。新技術的出現從來就不應該止於實驗室或專利發佈,而是應該落地於我們老百姓的日常。今天,我們看到了 OPPO Reno 華麗麗的秀出了它的 Jarvis 的新本領,未來,它還會更加閃亮。■

主筆:萊恩 / 深圳灣

審校:陳壹零/ 深圳灣

/////////////

左右滑動,查看更多精彩

真知灼見的科技記者

四通八達的運營編輯

● ●●

聲明:該文觀點僅代表作者本人,搜狐號系信息發佈平臺,搜狐僅提供信息存儲空間服務。
相关文章