2005年當Lary Page 掏出一張5000萬美金的支票慷慨地擁抱Andy Rubin和他的 Android系統的時候,肯定不會想到,他提前預定了一張谷歌在10年之後移動互聯網時代最重要的一張船票。

如今移動互聯網整個生態大局已定。但是下一個十年乃至二十年,重新洗牌的時候,會誕生一種什麼樣的操作系統? Andy Rubin 曾有一個著名論斷,“操作系統存在週期性,大約每 12 年循環一次,MS DOS 是上世紀 70 年代末的首批操作系統之一。Macintosh 和 Windows 接着在 80 年代初問世。90年代則出現了互聯網。現在是移動時代。每一個都會變得越來越強大,承前啓後。

Rubin這位從微軟去到谷歌、見證了兩個時代的終極極客,在2017年播下了自己的種子Essential ,包括一部他心目中理想的智能手機,以及一款智能家居 AI 產品——Essential Home。 Essential Home 的核心就是 Essential 的操作系統 Ambient OS。Rubin並沒有向外界詳細介紹這款操作系統,但是他強調,

“我認爲會是 AI,它和我們現在看到的其它系統稍有不同。今天,我們看到了模式匹配、視覺技術、自動駕駛汽車的自動化以及 Siri、谷歌助理等語音助手,但是我認爲在這之外還有一種技術能夠包羅萬象,不只是一個操作平臺。”

Rubin給出的答案,AI爲基礎的自然語音交互,可以突破單純的語音助手App或者底層的靜默服務,成爲一種越級的 “操作系統”。 就像Android最初只是爲數碼相機設計的一樣,最初它誕生於被主流忽略的“邊緣地帶”。

無獨有偶,純粹的邊緣試驗品亞馬遜Echo毫無跡象地爆發,這是第一種純語音控制的硬件,並且被媒體形容爲iPad之後最熱銷的消費電子產品。亞馬遜帶頭掀起一股熱潮,也讓谷歌蘋果躍躍欲試,國內百度和阿里也未旁觀,百度雄心勃勃推出了對話式人工智能操作系統DuerOS,阿里則做了AliGenie語音平臺和Yun OS.

值得注意的是,移動時代早期谷歌是兩條腿探索未來,一條Android,一條Chrome OS,基於網絡連接的Chrome瀏覽器 “越級”成爲操作系統,很大膽。開發一種純粹語音交互的操作系統,同樣也非常有趣,即使一開始它們並不是傳統意義上的 “下世代操作系統”。

當我們嚴肅討論純語音操作系統可能性的時候,當然不能忽視作爲一個生態系統的核心,操心繫統連接了三大塊,硬件製造商,用戶和開發者。

操作系統對這三者分別有不同的效益,並且互相影響和成就,典型的“協同進化”。

對於硬件製造商而言。操作系統能夠使單一硬件更加趨同,減少多樣性,使得硬件的競爭度集中同一核心維度比如“性能”上。操作系統某種程度對硬件的作用也是“鎖定”,即硬件製造商差異化減少,競爭加劇。這方面的典型是Windows培育了PC硬件在幾乎每一個領域的競爭並從中受益,硬件性能大幅上升,價格大幅下降,掠走硬件產業鏈的利潤的同時,也加速了硬件的普及。

對於開發者,他們關心的核心就是開發成本和收益。一個操作系統平臺能夠減少開發成本,有更多的用戶,投入重點就在哪裏。在如今雙寡頭系統的市場,雖然iOS市場份額較小,但是客戶粘性強,消費高且穩定,平臺開發難度和成本也較低,iOS未來風險在於iOS硬件份額由於某種原因出現大滑坡。Android則勝在用戶體量大,但是也有客單價較低,硬件碎片化加劇了開發難度,應用體驗不佳。

對於用戶來說,操作系統是網絡效應的典範。當越來越多的用戶選擇某一個操作系統平臺,該操作系統開發的軟件應用就會越多,而這反過來又會驅動更多的用戶,後者進而又增加了開發者可達的市場規模。從長期看這會導致對開發者和用戶的雙重鎖定。非傳統的例子是Facebook作爲一個App,匯聚了20億活躍用戶之後,想超越操作系統成爲一個全新的平臺。Facebook早期曾允許開發者在其社交平臺上建立自己的“輕應用”直接觸及其核心資產—全球數量第一的活躍用戶,爲他們構建一個完全屬於自己的應用程序, 但是後面發現這樣做的結果是無法維持一個穩定的平臺規則。微信也正在做這樣的嘗試。

語音交互的服務能否越級成爲操作系統,我們分別從主導硬件製造商,圈進開發者,製造用戶端的網絡效應, Duer OS和AliGenie 的成效如何。

DuerOS的先發優勢,讓它成爲中國活躍度最高智能語音助手。2018年12月語音交互達16億次, 並連續八個季度實現每季度數據翻倍。目前百度DuerOS已經與聯想、美的、海爾、HTC、小魚在家、貓王、TCL、小天才、哈曼、飛利浦、創維、東風、聯通、極米、OPPO、vivo等合作伙伴展開廣泛合作,將DuerOS的對話能力應用到智能家居、智能穿戴、車載、移動通訊等多個場景。2018年12月31日,搭載DuerOS的智能設備激活數量已突破2億臺,月活躍設備量超過3500萬,同時,DuerOS的合作伙伴數量已經超過300家,搭載DuerOS落地的主控設備超過160多款。

DuerOS 是怎麼“越級改造”傳統硬件的,以華爲平板M5青春版(8寸)爲例,用戶可以用三種方式來開啓“智能語音小度版”模式:一是插入支架,二是點擊桌面上“智能語音小度版”App,三是充電的時候點擊提示窗。其中插入支架的方式是最方便的。在插入隨平板贈送的配套智能語音底座並充電後,只要在5米範圍內通過呼叫“小度小度”喚醒詞並下達指令,就能獲得音樂、有聲、新聞、視頻等豐富的內容,從可聽到可視。

在智能語音小度模式下觀看視頻,用戶通過呼叫“小度小度”喚醒詞並下達指令,就能使用華爲平板M5青春版點播想要看的視頻,不但可以精確到具體劇集和具體時間點,還能進行快進、後退的操作,完全無需手動操作,非常高效、方便。用語音功能取代觸控,其便利性難以言表,可以說是真正做到了解放雙手。

目前,在DuerOS平臺上的開發者羣體已經超過2.7萬人,可提供包括生活服務、休閒娛樂等15種類型的1000多種技能支持,許多搭載“小度”的設備都可以秒變爲適合消費者全家老小使用的智能語音設備。DuerOS可以成爲年輕人生活和事業的“助手”,也能夠成爲兒童和老人的陪聊和生活夥伴。

阿里的AliGenie則走了另外一個方向,它更爲To B,發力場景化的應用。

AliGenie開放平臺在2017年10月12日雲棲大會發布,是由阿里巴巴人工智能實驗室發起的,面向企業/機構/創業者/開發者。 AliGenie阿里第一代中文人機交流系統,它具有自然語言處理、開放平臺、深度學習、知識圖譜等等人工智能能力,讓X1具有理解力、執行力甚至是進化力。

AliGenie開發者平臺主要包括三大部分:精靈技能市場、硬件開放平臺、行業解決方案,全面賦能智能家居、新制造、新零售、酒店、航空等服務場景 。內容開發者 、應用開發者、智能家居開發商和硬件生產商,開發者既可以創建技能,爲更多的語音用戶提供服務,也可以將自己的設備接入雲端服務,獲取語音交互能力 。

應用場景方面,AliGenie已經實現涵蓋影音娛樂、新聞資訊、購物外賣、家居控制、生活助手、兒童教育等100多項技能。 作爲一個開發者平臺,AliGenie已經與Keep、滴滴、喜馬拉雅FM等衆多產品進行了對接。另外,AliGenie還爲西溪天堂的酒店包括喜來登、悅榕莊、西軒、布魯克等提供對接,爲入駐酒店的顧客提供語音服務

AliGenie 目前的設備激活量暫時沒有權威的數據,但是阿里精靈音箱推出更早,目前是國內市場份額第一全球第三,稍微領先百度。AliGenie對硬件廠商鎖定效果並不明顯,似乎在走蘋果垂直整合的路子,但更在意幫開發者“掘金”。

目前來看,DuerOS和AliGene 在推動硬件普及和性能增長上成效顯著,但是用戶的網絡效應方面,北美市場的表現更爲顯著,之前報告顯示目前美國家庭平均5人就擁有一部智能音箱,且使用頻率、使用時間和使用功能複雜性都在提高。還有一個有趣的現象,谷歌曾經停止爲亞馬遜帶屏智能音箱Echo Show提供YouTube視頻服務。

“我們已經與亞馬遜進行了很長時間的談判,努力達成一項協議,爲兩家平臺的客戶提供良好的體驗。亞馬遜在Echo Show上部署YouTube的方式違反了我們的服務條款,導致用戶體驗被破壞。我們希望能夠儘快達成協議並解決這些問題。”

這種排他性,正是用戶越來越離不開單一平臺的標誌。智能音箱可以換別的硬件品牌,而單一語音交互系統,日積月累的數據逐漸完成了用戶習慣的定製,進而完成“鎖定”,成爲日常生活的一部分。

語音交互確實是下一代智能設備最爲靈敏的操作系統選擇。就像阿里巴巴人工智能實驗室首席科學家王剛教授說的,

同樣是交互方式,爲什麼語音交互跟手機APP比更有優勢?用手機APP聽歌我們的步驟是需要打開手機解鎖,找到APP,再用文字去輸入歌名然後再點擊播放,這個過程可能會耗時要一分鐘或是更久;而天貓精靈可能只需要五秒就夠了,它的快捷性和在效率提高方面的優勢還是非常明顯的。

但是,最關鍵的挑戰還是AI技術的成熟度。語音喚醒、語音識別、聲紋識別、語義理解、語音合成等,這一整個過程中最難突破的那個點,在自然語言語義理解系統。

因爲語言是人創造的數據類型。自然語言理解因爲人在用的時候有很大的多樣性和模糊性,要把它們精確地識別出來,具有很大的挑戰性。機器在做一件人擅長的事情,人對機器的理解能力的期待是很高的,耐心是有限的。讓硬件設備擁有人類一樣的“智慧”,它就是終極操作系統。

聲明:該文觀點僅代表作者本人,搜狐號系信息發佈平臺,搜狐僅提供信息存儲空間服務。
相關文章