2005年当Lary Page 掏出一张5000万美金的支票慷慨地拥抱Andy Rubin和他的 Android系统的时候,肯定不会想到,他提前预定了一张谷歌在10年之后移动互联网时代最重要的一张船票。

如今移动互联网整个生态大局已定。但是下一个十年乃至二十年,重新洗牌的时候,会诞生一种什么样的操作系统? Andy Rubin 曾有一个著名论断,“操作系统存在周期性,大约每 12 年循环一次,MS DOS 是上世纪 70 年代末的首批操作系统之一。Macintosh 和 Windows 接着在 80 年代初问世。90年代则出现了互联网。现在是移动时代。每一个都会变得越来越强大,承前启后。

Rubin这位从微软去到谷歌、见证了两个时代的终极极客,在2017年播下了自己的种子Essential ,包括一部他心目中理想的智能手机,以及一款智能家居 AI 产品——Essential Home。 Essential Home 的核心就是 Essential 的操作系统 Ambient OS。Rubin并没有向外界详细介绍这款操作系统,但是他强调,

“我认为会是 AI,它和我们现在看到的其它系统稍有不同。今天,我们看到了模式匹配、视觉技术、自动驾驶汽车的自动化以及 Siri、谷歌助理等语音助手,但是我认为在这之外还有一种技术能够包罗万象,不只是一个操作平台。”

Rubin给出的答案,AI为基础的自然语音交互,可以突破单纯的语音助手App或者底层的静默服务,成为一种越级的 “操作系统”。 就像Android最初只是为数码相机设计的一样,最初它诞生于被主流忽略的“边缘地带”。

无独有偶,纯粹的边缘试验品亚马逊Echo毫无迹象地爆发,这是第一种纯语音控制的硬件,并且被媒体形容为iPad之后最热销的消费电子产品。亚马逊带头掀起一股热潮,也让谷歌苹果跃跃欲试,国内百度和阿里也未旁观,百度雄心勃勃推出了对话式人工智能操作系统DuerOS,阿里则做了AliGenie语音平台和Yun OS.

值得注意的是,移动时代早期谷歌是两条腿探索未来,一条Android,一条Chrome OS,基于网络连接的Chrome浏览器 “越级”成为操作系统,很大胆。开发一种纯粹语音交互的操作系统,同样也非常有趣,即使一开始它们并不是传统意义上的 “下世代操作系统”。

当我们严肃讨论纯语音操作系统可能性的时候,当然不能忽视作为一个生态系统的核心,操心系统连接了三大块,硬件制造商,用户和开发者。

操作系统对这三者分别有不同的效益,并且互相影响和成就,典型的“协同进化”。

对于硬件制造商而言。操作系统能够使单一硬件更加趋同,减少多样性,使得硬件的竞争度集中同一核心维度比如“性能”上。操作系统某种程度对硬件的作用也是“锁定”,即硬件制造商差异化减少,竞争加剧。这方面的典型是Windows培育了PC硬件在几乎每一个领域的竞争并从中受益,硬件性能大幅上升,价格大幅下降,掠走硬件产业链的利润的同时,也加速了硬件的普及。

对于开发者,他们关心的核心就是开发成本和收益。一个操作系统平台能够减少开发成本,有更多的用户,投入重点就在哪里。在如今双寡头系统的市场,虽然iOS市场份额较小,但是客户粘性强,消费高且稳定,平台开发难度和成本也较低,iOS未来风险在于iOS硬件份额由于某种原因出现大滑坡。Android则胜在用户体量大,但是也有客单价较低,硬件碎片化加剧了开发难度,应用体验不佳。

对于用户来说,操作系统是网络效应的典范。当越来越多的用户选择某一个操作系统平台,该操作系统开发的软件应用就会越多,而这反过来又会驱动更多的用户,后者进而又增加了开发者可达的市场规模。从长期看这会导致对开发者和用户的双重锁定。非传统的例子是Facebook作为一个App,汇聚了20亿活跃用户之后,想超越操作系统成为一个全新的平台。Facebook早期曾允许开发者在其社交平台上建立自己的“轻应用”直接触及其核心资产—全球数量第一的活跃用户,为他们构建一个完全属于自己的应用程序, 但是后面发现这样做的结果是无法维持一个稳定的平台规则。微信也正在做这样的尝试。

语音交互的服务能否越级成为操作系统,我们分别从主导硬件制造商,圈进开发者,制造用户端的网络效应, Duer OS和AliGenie 的成效如何。

DuerOS的先发优势,让它成为中国活跃度最高智能语音助手。2018年12月语音交互达16亿次, 并连续八个季度实现每季度数据翻倍。目前百度DuerOS已经与联想、美的、海尔、HTC、小鱼在家、猫王、TCL、小天才、哈曼、飞利浦、创维、东风、联通、极米、OPPO、vivo等合作伙伴展开广泛合作,将DuerOS的对话能力应用到智能家居、智能穿戴、车载、移动通讯等多个场景。2018年12月31日,搭载DuerOS的智能设备激活数量已突破2亿台,月活跃设备量超过3500万,同时,DuerOS的合作伙伴数量已经超过300家,搭载DuerOS落地的主控设备超过160多款。

DuerOS 是怎么“越级改造”传统硬件的,以华为平板M5青春版(8寸)为例,用户可以用三种方式来开启“智能语音小度版”模式:一是插入支架,二是点击桌面上“智能语音小度版”App,三是充电的时候点击提示窗。其中插入支架的方式是最方便的。在插入随平板赠送的配套智能语音底座并充电后,只要在5米范围内通过呼叫“小度小度”唤醒词并下达指令,就能获得音乐、有声、新闻、视频等丰富的内容,从可听到可视。

在智能语音小度模式下观看视频,用户通过呼叫“小度小度”唤醒词并下达指令,就能使用华为平板M5青春版点播想要看的视频,不但可以精确到具体剧集和具体时间点,还能进行快进、后退的操作,完全无需手动操作,非常高效、方便。用语音功能取代触控,其便利性难以言表,可以说是真正做到了解放双手。

目前,在DuerOS平台上的开发者群体已经超过2.7万人,可提供包括生活服务、休闲娱乐等15种类型的1000多种技能支持,许多搭载“小度”的设备都可以秒变为适合消费者全家老小使用的智能语音设备。DuerOS可以成为年轻人生活和事业的“助手”,也能够成为儿童和老人的陪聊和生活伙伴。

阿里的AliGenie则走了另外一个方向,它更为To B,发力场景化的应用。

AliGenie开放平台在2017年10月12日云栖大会发布,是由阿里巴巴人工智能实验室发起的,面向企业/机构/创业者/开发者。 AliGenie阿里第一代中文人机交流系统,它具有自然语言处理、开放平台、深度学习、知识图谱等等人工智能能力,让X1具有理解力、执行力甚至是进化力。

AliGenie开发者平台主要包括三大部分:精灵技能市场、硬件开放平台、行业解决方案,全面赋能智能家居、新制造、新零售、酒店、航空等服务场景 。内容开发者 、应用开发者、智能家居开发商和硬件生产商,开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力 。

应用场景方面,AliGenie已经实现涵盖影音娱乐、新闻资讯、购物外卖、家居控制、生活助手、儿童教育等100多项技能。 作为一个开发者平台,AliGenie已经与Keep、滴滴、喜马拉雅FM等众多产品进行了对接。另外,AliGenie还为西溪天堂的酒店包括喜来登、悦榕庄、西轩、布鲁克等提供对接,为入驻酒店的顾客提供语音服务

AliGenie 目前的设备激活量暂时没有权威的数据,但是阿里精灵音箱推出更早,目前是国内市场份额第一全球第三,稍微领先百度。AliGenie对硬件厂商锁定效果并不明显,似乎在走苹果垂直整合的路子,但更在意帮开发者“掘金”。

目前来看,DuerOS和AliGene 在推动硬件普及和性能增长上成效显著,但是用户的网络效应方面,北美市场的表现更为显著,之前报告显示目前美国家庭平均5人就拥有一部智能音箱,且使用频率、使用时间和使用功能复杂性都在提高。还有一个有趣的现象,谷歌曾经停止为亚马逊带屏智能音箱Echo Show提供YouTube视频服务。

“我们已经与亚马逊进行了很长时间的谈判,努力达成一项协议,为两家平台的客户提供良好的体验。亚马逊在Echo Show上部署YouTube的方式违反了我们的服务条款,导致用户体验被破坏。我们希望能够尽快达成协议并解决这些问题。”

这种排他性,正是用户越来越离不开单一平台的标志。智能音箱可以换别的硬件品牌,而单一语音交互系统,日积月累的数据逐渐完成了用户习惯的定制,进而完成“锁定”,成为日常生活的一部分。

语音交互确实是下一代智能设备最为灵敏的操作系统选择。就像阿里巴巴人工智能实验室首席科学家王刚教授说的,

同样是交互方式,为什么语音交互跟手机APP比更有优势?用手机APP听歌我们的步骤是需要打开手机解锁,找到APP,再用文字去输入歌名然后再点击播放,这个过程可能会耗时要一分钟或是更久;而天猫精灵可能只需要五秒就够了,它的快捷性和在效率提高方面的优势还是非常明显的。

但是,最关键的挑战还是AI技术的成熟度。语音唤醒、语音识别、声纹识别、语义理解、语音合成等,这一整个过程中最难突破的那个点,在自然语言语义理解系统。

因为语言是人创造的数据类型。自然语言理解因为人在用的时候有很大的多样性和模糊性,要把它们精确地识别出来,具有很大的挑战性。机器在做一件人擅长的事情,人对机器的理解能力的期待是很高的,耐心是有限的。让硬件设备拥有人类一样的“智慧”,它就是终极操作系统。

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
相关文章