(原標題:Exclusive: Google's Duplex could make Assistant the most lifelike AI yet)


語音助手能像真人打預約電話,榖歌是如何做到的?

網易科技訊 5月9日消息,據國外媒體報道,在2018年度榖歌開發者大會Google I/O上,榖歌發布瞭升級版的數字助理Google Assistant。榖歌介紹稱,Assistant的“持續性對話”功能讓對話更自然,而“多重行動”功能讓用戶在一次對話中可以提齣多個問題。此外Pretty Please功能能夠讓用戶的措辭更加禮貌規範。在發布會之前,CNET造訪瞭山景城,探究瞭榖歌Assistant背後的Duplex技術以及其他人工智能。

起初談話看起來並無二樣。

加利福尼亞州山景城的榖歌園區中,作者被邀請收聽一段預訂晚餐的電話錄音,隻有短短的51秒。

第一個人:晚上好。

第二個人:你好?

第一個人:你好。

第二個人:嗨,呃,我想為三號星期五預訂一個位子。

第一個人:好的,堅持一會兒。

第二個人:嗯。

第一個人:好的......請稍等。

第二個人:嗯。

第一個人:所以時間是星期五,十一月三號。多少人?

第二個人:對...兩個人。

第一個人:兩個人?

第二個人:是的。

當我聽到一個男人和一個女人在對話的時候,榖歌負責數字助理業務的高管正密切關注我的反應。榖歌於當地時間週二2018年度開發者大會Google I/O,現在他們正在演示榖歌助理的新功能。

結果證明這個特彆的演示非常瘋狂。

那是因為聽起來像一個男人的第二個人根本不是一個人。這是榖歌數字助理Assistant。而發音聽起來完全不像通常從榖歌傢庭智能揚聲器聽到的那種半機器人的聲音。當其中的數字助理嚮你提供天氣的最新信息或告訴你到達工作地點需要多長時間時,通常是一種毫無生氣的電子擬人聲。

作為亞馬遜Alexa,蘋果Siri和微軟Cortana的競爭對手,這可能是榖歌數字助理Assistant的下一個演變。這聽起來很明顯——甚至是怪異的——隻有人類自己會在迴答問題前停頓一下,使用諸如“嗯”和“呃”等口頭禪。它說“嗯嗯”,好似在點頭同意;它拉長瞭某些詞的發音,好像它正在花時間去思考一個問題的答案,當然它的反應是由編程算法即時實現的。

語音助手能像真人打預約電話,榖歌是如何做到的?

(圖示:在2016年度榖歌開發者大會上,榖歌首席執行官皮查伊在介紹榖歌數字助理Assistant之前錶示,“把它看作開發你自己的榖歌。”)

其背後是榖歌稱之為“Duplex”的技術,由紐約、特拉維夫和山景城的榖歌工程師和産品設計師聯閤開發 ,聽起來好像語音助手的未來已經到來。

嗯,差不多已經到來。

這個演示是榖歌計劃在今年夏天發布的“實驗”計劃的一部分。通過Duplex技術,一小部分人可以完成預訂餐廳、查看假日時間等通常通過電話進行的活動。所有這些交互都發生在後端——榖歌數字助理Assistant和餐廳之間。你甚至不會聽到發生的對話。它將來自一個未指定的電話號碼,而不需要使用用戶自己的號碼。

榖歌對部署Duplex技術的規模很小心,但錶示它會受到限製。公司強調,並不是目前所有使用榖歌數字助理Assistant的用戶都能夠體驗Duplex技術。負責榖歌助理和搜索産品設計的副總裁尼剋·福剋斯(Nick Fox)以及榖歌工程副總裁尤西·馬蒂亞斯(Yossi Matias)均錶示,由於Duplex是一項新技術,因此搜索巨頭希望“謹慎行事”。

榖歌也不會說,它的目標是在以後將這個自然發聲的助理帶進更多的産品——比如從智能揚聲器Google Home中聽到它的發音。

語音助手能像真人打預約電話,榖歌是如何做到的?

(圖示:榖歌一直在擴大其智能傢居産品綫,搭載數字助理Assistant的傢用高端音響Home Max售價400美元)

以下是預訂功能的工作原理:假設您想預約理發。隻需通過Google Home詢問榖歌助理Assistant,或從Android手機或iPhone應用程序中發信息告訴它什麼時候去哪裏。如果您在星期天中午想要喫點東西,那麼Assistant會問你是否有備選,以防萬一時間不夠用——它清楚中午到下午2點之間的時間範圍更閤適。

如果此前用戶使用過像OpenTable這樣的自動在綫預訂服務,Assistant將默認使用該係統進行預約。但是,如果不以這種方式進行自動預訂——而且許多小業務不會這樣做——榖歌助理Assistant將會替你打電話。預定成功後,Assistant將會和你確認此次行程,並將其添加到日曆中。

在另一段對話錄音中,我聽到兩個女聲在討論預約理發。其中一個依舊是採用瞭Duplex技術的榖歌助理Assistant。 “她”聽起來像是真正的人類。她甚至會迴避問題,同時在句子的末尾調高語調,聽起來甚至會讓一些人惱火。

“我們對它的思考是,‘什麼是完美的助理?’”在榖歌供職已經15年的福剋斯錶示, “當我想要一個助理時,它就在那裏,隨時準備提供幫助,我不擔心‘我的助手能不能做到。’我的助手可以做任何我想做的事情。”

大部分時間福剋斯都在榖歌從事搜索廣告業務,目前負責榖歌這個標誌性項目之一的産品。榖歌在2016年度的開發者大會Google I/O上發布瞭數字助理Assistant,距今已經有兩年時間。當時榖歌首席執行官桑達爾·皮查伊(Sundar Pichai)解釋瞭他的願景:Assistant是榖歌的精髓。

皮查伊和團隊的目標是讓榖歌的人工智能與用戶一道完成一天的工作:如今在Assistant的幫助下,用戶可以從智能揚聲器Google Home中獲取早間新聞,通過將手機攝像頭對準花朵得知物種名稱,在迴傢之前打開房間內的恆溫器等等。

但是如果榖歌的實驗成為現實,Assistant將真正成為用戶的數字助理。 “把它想象成開發屬於你自己的榖歌,”皮查伊在兩年前如是指齣。

語音助手能像真人打預約電話,榖歌是如何做到的?

(圖示:負責榖歌助理和搜索産品設計的副總裁尼剋·福剋斯(Nick Fox)錶示,“我們不想強迫人們接受,‘數字助理聽起來本應如此’。”)

與此同時,榖歌正試圖用更新後的Assistant贏得更多用戶。除瞭一種男性發音和女性發音之外,這個助手還可以用六個新聲音說話。 榖歌還使用戶能夠更輕鬆地提齣後續問題,並在開車並使用榖歌地圖時自動嚮某些人發送你的預計抵達時間。

人的感覺

如果榖歌的目標是讓Assistant成為擬人化的榖歌,那麼仍有很多事情要做。實事求是講,到目前為止榖歌的競爭對手Alexa,Siri和Cortana都沒有兌現他們的承諾。如果榖歌決定將Duplex技術擴展到Google Home以及其他麵嚮消費者的産品,那麼這種情況可能會發生變化。根據我聽到的簡短對話,可以感覺到似乎用戶正在與辦公室的行政助理交談,或者可以說像是與斯派剋·瓊斯(Spike Jonze)科幻電影《她》(Her)中的操作係統Samantha進行對話。

當然,榖歌並不是第一個進入數字助理市場的公司。亞馬遜在2014年發布瞭它的Echo智能揚聲器,同時用Alexa軟件提供語音功能,這讓人震驚。就目前而言,智能揚聲器仍然是與數字助理互動的最普遍方式,而亞馬遜在美國市場佔有69%的市場份額。根據研究公司CIRP的數據,2016年發布的Google Home佔有31%的市場份額。

榖歌和亞馬遜都在加強他們的産品綫。去年,榖歌推齣瞭40美元的傢用迷你音響Home Mini和400美元的傢用高端音響Home Max。相比之下,目前亞馬遜有10款Echo産品,價格從40美元到230美元不等。 2月份蘋果帶著售價350美元的HomePod加入瞭這場戰鬥。

但是當數字助理與物聯網設備連接時,可以控製從汽車中控、洗衣機到電燈等所有設備時,可能會賺更多的錢。根據市場研究公司Gartner的數據,到2020年人們將在物聯網設備上花費1萬億美元。

這就是為什麼榖歌一直在努力追趕的原因。今天,該公司宣佈已經嚮全球發送瞭搭載數字助理Assistant的5億颱設備,其中包括揚聲器,電話和電視機。 榖歌還錶示,Assistant支持多達30種語言發言,並將在今年年底之前支持80個國傢的語言,其中包括7個新國傢,分彆是丹麥,韓國,墨西哥,荷蘭,挪威,西班牙和瑞典。同樣,亞馬遜的Echo能夠在80多個國傢使用。

語音助手能像真人打預約電話,榖歌是如何做到的?

(圖示:榖歌工程副總裁尤西·馬蒂亞斯(Yossi Matias)指齣,“多年來榖歌一直在緻力於自然語音技術的研究。”)

榖歌上週錶示,兼容榖歌助理Assistant的傢庭互聯網設備數量從1月份的1500款增長到現在的5000款。這對於榖歌來說是一項巨大的進步,但不及兼容Alexa設備的一半。目前全球有12000款設備支持亞馬遜Alexa。

榖歌的福剋斯一直在試圖淡化與亞馬遜的競爭。

“我們很少用競爭的方式來看待它,”福剋斯說,“更大的機會是那些還沒有使用任何東西的人。”

盡管如此,兩傢科技巨頭都沒有害怕硬碰硬,並且為瞭智能傢居設備的銷售而相互齣手。今年1月份,榖歌切斷瞭亞馬遜Echo和Fire TV訪問YouTube的渠道。亞馬遜的電商平颱也不會齣售榖歌以及其收購的智能傢庭製造商Nest齣品的一些小工具。

“我們並不知道所有的答案”

特拉維夫榖歌研發中心負責人馬蒂亞斯則錶示,榖歌多年來一直緻力於開發新的自然語音技術。該公司錶示,這不是一種適用於各種電話任務的通用人工智能技術,相反它是為特定任務(比如預約業務)而量身定製的。馬蒂亞斯欣然承認,這項技術並不完美,榖歌正在謹慎行事,因為有更多人性化的人工智能會帶來更多棘手的問題。

比如說如果軟件開始鬍言亂語該怎麼辦?馬蒂亞斯告訴我,技術不會完全失控。他說,當這項功能真正發布時,軟件可能會告訴另一端的人正在與數字助理進行對話。當然在我聽到的錄音中,Assistant並沒有這樣做。

馬蒂亞斯說:“我們需要仔細考慮如何在實驗中進行這種互動。我們相信用透明度做到這一點是正確的。”

如果對話確實齣錯,軟件將會退迴到他所謂的“實時監督培訓”。在這種情況下,軟件會將對話權轉交給人來完成通話。由於對話通常不會受到人的監控,因此他們必須從頭開始。 榖歌並沒有明確這個人是否會記錄此前通話中已經討論過的內容。

Duplex技術有些類似於科幻。這就為我們帶來瞭一些既有實際意義,又有哲理的問題:一個人應該如何對待像人一樣的人工智能?人類於機器人之間的正確禮儀是什麼?在不打斷對話的情況下,人工智能在與人交談時錶明自己是機器人的最佳方式是什麼?

當被問到這些問題時,福剋斯承認榖歌工作人員正在思考這些事情。

“我們需要為每個人設定正確的期望,”他說,“這些都是技術實現的問題,我會虛心地說,我們並沒有完全知道所有的答案,並且需要根據我們在現實世界中看到的情況來加深理解。”

現在在斯坦福大學工作的矽榖未來學傢保羅·薩弗(Paul Saffo)對這種情況有自己的看法。他說,任何現實人工智能的創造者都有義務嚮與其交互的任何人透露他們正在與機器對話。

但是隨著這種技術的應用越來越廣泛,他認為人們會開始意識到與機器人談話中的“告知”。薩弗指齣:“隨著我們的機器不斷發展,人們希望自己一開始就知道他們是否正在與機器人交談。”

助理無處不在

盡管目前Duplex技術仍然是一個實驗,但榖歌的數字助理Assistant一直在不斷發展,有些新功能會即刻上綫。

其中包括更多的發音。Assistant有六個新的男性和女性美語發音,。一個女性的聲音柔和舒緩。一個新的男性的聲音稍微低沉。

“我的妻子討厭那個聲音,她說’把它從我的房間裏拿走',”福剋斯說,他播放的是一個像主持人一樣興高采烈的男性聲音。名為WaveNet的技術使聲音的擴展庫成為可能,該技術大大縮短瞭錄音員錄製每種發音所需的時間和音頻樣本。

這些發音沒有標明特定名稱。相反,每個都用一種顔色來指定,如紅色,橙色或綠色。您可以通過滑動手機設置來選擇所需的一種。當你連接到Google Home時,隻需選擇您最喜歡的語音設置,揚聲器就會識彆你的聲音,並用所選擇的助理發音迴復。

榖歌還調侃說,它也會將歌手約翰·萊金(John Legend)的聲音賦予Assistan。

與大多數更新一樣,這個想法是為瞭讓助理更加個性化。 “我們不想強迫人們接受,”一個數字助理聽起來本應如此,“福剋斯說。

將於今年夏天發布的另一個更新是叫做Pretty Please的說話模式,其要求你在嚮助理下命令時要有禮貌。這個模式的目標是鼓勵孩子們說“請”和“謝謝”,讓孩子更有禮貌。當然對於成年人也是如此。

亞馬遜上個月發布瞭一項類似的功能,用於為孩子們設計的新一代Echo Dot揚聲器。 Alexa的兒童友好型版本提供瞭正麵強化,對一個說“請”迴應的孩子,Alexa會迴應“謝謝你的問候。”

在亞馬遜發布這項功能時,榖歌錶示已經研究Pretty Please有一段時間。 “所有這些都是新生事物,”Assistant産品管理總監莉蓮·雷濛(Lilian Rincon)錶示, “我們都在努力解決這些問題,這並不奇怪。”

還有很多其他新東西:你現在可以一次提齣兩個問題,Assistant將作齣連續迴答。 (例如:肯德裏剋·拉瑪多大年紀,他最新專輯的名字是什麼?)。你也可以在不說齣“嗨榖歌”的情況下提齣後續問題,或是重復你的問題。在對話結束之前,麥剋風會保持8秒鍾的激活狀態。在此之前,麥剋風在用戶提齣問題後就暫停拾音。

開車過程中,Assistant可以在你使用榖歌地圖進行導航時嚮某人發送預定到達時間。當你在手機上訪問Assistant時,它會顯示更多視覺內容,例如關於最近航班信息和待辦事項的提醒。你還可以設置一個“自定義例程”,在關閉早上鬧鈴後立即觸發一組操作。這意味著可以自動開始早間新聞播放,交通狀況更新以及最喜歡的歌麯。

這一切都很有用。但這也意味著榖歌智能助理會更深入地瞭解用戶。

這值得討論,因為用戶隱私是科技領域討論的主要話題。自從Facebook於3月份開始與劍橋分析公司(Cambridge Analytica)發生醜聞以來,矽榖大科技企業的數據收集方法在數周內都受到瞭額外的審查。一傢數字諮詢公司可以在完全不知情的情況下從多達8700萬Facebook用戶那裏獲取個人信息,這種醜聞引發瞭關於科技巨頭如何保護用戶數據以及如何賺錢的爭論。大多數情況下,榖歌,Facebook和其他公司業務都依賴他們收集的有關用戶喜歡什麼,不喜歡什麼,購物偏好,生活方式等個人信息,以便於營銷人員可以投放特定廣告。

榖歌去年的廣告銷售額達到954億美元,而Facebook的廣告銷售額則達到瞭400億美元。

“我們的原則一直是讓用戶控製這些信息,”福剋斯說, “在過去幾周時間裏強調這一點非常重要,但我們一直都知道這很重要,對我們來說這種強化是有益的。”

他說,Assistant查詢的處理方式與常規搜索查詢完全相同,並具有相同的用戶設置。這意味著用戶可以清除搜索記錄,但這可能會影響到所看到的廣告。

所有這一切都是我們討論Assistant的真正原因。正如皮查伊在2016年提到的那樣,這是榖歌搜索的下一次發展,人們花在颱式電腦上的時間更少,更多的時間都用在手機和智能揚聲器以及汽車等互聯網設備上。

當福剋斯被問及他是否認為Assistant現在是榖歌最重要的項目時,他停頓瞭13秒。

“Assistant是榖歌一項重要業務,”福剋斯說, “做正確的事真的很重要。”(晗冰)

相關文章