在央視315晚會上,「機器人撥打騷擾電話」的黑色產業鏈被曝光。有公司的機器人一年撥打出去的騷擾電話已經超過40億!阿里AI實驗室發布了一項內部代號名為「二哈」的智能防騷擾電話技術。當用戶在手機上開通了這項服務,在接到騷擾來電時,用戶可以直接轉接給機器人接聽。Demo效果如下,如何評價?據稱支付寶小程序獲天貓精靈App上已能體驗「二哈」。


幾點想法

第一,開通了服務就轉機器人接聽,這個…理論上是好的,實際上誰知道哪個電話重要哪個有價值? 隱私呢?何況現在電話用的還多嗎???所以,對個人來說這個意義有限

第二個,這個東西用來替代人工客服不錯,比如淘寶客服,或許以後可以用到機器人服務場景,比如陪聊,但是,這東西還有很長一段路要走,就目前而言這技術用來打騷擾電話不錯 ,那些打騷擾電話的公司是不是已經利用了這個成果??? 另外,這種技術現在已經很多在用,沒發現應用層面的差異

第三,好像對於防騷擾來說陌生的或者被標記為廣告或者騷擾的號碼直接切斷就行了,比如05719xxx這種號碼

最後,沒事少插播阿里廣告,還要包裝做好人狀


這是前微軟亞洲研究院首席研究員、現阿里巴巴AI實驗室傑出科學家、阿里AI北京研發中心負責人聶再清負責的項目,據說最初只是因為開會老被來電打斷,於是課餘搞了這麼個項目。

現在竟然因為3.15晚會上曝光的AI騷擾電話而一炮走紅。

在「二哈」發布後,量子位跟聶再清博士圍繞背後技術原理展開對話,聶博士進行了詳細解答:

技術原理:智能聊天

「二哈」背後,主要使用了智能聊天技術。

所謂「智能聊天」,需要理解用戶請求,同時用強大的知識圖譜製作聊天的知識點,通過跟用戶對話,把知識圖譜里的知識灌輸給用戶,同時也引導用戶反饋。

該過程中,AI跟用戶聊的越多越好,AI會學到很多知識,用戶聊完以後也會「教學相長」並慢慢把AI當朋友。

更具體來說,智能聊天是用深度強化學習來學習對話策略的,因為不是精度要求非常高的任務完成。

所以就算AI聊錯一點,沒有多大的關係,用戶只是會對這個回復不太高興(不像任務完成時需要100%準確完成主人的任務)。

通過強化學習,下次對話策略演算法就可能更好地知道,到底應該怎麼和這類用戶聊天。

如果從垂直技術應用劃分,過程中交叉使用了語音識別NLP知識圖譜,以及語音合成(TTS)等技術。

聶再清解釋:

  • 首先用到了語音識別技術把用戶的語音轉成文字。
  • 接著自然語言理解技術,把來電者的意圖和具體的槽值抽取出來。
  • 緊接著對應到一個精準的知識圖譜上面去,這樣「二哈」就能把用戶輸入和現實世界的人與物聯繫起來。
  • 然後,基於對用戶當前輸入的理解以及歷史交互的上下文信息,「二哈」需要決定下一句應該是回答來電者的一個問題還是給來電者提一個問題。
  • 最後,二哈還需要用的語音合作技術(TTS)把文字變成人聲。

但聽起來章法清晰、步驟明確,要真正做到真假難辨卻不容易。

如何做到真假難辨?

聶再清認為核心要做到以下3大方面:

第一,接住用戶的每一句話。

因為用戶的輸入空間非常大,要理解和聰明的回復來電者的每一句話很有難度。

對於一些不是「二哈」知識領域的問題,阿里AI目前採用了閑聊(ChitChat)的技術,從互聯網上公開的人類對話庫中來找到最適合回復,這是一種基於 information retrieval 思路來找到排名最高的相關回復。

目標是讓來電者看不出「二哈」可能的知識缺乏。

第二,主動提出一個相關問題。

這更多是一個對話策略學習的工作,需要讓來電者知道「二哈」真能理解他們的話,並提出只有理解了對話上下文,才能提出的好問題。

一味被動接話,很容易被識破。

該項挑戰非常大,聶再清在2018年AAAI上有一篇參與發表的論文(CoChat: Enabling Bot and Human Collaboration for Task Completion),核心就是提出一套聊天機器人對話策略學習框架,讓「二哈」這樣的聊天機器人在不同的場景下都可以持續學習。

包括監督學習、在線學習、和深度強化學習(sentiment analysis)。

並且通過和人類不斷對話,「二哈」AI會越來越好地知道如何提問才能更好地達成他的目標。

最後,像真人一樣的語音語調以及停頓。

如果推銷廣告的騷擾電話,通過聲音判斷初接電話的是個機器人,他們就不會繼續聊下去了。

所以「二哈」在語音合成(TTS)方面做了很多工作。

阿里AI最新演算法利用Tacotron加上基於神經網路的聲碼器演算法,合成出極其逼真的人聲,但遺憾的是還有很大比例情況不能通過圖靈測試。

於是「二哈」現在採取了過渡性方案,把非常高頻的回復借用真人錄播。但毫無疑問,未來該方案會不斷減少。

而且值得注意的是,「二哈」最初只是一個課餘項目。

不要惹怒程序員

「二哈」研發初衷,實在是對日益普遍的騷擾電話很生氣。

聶再清說,自己一直都是同一個電話號,於是泄露越來越嚴重,經常收到騷擾電話。

還影響到團隊工作,會議進行中,同事們經常被各類電話打斷導致會議終中斷,於是開始思考著如何用技術的方式解決。

而且更可氣的是,大量騷擾電話是機器自動撥出的,成本越來越低。

此外也算天時地利人和。

在阿里AI實驗室,聶再清團隊負責天貓精靈的演算法,所以所有相關人才團隊里都有:語音識別、NLP、知識圖譜……全鏈條覆蓋。

並且跟語音助手一致,智能對話的基礎演算法也都通用。

於是他們先以「課餘」項目開始,興趣驅動,參與的工程師都很開心,一方面是解氣,另一方面也是知道背後帶來的意義。

其後一切也進展飛快,最終到2018年下半年,開始向公司申報,並立項啟動。

沒想到在今年3.15晚會上,機器人騷擾電話引起如此大關注。

於是團隊決定公開最新研發成果,「二哈」也正式從幕後走到台前。

一炮而紅。

AI電話秘書

但「二哈」就只是幫對付騷擾電話而已嘛?

不。

聶再清說,「二哈」的進一步的目標是成為每個人的AI電話秘書,除了幫主人應付騷擾電話,還可以在主人繁忙的時候詢問來電的主要意圖,也能幫主人預約議程。

而且相比之前人類的電話、議程為工作核心的秘書助理,「二哈」這樣的AI電話秘書,可以利用個性化TTS,模仿出跟主人聲音極盡逼真的聲音。

另外,這樣的目標也並不是遙不可及的「憧憬」。

至少現在,利用「二哈」實現AI呼叫轉移,已經不再是技術難題。

AI可以在你不方便接電話時幫接聽來電,並轉換成文字向你「彙報」。

最後,論文傳送門:

CoChat: Enabling Bot and Human Collaboration for Task Completion

https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16748/16081

Learning-to-Ask: Knowledge Acquisition via 20 Questions

https://arxiv.org/abs/1806.08554


謝邀。偽需求,薛定諤的騷擾電話…… 假如知道是騷擾電話我為什麼還要去接聽?

相比之下,下圖這個某大廠的騷擾攔截要更實用,而且這個項目上線很久了,有著強大的資料庫,能攔截大多數的騷擾電話。(為避免廣告嫌疑,不知道是哪一款的朋友可以pm我)

題外話:利益相關,去年應公司運營部的需求接入過這種智能撥號的服務。技術難度其實很小,事先錄好了話術模板,把黑產搞來的手機號碼庫導入,開始批量撥號,最後再根據反饋給這些被「被騷擾者」歸類,從而篩出來目標用戶,再做進一步誘導。

這就跟騙子去海發簡訊一樣,成功率是很低,但是有效的篩出來了目標群體。

所以,大家只需要一個公共的騷擾來電資料庫,識別之後果斷攔截、掛斷,而不是一個跟騷擾電話聊天的AI機器人。


京東的AI客服了解一下,在購物中你想問啥都是反覆那幾句話,最多給你幾個固定的選項,點擊後可以了解已經編輯好的模式。

最本質的還是,建立騷擾來電資料庫,識別之後果斷攔截、掛斷,誤傷也是因為這個電話之前的信用低,不值得接聽。

但是如果這些電話營銷從業者經常換電話就不好辦了,畢竟現在辦理電話號碼太容易。


明知道是騷擾電話,最正常的處理方式是拒接或掛機,還需要開發個AI去陪聊嗎?這是得閑的多蛋疼?典型的炫技多過實用。

怎麼精準識別騷擾電話才是需要的,至於是自動拒接還是手動拒接,讓用戶自己去設置吧。


推薦閱讀:
相关文章