爲什麼紙牌遊戲Hanabi是人工智能的下一個挑戰？

　　大數據文摘出品

　　編譯：李雷

　　人工智能（AI）已經稱霸了不少世界上最複雜的遊戲，擊敗了國際象棋、圍棋、甚至是星際爭霸II等即時戰略電腦遊戲中的頂級玩家，但其軟肋卻是一些看似簡單的遊戲，一些需要具備溝通和合作能力的遊戲。

　　這一情況可能即將發生改變。

　　谷歌母公司Alphabet的谷歌大腦項目和DeepMind的研究人員開發了曾在圍棋和星際爭霸II中擊敗人類的AI程序，現在他們將目光投向了一款新遊戲：Hanabi（花火），一種玩家互相合作的紙牌遊戲。這款遊戲根據玩家在比賽中的溝通情況來確定每個人是贏還是輸。

　　參與該項目的研究人員認爲，弄清楚怎樣玩好Hanabi，這對於人工智能來說可能是一個重大進步，並且有助於其在聊天和自動駕駛等應用場景中與人類進行更加流暢的互動。

　　“在日常生活中，人們一般不會相互競爭，而更多的是進行溝通和合作，”牛津大學研究員Jakob Foerster說，他在2月份合作發表了一篇相關論文。他還說，“Hanabi是一個關於溝通和合作的遊戲，人工智能目前還沒有深入這一遊戲領域”。

　　遊戲提示

　　Hanabi遊戲發明於2010年，由二到五個玩家參與，玩家需以正確的順序一起打出五種不同顏色的牌。遊戲特點：所有玩家都可以看到對方的牌，但卻看不到自己的牌。

　　根據遊戲規則，玩家可以互相提示自己手裏的牌（但僅限於牌的顏色或數字），讓其他玩家可以推斷他們應該出什麼牌，但提示的次數是有限制的。

　　正是這種高效溝通的行爲使Hanabi具備了一種科學魅力。例如，人類可以很自然地理解其他玩家的提示，哪張卡片是可出的，但是機器本質上無法理解這些提示。

　　Nolan Bard是DeepMind項目的研究員，也是上面提到的論文的合作作者。他認爲，“這些合作式的遊戲各不相同且難度很大，因爲爲了玩好遊戲，你需要與所有玩家進行協作，共同就某種遊戲方式達成一致。

　　到目前爲止人工智能程序已經可以在玩Hanabi花火遊戲時贏得很高分數，但只限於與其他類似的智能機器人一起玩。在不熟悉其他玩家的遊戲風格或者有 “臨時”（從未一起玩過的）玩家的情況下，對程序的挑戰最大，也更接近真實情況。

　　假設和推論

　　根據研究人員的說法，人類在不斷構建一種關於他人的“心理認知”，即假設其他人像我們一樣思考和行動，並以此爲基礎預測其行爲。例如，當有人站在街角時，路過的司機會認爲她正在考慮過馬路。

　　研究人員認爲，在人工智能中植入這樣的認知能力可以改善自動駕駛車輛在遇到新情況時的行爲方式，使其能夠明白人們的行爲背後意味着他們可能想做什麼。例如，智能機器人可以學習並理解對話中的語境，以便推斷說話者的想法。

　　爲了闡明人工智能目前還缺乏這種能力，Bard博士使用一臺已經訓練好的計算機來玩石頭剪刀布遊戲。計算機出石頭、剪子和布的次數將相同，並預計有一半的機會會贏。

　　但是如果其人類對手每次都出同樣的手勢，那麼標準的算法就無法理解人類對手的想法，並據此轉變其策略。Bard說，計算機要在玩了10回後纔會意識到人類總是出石頭而它應該出布。

　　在其他遊戲方面，人工智能程序在橋牌遊戲中已經取得了進展，但還不是玩得很好，部分原因在於人工智能還需要溝通技能。許多紙牌類遊戲都存在類似的問題，機器很難分辨玩家行爲背後所隱含的信息。

　　位於舊金山的OpenAI是由諸多硅谷大亨聯合建立的人工智能非營利組織，其工程師Jeff Wu開發了一種智能機器人，用一種稱爲“猜帽子”的策略來玩Hanabi。這種策略以複雜的方式向其他玩家給出提示，告訴這些玩家哪些牌可以打。

　　注：“猜帽子”這個名字取自一個流行的邏輯訓練，即一羣人試圖猜測他們每個人頭頂帽子的顏色。

　　儘管Wu的機器人在玩Hanabi時分數很高，但他認爲要使Hanabi機器人擁有可以和未知對手合作的認知能力仍然是一個巨大的挑戰。

　　“在玩猜帽子時，機器人沒有認知能力，它們心中只有自我以及其副本的概念，如果你只是自己跟自己玩，這是可以的，”Wu說。“但如果你試圖開發一個真正具有心理認知能力的機器人，並且它可以明白其他人在思考和做什麼，那將是個大挑戰。”

　　DeepMind的Hanabi研究小組創建了一個開源平臺，人們可以在其上測試相關的人工智能程序和算法，但小組成員並不期待很快能找到解決方案。Foerster博士說，如果只花了五年的時間就可以使人工智能具備能力和未知玩家進行遊戲，他覺得不靠譜。

　　儘管如此，紐約大學副教授Julian Togelius表示，像Hanabi這樣的遊戲是創新的沃土。“隨着其不斷髮展，遊戲設計已經成爲人類智力能力發展的持續反映，”他說。“如果存在某種形式的人工智能場景，那麼就會有人適時地設計出一種能夠運用這種場景的遊戲。”

　　相關報道：

　　https://www.wsj.com/articles/why-the-card-game-hanabi-is-the-next-big-hurdle-for-artificial-intelligence-11553875351

　　志願者介紹

　　點「在看」的人都變好看了哦

爲什麼紙牌遊戲Hanabi是人工智能的下一個挑戰？

热门新闻

周热门

爲什麼紙牌遊戲Hanabi是人工智能的下一個挑戰？

【BZ2019】《星海爭霸 2》開放 Google Deepmind人工智慧「Alphastar」與玩家對戰

Google DeepMind實驗結果出爐！「AlphaStar」成功打進《星海爭霸 2》宗師牌位

非法使用醫療健康數據引爭議 DeepMind聯合創辦人「被放假」

DeepMind打造最強表示學習模型BigBiGAN，Goodfellow點贊！

AlphaStar準備出擊！DeepMind《星海爭霸 2》AI將前往歐服天梯挑戰玩家

DeepMind最新研究解決災難性遺忘難題

Tesla超越Waymo，成為自動駕駛汽車領導者

開發阿爾法狗的團隊再下一城，這次重磅推出了 AlphaFold —— 基因序列預測蛋白質結構

昨夜，中國輸了足球，人類輸了星際爭霸

DeepMind新計劃：訓練AI玩一款比下棋更難的牌類遊戲

大神幫我看看，這個泰牌是真的嘛？

紙牌有什麼好玩的？

《魔法風雲會》新系列「塞洛斯：冥途求生」正式上市 電玩展大戰祭&新手體驗日二月登場

《魔法風雲會》暑假強打「2020核心系列」7/12全球發售 本週末新手體驗日搶先登場

花切新人第一步先練哪個招式？

热门新闻

周热门

非法使用醫療健康數據引爭議　DeepMind聯合創辦人「被放假」

《魔法風雲會》新系列「塞洛斯：冥途求生」正式上市電玩展大戰祭&新手體驗日二月登場

《魔法風雲會》暑假強打「2020核心系列」7/12全球發售本週末新手體驗日搶先登場