黑棋貼目這種規則的出現是為了抵消黑棋先行優勢。但貼多少目纔算公平一直都是有爭議的,且一直在變。

alphago的出現,能否計算出到底貼多少目纔算是真正公平?就是alphago以同樣的棋力自己與自己對弈,通過大數據算出黑棋到底有多大優勢,貼多少目才能使執黑與執白真正的公平。從而完善貼目規則。


AlphaGo自身做不到。因為阿爾法的神經網路全部是基於7.5目的貼目訓練的,貼目數哪怕改一目就要全部推倒重來。這種情況下,落後的一方必然不會甘心於輸一兩目,而是會拚命,從而所謂的「最佳結果」也就無從達成。


從今天柯潔和阿法狗的第二局賽後採訪,阿法狗在一開始就認為白棋勝率55%,我覺得以此決定貼目規則是完全可行的。
同意天雲海的意見,我覺得AlphaGo有可能改變目前貼目規則。不過這是有前提條件的,一個是AlphaGo能夠能夠證明在目前的貼目規則下,黑白勝率不均等;另一個是現有的棋手能夠接受這個結果,畢竟貼目規則是現有棋手來遵守執行的。
同意上面劉小羊老師的看法,不能,因為阿法狗並沒有破解這項遊戲,沒法窮舉出所有變化,從第一步開始給出一個最優解。
雖然覺得劉小羊說得有一定道理,但我認為不是完全不可能。貼目是為了保證執黑和執白保持公平,保證兩個實力相當的對手執黑執白勝率均等。alphago在與自己對弈的過程中可以統計出黑白勝率,如果不均等,可能會影響貼目數的改變。當然人類會不會以alphago的數據作為參考那就不好說了。


學習圍棋要多久?


剛剛過去的Master事件可以佐證,AlphaGo的學習能力是不能限量的。主創明確表示,二代AlphaGo沒有學習棋譜。而且他在韓國和日本的網站上下棋全部都是全勝,至少說明瞭這兩種現行貼目制度下,棋力是過關的。那麼在這個假設下,至少AlphaGo可以作為很好的樣本自我對弈驗證出(比如100萬盤,想想都可怕)6目半和7目半下的黑白勝率,從而逼近「合理」的貼目。而且由於AlphaGo自身對弈帶來的系統誤差減少,這種勝率計算要遠勝以前所謂「大數據」下進行的籠統測算。因為人類棋手的對弈,不可能真正做到棋力相同,而且還有各種情緒/環境因素的幹擾。
推薦閱讀:
相關文章