黑棋贴目这种规则的出现是为了抵消黑棋先行优势。但贴多少目才算公平一直都是有争议的,且一直在变。

alphago的出现,能否计算出到底贴多少目才算是真正公平?就是alphago以同样的棋力自己与自己对弈,通过大数据算出黑棋到底有多大优势,贴多少目才能使执黑与执白真正的公平。从而完善贴目规则。


AlphaGo自身做不到。因为阿尔法的神经网路全部是基于7.5目的贴目训练的,贴目数哪怕改一目就要全部推倒重来。这种情况下,落后的一方必然不会甘心于输一两目,而是会拚命,从而所谓的「最佳结果」也就无从达成。


从今天柯洁和阿法狗的第二局赛后采访,阿法狗在一开始就认为白棋胜率55%,我觉得以此决定贴目规则是完全可行的。
同意天云海的意见,我觉得AlphaGo有可能改变目前贴目规则。不过这是有前提条件的,一个是AlphaGo能够能够证明在目前的贴目规则下,黑白胜率不均等;另一个是现有的棋手能够接受这个结果,毕竟贴目规则是现有棋手来遵守执行的。
同意上面刘小羊老师的看法,不能,因为阿法狗并没有破解这项游戏,没法穷举出所有变化,从第一步开始给出一个最优解。
虽然觉得刘小羊说得有一定道理,但我认为不是完全不可能。贴目是为了保证执黑和执白保持公平,保证两个实力相当的对手执黑执白胜率均等。alphago在与自己对弈的过程中可以统计出黑白胜率,如果不均等,可能会影响贴目数的改变。当然人类会不会以alphago的数据作为参考那就不好说了。


学习围棋要多久?


刚刚过去的Master事件可以佐证,AlphaGo的学习能力是不能限量的。主创明确表示,二代AlphaGo没有学习棋谱。而且他在韩国和日本的网站上下棋全部都是全胜,至少说明了这两种现行贴目制度下,棋力是过关的。那么在这个假设下,至少AlphaGo可以作为很好的样本自我对弈验证出(比如100万盘,想想都可怕)6目半和7目半下的黑白胜率,从而逼近「合理」的贴目。而且由于AlphaGo自身对弈带来的系统误差减少,这种胜率计算要远胜以前所谓「大数据」下进行的笼统测算。因为人类棋手的对弈,不可能真正做到棋力相同,而且还有各种情绪/环境因素的干扰。
推荐阅读:
相关文章