数学家发现了一个他们无法解决的问题。并不是说他们不够聪明; 根本就没有答案。

问题与机器学习有关 - 一些计算机用来“学习”如何完成特定任务的人工智能模型

当Facebook或Google识别出您的照片并建议您标记自己时,它会使用机器学习。当一辆自动驾驶汽车在一个繁忙的十字路口航行时,那就是机器学习的动作。神经科学家使用机器学习来“阅读”某人的想法。关于机器学习的事情是它基于数学。因此,数学家可以在理论层面上对其进行研究和理解。他们可以编写关于机器学习如何工作的证明,并且在每种情况下都适用它们。

数学家发现了一个无人能解决的计算机问题

奥地利出生的数学家Kurt Godel在高等研究院。图片来源:Alfred Eisenstaedt

基于样本的机器学习

在这种情况下,一组数学家设计了一个称为“估计最大值”或“EMX”的机器学习问题。

要了解EMX的工作原理,请想象一下:您希望在网站上投放广告,并最大限度地提高这些广告定位的观众数量。你有广告向体育迷,猫爱好者,汽车狂热分子和运动爱好者等投球。但你事先并不知道谁将访问该网站。如何选择能够最大化目标受众数量的广告?EMX必须通过访问网站的少量数据来找出答案。

研究人员随后问了一个问题:EMX什么时候可以解决问题?

在其他机器学习问题中,数学家通常可以说基于他们拥有的数据集是否可以在给定的情况下解决学习问题。谷歌用来识别你的面孔的基础方法是否可以应用于预测股市趋势?我不知道,但有人可能。

麻烦的是,数学有点破碎。它自1931年以来一直被打破,当时逻辑学家库尔特·哥德尔发表了他着名的不完备性定理。他们表明,在任何数学系统中,都存在一些无法回答的问题。他们并不是很难 - 他们是不可知的。数学家们了解到他们理解宇宙的能力从根本上受到限制。哥德尔和另一位名叫保罗科恩的数学家找到了一个例子:the continuum hypothesis(连续统假说)。

连续统假设是这样的:数学家已经知道有不同大小的无穷大。例如,有无限多个整数(数字如1,2,3,4,5等); 并且有无限多的实数(包括1,2,3等数字,但它们也包括1.8和5,222.7以及pi等数字)。但即使有无限多个整数和无数多个实数,显然有更多的实数而不是整数。提出这个问题,是否有任何无穷大于整数集但是小于实数集?连续统假说,是的,有。

哥德尔和科恩表明,不可能证明连续统假设是正确的,但也不可能证明这是错误的。“连续统假设是否正确?” 是一个没有答案的问题。

在1月7日星期一发表在Nature Machine Intelligence杂志上的一篇论文中,研究人员表明EMX与连续统假设有着千丝万缕的联系。

只有the continuum hypothesis为真 机器学习的EMX才能解决问题

事实证明,只有连续统假设为真,EMX才能解决问题。但如果事实并非如此,那么EMX就不能......那意味着“EMX能学会解决这个问题吗?”这个问题的答案与连续统假设本身一样难以理解。

好消息是连续统假设的解决方案对大多数数学都不是很重要。同样,这种永久的谜团可能不会成为机器学习的主要障碍。

“因为EMX是机器学习的一个新模型,我们还不知道它对开发真实算法的有用性,”伊利诺伊大学芝加哥分校数学教授Lev Reyzin 写道,他没有写论文,在随附的Nature News&Views文章中。“所以这些结果可能不具备实际意义,”Reyzin写道。

Reyzin写道,这证明机器学习已经“成熟为一门数学学科”。

Reyzin写道,机器学习“现在加入了许多数学子领域,这些子领域处理无法提供的负担以及随之而来的不安。” 也许这样的结果将为机器学习领域带来健康的谦逊,即使机器学习算法继续彻底改变我们周围的世界。“

相关文章