數學家發現了一個他們無法解決的問題。並不是說他們不夠聰明; 根本就沒有答案。

問題與機器學習有關 - 一些計算機用來“學習”如何完成特定任務的人工智能模型

當Facebook或Google識別出您的照片並建議您標記自己時,它會使用機器學習。當一輛自動駕駛汽車在一個繁忙的十字路口航行時,那就是機器學習的動作。神經科學家使用機器學習來“閱讀”某人的想法。關於機器學習的事情是它基於數學。因此,數學家可以在理論層面上對其進行研究和理解。他們可以編寫關於機器學習如何工作的證明,並且在每種情況下都適用它們。

數學家發現了一個無人能解決的計算機問題

奧地利出生的數學家Kurt Godel在高等研究院。圖片來源:Alfred Eisenstaedt

基於樣本的機器學習

在這種情況下,一組數學家設計了一個稱爲“估計最大值”或“EMX”的機器學習問題。

要了解EMX的工作原理,請想象一下:您希望在網站上投放廣告,並最大限度地提高這些廣告定位的觀衆數量。你有廣告向體育迷,貓愛好者,汽車狂熱分子和運動愛好者等投球。但你事先並不知道誰將訪問該網站。如何選擇能夠最大化目標受衆數量的廣告?EMX必須通過訪問網站的少量數據來找出答案。

研究人員隨後問了一個問題:EMX什麼時候可以解決問題?

在其他機器學習問題中,數學家通常可以說基於他們擁有的數據集是否可以在給定的情況下解決學習問題。谷歌用來識別你的面孔的基礎方法是否可以應用於預測股市趨勢?我不知道,但有人可能。

麻煩的是,數學有點破碎。它自1931年以來一直被打破,當時邏輯學家庫爾特·哥德爾發表了他着名的不完備性定理。他們表明,在任何數學系統中,都存在一些無法回答的問題。他們並不是很難 - 他們是不可知的。數學家們瞭解到他們理解宇宙的能力從根本上受到限制。哥德爾和另一位名叫保羅科恩的數學家找到了一個例子:the continuum hypothesis(連續統假說)。

連續統假設是這樣的:數學家已經知道有不同大小的無窮大。例如,有無限多個整數(數字如1,2,3,4,5等); 並且有無限多的實數(包括1,2,3等數字,但它們也包括1.8和5,222.7以及pi等數字)。但即使有無限多個整數和無數多個實數,顯然有更多的實數而不是整數。提出這個問題,是否有任何無窮大於整數集但是小於實數集?連續統假說,是的,有。

哥德爾和科恩表明,不可能證明連續統假設是正確的,但也不可能證明這是錯誤的。“連續統假設是否正確?” 是一個沒有答案的問題。

在1月7日星期一發表在Nature Machine Intelligence雜誌上的一篇論文中,研究人員表明EMX與連續統假設有着千絲萬縷的聯繫。

只有the continuum hypothesis爲真 機器學習的EMX才能解決問題

事實證明,只有連續統假設爲真,EMX才能解決問題。但如果事實並非如此,那麼EMX就不能......那意味着“EMX能學會解決這個問題嗎?”這個問題的答案與連續統假設本身一樣難以理解。

好消息是連續統假設的解決方案對大多數數學都不是很重要。同樣,這種永久的謎團可能不會成爲機器學習的主要障礙。

“因爲EMX是機器學習的一個新模型,我們還不知道它對開發真實算法的有用性,”伊利諾伊大學芝加哥分校數學教授Lev Reyzin 寫道,他沒有寫論文,在隨附的Nature News&Views文章中。“所以這些結果可能不具備實際意義,”Reyzin寫道。

Reyzin寫道,這證明機器學習已經“成熟爲一門數學學科”。

Reyzin寫道,機器學習“現在加入了許多數學子領域,這些子領域處理無法提供的負擔以及隨之而來的不安。” 也許這樣的結果將爲機器學習領域帶來健康的謙遜,即使機器學習算法繼續徹底改變我們周圍的世界。“

相关文章