本文是弱監督下的自然語言理解。本文分為三個部分:
第一部分:背景知識
主要是自然語言理解,弱監督學習,語義計算(解釋:自然語言理解語義計算本質是計算過程,計算過程是人的語言翻譯成機器語言的過程, 語義是機器的語言描述的計算步驟),搜索應用,然後介紹兩個比較常見的語義解析的任務應該,分別是webquestionssp,wikitablequestions。
第二部分:neural symbolic machines神經符號機
這部分內容包括如何用短時記憶組合語義來表達你想表達的意思;以及怎麼結合符號計算來實現大規模的語義分析的計算。
第三部分:memory augmented policy optimization
基於長時記憶的加強學習,加強學習有很多弱點,一個最大的弱點,就是它不能很好的利用長時記憶提高訓練效率,所以本文從數學的角度來解釋如何有效的利用長時記憶進行訓練。然後比較了加強學習(Reinforcement Learning),ml( Maximum likelihood learning),mml(Maximum Marginal Likelihood)三個學習目標函數的最大的差別。
業界如何看待自然語言理解
自然語言理解的問題非常有前景和有用,在沒有解釋理解之前,我們先看業界大牛如何看待自然語言理解的未來。這裡要提到Michael Jordan和geoffrey hinton,他們是研究機器學習的,但代表機器學習的兩個不同方向。(Jordan曾經想申請Hinton的博士生,被拒了,理由:論文太少。Jordan被拒了之後,從神經網路轉向了概率統計(概率圖))。Michael Jordan研究圖模型(Graphical Model)的大牛,geoffrey hinton是研究深度學習的祖師爺。看下圖就知道他有多牛了: