論文題目:《Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification》
論文來源鏈接:原文鏈接
Abstract
基於真實Web數據的機器閱讀理解(MRC)要求機器通過對搜索到的多個段落進行分析以後,回答問題。與基於當個段落的MRC相比,多個段落的MRC更具有挑戰性,因為我們可能會從不同的段落中獲得多個令人困惑的答案候選者。為瞭解決這個問題,我們提出一個end-to-end神經模型,該模型使得來自不同段落的答案候選者能夠根據他們的內容表示來互相驗證。具體來說,我們聯合訓練三個模塊,這三個模塊可以基於三個因素預測最終答案:答案邊界、答案內容和跨段落答案驗證。實驗結果證明我們的模型相比於baseline有大幅度的提高,而且在英文的MS-MARCO數據集和中文DuReader數據集上都獲得了最優性能。
1 Introduction
這種多段落的MRC存在一個固有的挑戰,就是所有段落都與問題有關,但是通常都是分開寫的,因此很可能存在多個令人困惑的答案候選者(正確or不正確)。
為瞭解決這個問題,我們假設正確的答案可能會更頻繁的出現在其他段落,並且會有一些共性,但是錯誤的答案通常與其餘答案不同。人類可以通過對比候選答案的來源,推理出正確的答案,所以我們也希望MRC模型也可以從跨段落答案驗證過程中受益。
我們的模型如圖所示,主要由三個模塊組成。第一,我們根據基於邊界的MRC模型找到每個段落的候選答案的起始位置。第二,我們模擬從這些段落中提取的答案候選者的含義,並使用content score從另一個角度來衡量候選答案的質量。第三,我們通過讓每個候選答案根據其餘候選者的表示參加其他候選者來構建答案驗證。
這三個模塊採用不同的模塊來建模,但是可以在我們的end-to-end模型中進行聯合訓練。