论文题目:《Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification》
论文来源链接:原文链接
Abstract
基于真实Web数据的机器阅读理解(MRC)要求机器通过对搜索到的多个段落进行分析以后,回答问题。与基于当个段落的MRC相比,多个段落的MRC更具有挑战性,因为我们可能会从不同的段落中获得多个令人困惑的答案候选者。为了解决这个问题,我们提出一个end-to-end神经模型,该模型使得来自不同段落的答案候选者能够根据他们的内容表示来互相验证。具体来说,我们联合训练三个模块,这三个模块可以基于三个因素预测最终答案:答案边界、答案内容和跨段落答案验证。实验结果证明我们的模型相比于baseline有大幅度的提高,而且在英文的MS-MARCO数据集和中文DuReader数据集上都获得了最优性能。
1 Introduction
这种多段落的MRC存在一个固有的挑战,就是所有段落都与问题有关,但是通常都是分开写的,因此很可能存在多个令人困惑的答案候选者(正确or不正确)。
为了解决这个问题,我们假设正确的答案可能会更频繁的出现在其他段落,并且会有一些共性,但是错误的答案通常与其余答案不同。人类可以通过对比候选答案的来源,推理出正确的答案,所以我们也希望MRC模型也可以从跨段落答案验证过程中受益。
我们的模型如图所示,主要由三个模块组成。第一,我们根据基于边界的MRC模型找到每个段落的候选答案的起始位置。第二,我们模拟从这些段落中提取的答案候选者的含义,并使用content score从另一个角度来衡量候选答案的质量。第三,我们通过让每个候选答案根据其余候选者的表示参加其他候选者来构建答案验证。
这三个模块采用不同的模块来建模,但是可以在我们的end-to-end模型中进行联合训练。