台湾 || 语言: 大陆简体港澳繁體台灣正體

《面向任務型對話中基於對話狀態表示的序列到序列學習》閱讀筆記

雪花臺灣 2019-03-13 23:04

作者：Haoyang Wen, Yijia Liu, Wanxiang Che*, Libo Qin, Ting Liu

來源：COLING 2018

原文鏈接：http://aclweb.org/anthology/C18-1320

轉載請註明出處：學習ML的皮皮蝦

Introduction

面向任務型對話中，傳統流水線模型要求對對話狀態進行顯式建模。這需要人工定義對領域相關的知識庫進行檢索的動作空間。相反地，序列到序列模型可以直接學習從對話歷史到當前輪迴復的一個映射，但其沒有顯式地進行知識庫的檢索。在本文中，我們提出了一個結合傳統流水線與序列到序列二者優點的模型。我們的模型將對話歷史建模為一組固定大小的分散式表示。基於這組表示，我們利用注意力機制對知識庫進行檢索。在斯坦福多輪多領域對話數據集上的實驗證明，我們的模型在自動評價與人工評價上優於其他基於序列到序列的模型。

本文著眼於Seq2Seq模型，通過嘗試解決《A Copy-Augmented Sequence-to Sequence Architecture Gives Good Performance on Task-Oriented Dialogue》（Eric and Manning, 2017）中對話狀態表示和對外部數據檢索的問題來提升對話模型的性能。本文將對話歷史表示為一組分散式表示（《Efficient attention using a fixed-size memory representation》2017）來對對話狀態進行表示，然後通過計算這組表示與外部知識庫中每一個條目的相似度完成對條目的檢索，解碼時通過生成屬性標籤來完成對需要生成的屬性進行檢索。

Model

模型對比結果

（x_{1},x_{2},...,x_{n}^{IN}） — 模型對比結果

相關文章