來談談那些很棒的檢索式Chatbots論文（一）

寫在開頭

已經關注Retrieval-Based Chatbots一段時間了，期間也看了不少這方面的論文，以及在這些論文裡面又發現了一些很不錯的論文。這段時間一直在做相關的實驗，現在實驗效果也出來了，準備將自己的成果寫成一篇論文，並且總結下這段時間看過的論文。

目前計劃先講SMN、DAM、IMN和MRFN這四篇論文，其中SMN和DAM的作者已經將代碼放出，都是提供Tensorflow版本，為了方便實驗，我自己將兩份代碼用Pytorch改寫了，SMN的代碼我放到了自己的github上，不過感覺自己放上去的版本還需要修改下，後續將會做下補充再重新上傳代碼~（感覺給自己挖了挺多坑的，希望自己有毅力將每個坑填好）

第二篇講DAM的文章出來了，有興趣想了解DAM模型的可以看下：

LeonMao：來談談那些很棒的檢索式Chatbots論文（二）?

zhuanlan.zhihu.com

SMN（Sequential Matching Network）

講回正題，Retrieval-Based Chatbots即檢索式的聊天機器人，在人機的多輪對話中（多輪的QA）從多個候選回復中選出最優的回復，這便是我們的目標。這次講的論文是SMN，其論文全名為Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots

這篇論文是吳俁大佬的，這個結構影響了後續相關的論文，不少論文都採用了這種結構，首先放出論文地址及其源碼：

https://arxiv.org/pdf/1612.01627v2.pdf?

arxiv.org

MarkWuNLP/MultiTurnResponseSelection?

github.com

Introduction

在這論文之前，有關Retrieval-Based Chatbots的做法是將context里所有的utterances都連接在一起，將這個長長的context做處理然後和response作匹配。而正如論文的名稱，該論文提出了一個新的框架，不再將utterances拼接起來，而是每個utterance都和response做匹配，然後再用RNN去構建utterance間的關係，最後的匹配分數通過RNN的隱藏層計算得出。除了提出這個新的框架外，作者還在論文里提出了一個新的數據集，這個數據集（豆瓣對話語料庫）也被後續相關的論文所使用。

關於多輪對話的例子，通過圖一可以很直觀的看出：