来谈谈那些很棒的检索式Chatbots论文（一）

写在开头

已经关注Retrieval-Based Chatbots一段时间了，期间也看了不少这方面的论文，以及在这些论文里面又发现了一些很不错的论文。这段时间一直在做相关的实验，现在实验效果也出来了，准备将自己的成果写成一篇论文，并且总结下这段时间看过的论文。

目前计划先讲SMN、DAM、IMN和MRFN这四篇论文，其中SMN和DAM的作者已经将代码放出，都是提供Tensorflow版本，为了方便实验，我自己将两份代码用Pytorch改写了，SMN的代码我放到了自己的github上，不过感觉自己放上去的版本还需要修改下，后续将会做下补充再重新上传代码~（感觉给自己挖了挺多坑的，希望自己有毅力将每个坑填好）

第二篇讲DAM的文章出来了，有兴趣想了解DAM模型的可以看下：

LeonMao：来谈谈那些很棒的检索式Chatbots论文（二）?

zhuanlan.zhihu.com

SMN（Sequential Matching Network）

讲回正题，Retrieval-Based Chatbots即检索式的聊天机器人，在人机的多轮对话中（多轮的QA）从多个候选回复中选出最优的回复，这便是我们的目标。这次讲的论文是SMN，其论文全名为Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots

这篇论文是吴俣大佬的，这个结构影响了后续相关的论文，不少论文都采用了这种结构，首先放出论文地址及其源码：

https://arxiv.org/pdf/1612.01627v2.pdf?

arxiv.org

MarkWuNLP/MultiTurnResponseSelection?

github.com

Introduction

在这论文之前，有关Retrieval-Based Chatbots的做法是将context里所有的utterances都连接在一起，将这个长长的context做处理然后和response作匹配。而正如论文的名称，该论文提出了一个新的框架，不再将utterances拼接起来，而是每个utterance都和response做匹配，然后再用RNN去构建utterance间的关系，最后的匹配分数通过RNN的隐藏层计算得出。除了提出这个新的框架外，作者还在论文里提出了一个新的数据集，这个数据集（豆瓣对话语料库）也被后续相关的论文所使用。

关于多轮对话的例子，通过图一可以很直观的看出：