基於問句相似性找到合適的問答對

本文從最簡單的QA系統入手來逐步深入。最簡單的QA系統原理，就是假定蒐集了一批問答對（暫且認為這裡所有的答案都是正確的）。那麼，當一個新問題輸入系統之後，系統拿這個問題，和所有庫存的問題比較，找到一個最接近的問答對，把答案返回來。

怎麼找？

第一步是建立詞向量矩陣，Word2Vec演算法目前在Spark ML，Ski-learn，以及Tensorflow教程裏到處都有。我打算先把程序調試出來，因此先用Tensorflow上提供的源代碼來做。語料庫呢，先用那個著名的保險問答語料庫(Samurais/insuranceqa-corpus-zh)。從這個語料庫中可以抽出14萬個句子，22000個單詞，100維的embedding向量。最後只需要把訓練出來的embedding矩陣保存到numpy存檔文件中即可，這個存檔文件有8M多。

對這個embedding做點可視化（用TSNE把100維向量壓縮成2維向量，然後畫到坐標繫上）：

基於問句相似性找到合適的問答對

熱門新聞

週熱門

基於問句相似性找到合適的問答對

Facebook收購以色列聊天機器新創 傳納入子公司Calibra旗下

Google工程師帶你看遍聊天機器人的前世今生

AI說 | 你接觸的各種機器人，他們是怎麼和你聊上天的？

Chatbot中的填槽(Slot Filling)

連載 | 3.2 確定場景邊界

閱讀的一些chatbot論文（2）

FANSbee聊天購物機器人【LINE@升級體驗會】AI人工智慧更上一層樓~!!!超威!

【科技新知】FANSbee聊天購物機器人 - LINE@升級體驗會

手搖飲控快加！LINE好友《喝飲料大師》懶人必備 「隨機功能」實用度100

chatbot行銷-為你的FB粉專設定FB臉書聊天機器人

如何透過 FOOD AI 找到美食

給chatbot融入人格特徵--論文閱讀

你們公司的LINE@和微信公眾號等社羣軟體有專人管理嗎？

互動資通team+改版 企業通訊軟體將支援LINE@、微信公眾號

專家傳真－臺灣服務業智慧化發展 趨勢

熱門新聞

週熱門

Facebook收購以色列聊天機器新創傳納入子公司Calibra旗下

手搖飲控快加！LINE好友《喝飲料大師》懶人必備　「隨機功能」實用度100

互動資通team+改版　企業通訊軟體將支援LINE@、微信公眾號

專家傳真－臺灣服務業智慧化發展趨勢