論文分享|無監督詩詞風格生成

對於同一個意象，不同風格的詩人可以寫出不同風格的詩句。大多數自動作詩的研究集中在提高詩句前後的一致性上，對於風格化的作詩，一些研究通過風格轉換來實現，但是這類方法嚴重依賴於標註數據。本文通過引入互信息作為正則約束，提出了基於無監督的方法實現詩詞風格化輸出。

Introduction

利用計算機來作詩是很有意思，也具有挑戰性的任務。近年來，對自動作詩的研究也越來越多，方法從最初基於規則和模板的方法發展到基於神經網路序列到序列（Seq2Seq）的方法，但這些方法大多都在關注生成詩詞的質量上，比如連貫性，一致性等。但是古詩中還有另外一個問題，就是對於同一個意象，不同風格的詩人會寫出截然不同的詩句，這就要求對於同一個輸入，模型需要輸出不同的結果，如Fig1所示。

基於Seq2Seq的方法在機器翻譯中也廣泛應用，但是兩者的目的存在很大不同，對於翻譯任務來說，它的一一對應關係較強，比如「蘋果」這個詞在英文翻譯中必定會有「apple」與之對應，對於詩句則不然。本文提出了一種對於同一輸入可以產生多個輸出的生成模型，同時保證不同的輸出之間有較大的區分性。另一方面，因為語料庫中對於詩歌風格暫時沒有專家標註，本文的模型利用互信息作為約束正則項，可以實現完全無監督的風格生成。人工評測結果表明，這個模型生成的各種風格都是可識別的，並且其他指標也優於基線模型。

由於知乎排版不能嵌入圖片，文章有很多公式，所以點擊鏈接閱讀全文，感興趣可以關注我們的微信公眾號。

論文分享|無監督詩詞風格生成?

mp.weixin.qq.com