對於同一個意象,不同風格的詩人可以寫出不同風格的詩句。大多數自動作詩的研究集中在提高詩句前後的一致性上,對於風格化的作詩,一些研究通過風格轉換來實現,但是這類方法嚴重依賴於標註數據。本文通過引入互信息作為正則約束,提出了基於無監督的方法實現詩詞風格化輸出。

Introduction

利用計算機來作詩是很有意思,也具有挑戰性的任務。近年來,對自動作詩的研究也越來越多,方法從最初基於規則和模板的方法發展到基於神經網路序列到序列(Seq2Seq)的方法,但這些方法大多都在關注生成詩詞的質量上,比如連貫性,一致性等。但是古詩中還有另外一個問題,就是對於同一個意象,不同風格的詩人會寫出截然不同的詩句,這就要求對於同一個輸入,模型需要輸出不同的結果,如Fig1所示。

基於Seq2Seq的方法在機器翻譯中也廣泛應用,但是兩者的目的存在很大不同,對於翻譯任務來說,它的一一對應關係較強,比如「蘋果」這個詞在英文翻譯中必定會有 「apple」 與之對應,對於詩句則不然。本文提出了一種對於同一輸入可以產生多個輸出的生成模型,同時保證不同的輸出之間有較大的區分性。另一方面,因為語料庫中對於詩歌風格暫時沒有專家標註,本文的模型利用互信息作為約束正則項,可以實現完全無監督的風格生成。人工評測結果表明,這個模型生成的各種風格都是可識別的,並且其他指標也優於基線模型。

由於知乎排版不能嵌入圖片,文章有很多公式,所以點擊鏈接閱讀全文,感興趣可以關注我們的微信公眾號。

論文分享|無監督詩詞風格生成?

mp.weixin.qq.com
圖標

推薦閱讀:
相关文章