使用Tensorflow搭建一個簡單的Seq2Seq翻譯模型

1.背景

首先，這篇博文整理自谷歌開源的神經機器翻譯項目Neural Machine Translation (seq2seq) Tutorial。如果你直接克隆這個項目按照Tutorial中的說明操作即可，那麼也就不用再往下看了。

而之所以寫這篇博文的目的是，雖然Seq2Seq的原理並不太難，但是在用Tensorflow實現起來的時候卻不那麼容易。即使谷歌開源了源碼，但是對於初學者來說面對複雜的工程結構文件，依舊是一頭霧水（看來好幾天，源碼也沒弄懂）。於是筆者就根據Tutorial中的說明以及各種摸索，終於搭建出了一個簡單的翻譯模型。下面就來大致介紹整個模型的搭建過程，數據的預處理，以及一些重要參數的說明等等。

由於筆者本身不搞自然語言這方面的內容，只是想學習這方面技術在Tensorflow中的使用，所以對於如何。

使用Tensorflow搭建一個簡單的Seq2Seq翻譯模型

1.背景

1.1 原理

1.3 數據預處理

2. 編碼與解碼

2.1 編碼encoder

3. 總結

熱門新聞

週熱門

使用Tensorflow搭建一個簡單的Seq2Seq翻譯模型

1.背景

1.1 原理

1.3 數據預處理

2. 編碼與解碼

2.1 編碼encoder

3. 總結

CS224N筆記(八)：機器翻譯、Seq2Seq與Attention

NO·14 - 使用RNN對文本進行分類

Google Transformer模型圖文詳解

Attention模型理解？

文本生成中的decoding strategy整理

對話生成：seq2seq模型原理及優化

Pytorch學習記錄-Seq2Seq模型對比

一篇來自NLP小白的Seq2Seq的介紹

你需要知道Attention

Encoder-Decoder（一）理論理解

基於attention的seq2seq模型筆記

seq2seq+attention 中文語音識別

簡說Seq2Seq原理及實現

seq2seq之tensorflow源碼解析

PyTorch 學習筆記: 古詩 Seq2seq with Attention

熱門新聞

週熱門