使用Tensorflow搭建一个简单的Seq2Seq翻译模型

1.背景

首先，这篇博文整理自谷歌开源的神经机器翻译项目Neural Machine Translation (seq2seq) Tutorial。如果你直接克隆这个项目按照Tutorial中的说明操作即可，那么也就不用再往下看了。

而之所以写这篇博文的目的是，虽然Seq2Seq的原理并不太难，但是在用Tensorflow实现起来的时候却不那么容易。即使谷歌开源了源码，但是对于初学者来说面对复杂的工程结构文件，依旧是一头雾水（看来好几天，源码也没弄懂）。于是笔者就根据Tutorial中的说明以及各种摸索，终于搭建出了一个简单的翻译模型。下面就来大致介绍整个模型的搭建过程，数据的预处理，以及一些重要参数的说明等等。

由于笔者本身不搞自然语言这方面的内容，只是想学习这方面技术在Tensorflow中的使用，所以对于如何。

使用Tensorflow搭建一个简单的Seq2Seq翻译模型

1.背景

1.1 原理

1.3 数据预处理

2. 编码与解码

2.1 编码encoder

3. 总结

热门新闻

周热门

使用Tensorflow搭建一个简单的Seq2Seq翻译模型

1.背景

1.1 原理

1.3 数据预处理

2. 编码与解码

2.1 编码encoder

3. 总结

CS224N笔记(八)：机器翻译、Seq2Seq与Attention

NO·14 - 使用RNN对文本进行分类

Google Transformer模型图文详解

Attention模型理解？

文本生成中的decoding strategy整理

对话生成：seq2seq模型原理及优化

Pytorch学习记录-Seq2Seq模型对比

一篇来自NLP小白的Seq2Seq的介绍

你需要知道Attention

Encoder-Decoder（一）理论理解

基于attention的seq2seq模型笔记

seq2seq+attention 中文语音识别

简说Seq2Seq原理及实现

seq2seq之tensorflow源码解析

PyTorch 学习笔记: 古诗 Seq2seq with Attention

热门新闻

周热门