seq2seq+attention 中文語音識別

FLAGS = tf.app.flags.FLAGS tf.app.flags.DEFINE_string(data_path,, Path expression to tf.Example.) tf.app.flags.DEFINE_string(mode, train, train/dev/test mode) tf.app.flags.DEFINE_string(acc, acc, acc/cer) tf.app.flags.DEFINE_string(encoder_type, pblstm, lstm/bilstm/pblstm) tf.app.flags.DEFINE_string(data_source, aishell, aishell/chths30) tf.app.flags.DEFINE_string(data_dir, ./, 數據源地址) tf.app.flags.DEFINE_bool(keep_model, True, 1是繼續訓練模型/0是重新訓練模型) tf.app.flags.DEFINE_bool(beam_search, True, True使用beamsearch) HParams = namedtuple(HParams, mode, data_source,data_dir,keep_model,beam_search,beam_size ,acc_method,num_epochs,learning_rate,weight_noise_rate, batch_size, encode_type,encoder_num_layers,attention_size, encoder_rnn_hidden_unit, decoding_embedding_size, max_grad_norm, keep_probability,l2_norm_rate,audio_dim) hps = HParams( mode=FLAGS.mode, # train, eval, decode data_source = FLAGS.data_source, data_dir = FLAGS.data_dir, keep_model = FLAGS.keep_model, beam_search = FLAGS.beam_search, beam_size = 4, acc_method = FLAGS.acc, num_epochs = 10000, learning_rate=0.001, # learning rate weight_noise_rate = 0.01, batch_size=100, encode_type = FLAGS.encoder_type, encoder_num_layers=2, attention_size = 256, encoder_rnn_hidden_unit=256, # for rnn cell decoding_embedding_size=128, # If 0, dont use embedding max_grad_norm=1, keep_probability = 0.5, l2_norm_rate = 0.00001, audio_dim=240) #列印所有屬性名稱和值 pprint (vars(hps))

1.數據預處理篇:

語音識別訓練數據使用的是aishell，單獨使用thchs30訓練會過擬合，可能是我的模型參數過多。

seq2seq+attention 中文語音識別

1.數據預處理篇:

2.語音識別模型篇

3.多GPU訓練篇：

熱門新聞

週熱門

seq2seq+attention 中文語音識別

1.數據預處理篇:

2.語音識別模型篇

3.多GPU訓練篇：

Attention模型理解？

文本生成中的decoding strategy整理

對話生成：seq2seq模型原理及優化

Pytorch學習記錄-Seq2Seq模型對比

一篇來自NLP小白的Seq2Seq的介紹

你需要知道Attention

使用Tensorflow搭建一個簡單的Seq2Seq翻譯模型

Encoder-Decoder（一）理論理解

基於attention的seq2seq模型筆記

簡說Seq2Seq原理及實現

seq2seq之tensorflow源碼解析

PyTorch 學習筆記: 古詩 Seq2seq with Attention

搬磚填坑系列之Copy-Network

論文筆記系列（一）SGM for multi-label classification

Transformer 知識點理解

熱門新聞

週熱門