一條龍搞定情感分析：文本預處理、載入詞向量、搭建RNN

IMDB Sentiment Classification from scratch

Author: Beyond

Time: 2019.04.26

情感分析是上手NLP的最簡單的任務之一，它就是一個簡單的文本分類問題，判斷一段文本的情感極性。最簡單的就是二分類，判斷是積極的還是消極的；更難一點的就是三分類，除了積極消極還有無情感傾向的；更加複雜的就比如情感打分，例如電影打1~5分，這就是五分類。但本質上都一樣，無非類別太多更難以學習罷了。
IMDB是一個專業的電影評論網站，類似國內的豆瓣，IMDB的電影評論數據是大家經常使用來練手的情感分析數據集，也是各種比賽，如Kaggle，和各種學者做研究常用的數據集。

本文嘗試用這個數據做一個情感二分類，作為一個NLP的練手。具體涉及到：