從中學數學到高數微積分,我們需要做大量數學題。知識點看懂了並不算懂,能解題纔是王道。那麼神經網路是不是也能理解數學題,並解出這些題目呢?因為從數據上來說,數學題也就是一個序列而已,神經網路說不定能將這個序列映射到正確的答案。
為了促進這方面的研究,DeepMind 近日發布了一個新型數據集,包含大量不同類型的數學問題(練習題級別),旨在考察模型的數學學習和代數推理能力。
數據集地址:https://github.com/deepmind/mathematics_dataset
目前該數據集發布了 1.0 版,其每個模塊包含 200 萬(問題答案)對和 10000 個預生成測試樣本,問題的長度限制為 160 字元,答案的長度限制為 30 字元。每個問題類型中的訓練數據被分為「容易訓練」、「中等訓練難度」和「較難訓練」三個級別。這允許通過課程來訓練模型。
該數據集包含以下類別: