如題


拋磚引玉. 了解機器學習和數據挖掘的話, 看的書可以集中在以下三個方面: 數學基礎, 領域入門, 進階知識.

數學基礎: 基本包括線性代數, 概率統計, 優化

  • Gilbert Strang. Introduction to Linear Algebra. Wellesley Cambridge Press. 2009.
  • Kaare Petersen and Michael Pedersen. Matrix Cookbook
  • Trefethen Lloyd and David Bau. Numerical Linear Algebra.
  • Robert Hogg, Joseoh McKean, and Allen Craig. Introduction to Mathematical Statistics. Seventh Edition. 機械工業出版社. 2012.
  • Stephen Boyd. Convex Optimization.
  • Jorge Nocedal and Stephen Wright. Numerical Optimization, 2nd Edition. Springer. 2006.

機器學習入門: 對機器學習有基本了解

  • 吳軍. 數學之美. 第二版. 人民郵電出版社. 2014.
  • 李航. 統計學習方法. 清華大學出版社, 2012.
  • 周志華. 機器學習. 清華大學出版社. 2016.
  • John Kelleher and Brian Namee. Fundamentals of Machine Learning for Predictive Data Analytics.
  • Andrew Webb and Keith Copsey. Statistical Pattern Recognition, 3rd Edition.

進階內容: 包括機器學習領域的一些高級內容

  • Christopher Bishop. Pattern Recognition and Machine Learning. Springer. 2006.
  • Kevin Murphy. Machine Learning: A Probabilistic Perspective. MIT Press. 2012.
  • Trevor Hastie, Robert Tibshirani, and Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Second Edition. Springer. 2009.
  • Daphne Koller and Nir Friedman. Probabilistic Graphical Models: Principles and Techniques. MIT Press. 2009.
  • Ian Goodfellow, Aaron Courville, Yoshua Bengio. Deep Learning. Book in preparation for MIT Press. 2015.

數據挖掘:

  • J. Han, M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, San Francisco, CA, 2001.
  • I.H. Witten, E. Frank, Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, San Francisco, CA, 2000.
  • D. Hand, H. Mannila, P. Smyth, Principles of Data Mining, MIT Press, Cambridge, CA, 2001.
  • Aggarwal, Charu C. Data mining: the textbook. Springer, 2015.

此外, 之前有一個對張志華教授的採訪, 裡面也推薦了一些數目, 您也可以一併來搜搜看.

另一方面, 機器學習和數據挖掘方面也有很多很不錯的公開課, 比如但不限於下面列舉的一些:

  • Andrew Ng. Machine Learning. Coursera. Stanford.
  • Hsuan-Tien Lin. Machine Learning Foundations. Coursera. National Taiwan University.
  • Hsuan-Tien Lin. Machine Learning Techniques. Coursera. National Taiwan University.
  • Andrew Ng. CS229: Machine Learning. Stanford.
  • Trevor Hastie. Statistical Learning. Stanford.
  • Jeff Ullman. CS246: Mining Massive Data Sets. Stanford.
  • Yaser Abu-Mostafa. Learning From Data. edX.
  • Patrick Winston. 6.034: Artificial Intelligence. MIT.

最後, 做機器學習和數據挖掘光看書是不夠的, 最好是配合一些實際的項目入手, 比如您可以看看Kaggle和天池競賽:

Your Home for Data Science天池大數據競賽_競賽平台_海量數據_演算法

您好!感謝邀請。

了解一本書,《終極演算法》,是本描述機器學習的入門書籍,大眾類型,很通俗,也很有意思。僅供參考。

《終極演算法》的作者是:佩德羅·多明戈斯.中信出版社。

另外,在中國大學MOOC (一個APP) 上有一門北京理工大學 Python機器學習課程(已經結束,可以報名下一次課)。如下圖:

中國大學MOOC上的【北京理工大學的Python】課程應該很不錯,是系列課,包括上面那兩門。這門系列課的主講老師是:嵩天老師

不過,上面這兩門課程已經結束了,我由於之前報名過,現在可以繼續看,也許您需要報名參加下一次課。(免費的)

希望能幫助您,謝謝。

若有不當之處,歡迎批評指正。


建議聽聽深度學習講座——基於Tensorflow實戰。業內人士,加微進VIP群:tcict1987。和教授面對面交流!


推薦閱讀:
查看原文 >>
相关文章