程序員書庫(ID:OpenSourceTop) 編譯;
鏈接:https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html


是時候讓你的書架上新增幾本機器學習和數據科學書籍了,KDnuggets 網站編輯 Matthew Mayo 挑選了 10 本機器學習和數據科學相關的書籍。這些書籍都是免費的,對機器學習和數據科學感興趣的人可不要錯過了

1. 《統計思維:程序員數學之概率統計 》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


本書是專爲Python程序員準備的概率和統計的介紹,作者將基本的概率統計知識融入Python編程,告訴你如何藉助編寫程序,用計算而非數學的方式實現統計分析。該書使用美國國立衛生研究院的數據進行了案例研究,鼓勵讀者使用真實數據集處理項目。(地址:http://www.greenteapress.com/thinkstats/)


2.《貝葉斯方法》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


貝葉斯方法是推理的自然方法,大多數圖書討論貝葉斯推理,依賴於非常複雜的數學分析和人工的例子,使沒有強大數學背景的人無法接觸,讀者只能看到簡單的經過人工處理例子。卡梅倫的這本書從編程、計算的角度來介紹貝葉斯推理,把貝葉斯理論和編程實踐結合起來,使大多數程序員都可以入門並掌握(地址:http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/)


3.《深入理解機器學習:從原理到算法》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


機器學習是計算機科學發展最快的領域之一,具有廣泛的應用前景。本教材的目的是以原則的方式介紹機器學習及其提供的算法範例。本書通過介紹機器學習基礎的理論知識之後,再將這些原理轉化爲實際算法的數學推導。在介紹了基礎知識之後,本書涵蓋了以前教科書未解決的各種中心主題。


這些包括討論學習的計算複雜性以及凸性和穩定性的概念;重要的算法範例包括隨機梯度下降,神經網絡和結構化輸出學習;和新興的理論概念,如PAC-Bayes方法和基於壓縮的邊界。(地址:http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/)


4. 《統計學的要素》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


本書在一個共同的概念框架中闡述了這些領域的重要思想。雖然這種方法是統計學的,但其重點是概念而不是數學。通過使用彩色圖形給出了許多例子。它應該是統計學家和任何對科學或工業數據挖掘感興趣的人的寶貴資源。


該書的覆蓋範圍很廣,從監督學習(預測)到無監督學習。許多主題包括神經網絡,支持向量機,分類樹等 - 這第一本書對該領域的主題做出這樣的綜合處理。(地址:http://statweb.stanford.edu/~tibs/ElemStatLearn/printings/ESLII_print10.pdf)


5.《An Introduction to Statistical Learning》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


本書介紹了統計學習方法。它針對的是高年級本科生,碩士生和博士生。非數學科學的學生。該書還包含許多R語言的實例,詳細解釋瞭如何在現實環境中實現各種方法,可以說是實踐數據科學家的寶貴資源。(地址:http://www-bcf.usc.edu/~gareth/ISL/)


6.《Foundations of Data Science》


雖然計算機科學的傳統領域仍然非常重要,但未來越來越多的研究人員將參與使用計算機來理解和從應用程序中出現的大量數據中提取可用信息,而不僅僅是如何使計算機對特定明確定義的問題有用。


考慮到這一點,作者寫了這本書,以涵蓋在未來40年可能有用的理論,正如對自動機理論,算法和相關主題的理解在過去40年中產生了巨大的影響。(地址:https://www.cs.cornell.edu/jeh/book.pdf)


7.《寫給程序員的數據挖掘實踐指南》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


本書是寫給程序員的一本數據挖掘指南,可以幫助讀者動手實踐數據挖掘、集體智慧並構建推薦系統。全書共8章,介紹了數據挖掘的基本知識和理論、協同過濾、內容過濾及分類、算法評估、樸素貝葉斯、非結構化文本分類以及聚類等內容。本書的每章還給出了習題和練習,幫助讀者鞏固所學的知識。(地址:http://guidetodatamining.com/)


8.《大數據》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?


本書由斯坦福大學“Web 挖掘”課程的內容總結而成,主要關注極大規模數據的挖掘。這本書與課程一樣,是在本科計算機科學水平設計的,不要求你具備任何基礎。爲了支持更深入的探索,大多數章節都補充了進一步的閱讀參考。(地址:http://mmds.org/)


9.《深度學習》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?



深度學習教科書旨在幫助學生和從業者進入機器學習領域,特別是深度學習。該書的在線版本現已完成,並將在線免費提供。(地址:http://www.deeplearningbook.org/)


10.《機器學習實戰》


這10本免費的機器學習和數據科學書籍,確定不看一下麼?



人工智能,機器學習和深度學習正在改變衆多行業。但是建立一個機器學習系統需要你做出許多努力,這本書就是爲了幫你實現該目標而寫的。


本書第一部分主要介紹機器學習基礎,以及如何利用算法進行分類,並逐步介紹了多種經典的監督學習算法,如k近鄰算法、樸素貝葉斯算法、Logistic迴歸算法、支持向量機、AdaBoost集成方法、基於樹的迴歸算法和分類迴歸樹(CART)算法等。第三部分則重點介紹無監督學習及其一些主要算法:k均值聚類算法、Apriori算法、FP-Growth算法。第四部分介紹了機器學習算法的一些附屬工具。(地址:http://www.mlyearning.org/)

相關文章