邏輯回歸用於二分分類模型。邏輯回歸其實並不是一個回歸類的模型,而是用於處理分類問題的。即結果的標籤是一個二分類的問題。舉個例子吧,頁面上彈出一個廣告,你只有點進去看或者不看這兩種結果,就像每次考試,只有通過和未通過兩種結果,空難,只有倖存和非倖存兩種結果,我們一般用0和1來把這些結果分為兩類。邏輯回歸就是通過一些特徵來預測其標籤是0還是1,評估模型演算法的正確率的方法就是用預測正確的測試數目除以總的測試數目。下面就通過一個簡單的案例來展示一下機器學習的入門。

機器學習模型=機器演算法+訓練數據

分類和回歸的區別?

1 建立數據集

2 提取特徵和標籤

特徵:數據的特點

標籤:數據的預測結果

3 建立訓練數據集和測試數據集

訓練數據:建立機器學習模型

測試數據:驗證模型的準確性

train_test_split是交叉驗證中常用的函數,功能是從樣本中隨機的按比例選取訓練數據(train)和測試數據(test)

第一個參數:所要劃分的樣本特徵

第2個參數:所要劃分的樣本標籤

train_size:訓練數據佔比,如果是整數的話就是樣本的數量

4 建立模型,開始訓練

5 測試


推薦閱讀:
查看原文 >>
相关文章