回歸演算法,是一種應用比較廣泛的機器演算法。智能演算法中,回歸演算法往往與其他演算法結合使用。在鋰電池SOC估計中,開路電壓估計SOC的方法,就是一種典型的回歸演算法應用形式。詳細過程在本文最後一部分說明。

1 什麼是回歸演算法

簡單的理解回歸,就是找到模型函數中未知係數的方法。我們常常會遇到這樣的情形,一個系統的輸入變數與輸出變數之間,關係比較複雜,不存在現成的理論公式描述這種關係。而我們知道,輸入與輸出之間一定存在著某種穩定的確定關係,並且我們需要這個函數的具體形式,來指導後續的實驗或者生產。於是回歸演算法就應運而生。

回歸演算法使用的典型過程是這樣的:

首先,準備好我們想要了解的典型系統。

第二,給系統一系列典型輸入,並測量相應的輸出,獲得n組由輸入、輸出數據構成的空間點數據。

第三,根據系統的特點,選擇系統模型的典型函數形式,參數待定;

第四,將第二步獲得的數據,帶入第三步函數式中,解出系統模型的每個參數。這樣,我們就獲得了一個描述系統輸入與輸出關係的經驗公式。

第五,選取另外一組實驗數據,代入經驗公式,驗證公式的準確性。如果精度在要求範圍內,則確定公式可用。

第六,在後續工作過程中,可以利用公式,估計不同輸入獲得的輸出範圍。

2 回歸演算法分類

線性回歸

線性回歸,自變數和因變數的冪次方都不超過1,則將方程稱為線性回歸方程。回歸方程往往不能直接求解,而需要找到函數最小誤差公式,求解函數誤差最小時,函數參數的取值。求解最小值的方法有梯度法,最小二乘法等。

局部加權線性回歸

線性回歸形式比較簡單,易於求解,可以描述函數的整體趨勢。但對於函數的局部波動無能為力。於是,人們在線性回歸的基礎上改進,得到局部加權方法。局部加權方法,允許估計中出現稍大的誤差,進而減小系統均方誤差,函數圖形演變成了折線形。

邏輯回歸

當函數值只有0和1兩種取值時,我們需要用到邏輯回歸。邏輯回歸主要應用於數據分類。

多項式回歸

多項式回歸,顧名思義,就是自變數指數超過1的回歸模型,是最具普遍意義的一種擬合形式,很多工程問題都可以應用這種回歸演算法。

相比於線性回歸,多項式回歸會耗費更多計算資源,指數越大計算量越大。當我們選擇多項式模型時,需要關注,擬合曲線的首尾指數較高的函數,評判在實際應用中是否有對應的意義。

逐步回歸

當系統中存在多個自變數時,需要用到逐步回歸。計算可以從最顯著的變數開始,逐步加入次顯著的變數,叫前進法;先加入全部變數,再逐步剔除一些影響不顯著的變數,叫做後退法。

其他回歸演算法

除了上面的回歸模型,常見的還有嶺回歸、LASSO回歸、ElasticNet回歸等,都是前述回歸演算法的改進和組合。

3 過擬合和欠擬合

選擇的回歸方法是否合適,主要是觀察擬合結果,實驗數據點與函數曲線的貼合程度越高,說明擬合效果越好。在網上看到兩張圖,看一眼就明白什麼是欠擬合、過擬合、恰當的擬合,盜圖一用。

觀察下面三幅圖。欠擬合,由於選取函數模型的冪次不夠,擬合曲線除了體現劃分邊界的大體趨勢,並不能對數據做出準確的劃分;過擬合,函數曲線精準分割數據點,但因為一兩個數據點,卻極大提高了函數複雜度,計算量顯著增加;恰當的擬合,如第三幅圖所示。

個人理解,過擬合和恰當的擬合之間,可能並沒有非常明晰的界限。隨著計算機算力的不斷提高,過擬合的起點肯定會相應提高。過擬合與適當的擬合之間,實際上是準確性與計算代價之間的平衡,無關乎對錯。

欠擬合

過擬合

恰當的擬合

4 回歸演算法的特點

1)回歸演算法與眾多機器演算法的鮮明區別在於,它可以解決多自變數對一個因變數的問題,也可以處理多個自變數對多個因變數的問題。

2)經過轉化以後,回歸演算法與支持向量機實際上具有等價性質。孫德山在他的論文《支持向量機分類與回歸演算法的關係研究》中闡述了這個觀點並加以證明。回歸演算法的方程,能夠直接求解的情形微乎其微,基本上都需要把參數求解轉化成求函數最小誤差問題。而支持向量機的求解,同樣是轉化為超平面到每個數據點的距離總和最大的優化問題,進而求解超平面方程的相關參數。

5 回歸演算法在SOC估計中的應用實例

作者曾潔在其論文《基於多項式回歸演算法的鋰電池SOC估測》中詳細介紹了利用回歸演算法,獲得鋰電池開路電壓與荷電狀態對應關係函數的過程。

1)將充滿電的電池組與大電阻串聯,形成放電迴路。採用電池多功能參數測量儀( 可以測得電池電壓、充放電電流、溫度、容量、內阻)監測放電過程中電池電壓和放電量;

2)放電電池組可用容量的5%,暫停,靜置30分鐘後,測量電池組開路電壓;以此類推,直到電池荷電量為16.8%截止。(實驗描述,中間調整了一次放電步長)。實驗結束,獲得每個測試點電池荷電量與開路電壓的對應數據。

3) 選取3次多項式方程作為回歸方程,計算方程各項係數,獲得3次曲線方程。

4)選取另外一組相同型號、規格的鋰電池,重新獲得一組SOC-OCV數據,將開路電壓數據帶入方程,計算模型估計SOC值。將SOC估計值與實測值對比,最大誤差5.79%。

以上即為回歸演算法在常用的鋰電池SOC估計中的具體使用過程。

參考

1 曾潔,基於多項式回歸演算法的鋰電池SOC估測

2 孫德山,支持向量機分類與回歸演算法的關係研究

3 楊濱,自適應迭代最小二乘支持向量機回歸演算法

4 華德宏,一種改進的一元線性回歸演算法

5 李雪,一種改進的偏最小二乘回歸方法研究

6 雷歌陽,鋰離子電池組的SOC估計

7 成鵬9,常見的七種回歸技術

8 機器學習之回歸演算法

9 對線性回歸、邏輯回歸、各種回歸的概念學習

(圖片來自互聯網)

推薦閱讀:

相關文章