線性回歸工具

參數輸入

輸入:數據要按照列的方式輸入到Excel中(模塊函數要求);

殘差:根據數據分析需要,自主選擇是否輸出殘差、標準殘差、殘差圖和線性擬合圖;

正態分布:輸出正態概率表和圖,用來驗證數據的正態性。輸出結果計算結果輸出表格和圖表:回歸統計,方差分析、假設檢驗結果、殘差結果(殘差圖)和正態概率表(正態概率圖)。回歸統計

結果說明:R Square:多元決定係數或擬合優度;

Adjusted R Square:修正的多元決定係數;

Multiple R:是R Square的正平方根,稱為複合相關係數;前面文章介紹過:相關係數R用來說明兩個變數之間的相關程度;R平方(決定係數)可以說明所建立模型與實際數據的擬合程度。標準誤差:由樣本數據引起的標準誤差,計算過程見例題。觀測值:樣本數量。方差分析

結果說明:得到回歸方程以後,需要驗證線性關係是否成立。由三種方式:

回歸方程的顯著性檢驗;

回歸係數的顯著性檢驗;相關係數的顯著性檢驗;三種檢驗方式的效果相同,只需選取其一進行即可。方差分析提供的是回歸方程顯著性檢驗的結果。Significance F的數字是統計量F的概率值,通過與給定顯著水平(α)的比較,即可確定接受還是拒絕原假設。相關係數及區間估計

結果說明:Coefficients:截距及相關係數;標準誤差:回歸係數的標準誤差,誤差值越小,表明係數的精確度越高,這個參數一般不使用,除了對該參數有特殊要求的場合。

T Stat:t統計量值;

P-value:P值用於與設定的顯著水平比較,決定接受還是拒絕原假設;上下限:輸出截距和回歸係數的上下估計區間;殘差結果

預測Y:通過回歸方程和因變數計算得到的預測值;殘差及殘差圖:預測值與樣本實際值之差;殘差圖,殘差點越是沒有趨勢(隨機,沒有規律),回歸結果越好;標準殘差:殘差的數據標準化(回顧正態分布數據的標準化);

概率分布

概率分布表及圖:第一列是百分比排位,第二列是樣本數據按從小到大順序排列;它們用來判斷樣本數據的正態性。回歸工具可以用來分析簡單線性及多元線性回歸分析,記住是線性~線性~線性~範例分析王某等人承包了某快遞公司在某地的快遞業務,一段時間後發現:有時候承接工作量大,完不成快遞任務;有時候工作量不足,員工等待。為了制定最佳的工作計劃表,王某希望估計快遞員每天的工作時間(工資計件,沒有偷懶現象),以便決定每天承接的快遞數量。王某分析,快遞員每天工作的時間與送貨距離和送貨次數相關。為此,他收集了由10項送貨任務組成的簡單隨機樣本數據,並根據這些數據建立二元線性回歸方程。數據如下表:

直接用Excel-回歸工具計算結果:

結合以上數據分析結果:項目分析研究的目的是預測快遞員運送任務所需要的時間,所以設時間為因變數;距離與次數為自變數。本題直接使用Excel計算結果。

解:1、相關次數;由於是二元回歸分析,所以不做散點圖,直接用回歸係數判別因變數(時間)與自變數總體(距離與次數)之間的相關關係。Excel計算結果:

復相關係數R為0.9383,說明因變數時間與作為一個整體的所有自變數(距離和次數)高度線性相關。2、回歸係數及回歸方程

通過Excel計算結果,可以得到回歸係數及回歸方程:

意義:回歸係數0.042表示在固定次數的條件下,送貨距離每增加1公里,行駛的時間平均增加0.042小時;同理,回歸係數0.573表示在送貨距離固定的條件下,送貨次數每增加1次,送貨的時間平均增加0.573小時。本例中,截距-0.01沒有實際意義,只起調節數值的作用。3、回歸方程的檢驗回歸方程的檢驗有三種方法(回歸方程顯著性檢驗,回歸係數顯著性檢驗和相關係數顯著性檢驗),效果相同,選擇其一檢驗即可。Excel給出的是回歸方程的顯著性檢驗結果:

Significance F=0.000591表示統計量F=25.77422的概率值,通過與顯著水平(設定為0.05)的比較,表示F值落在拒絕域,所以結論與上相同,即線性回歸方程式顯著的。4、區間估計

從上表可知,在95%置信度條件下,回歸係數b1的置信區間為(0.025,0.059),b2的置信區間為(0.069,1.077)。5、預測某個快遞員某天的任務是快遞3件貨,最優送貨路線總長為120公里,預測送貨時間,並得到95%的時間區間。通過回歸方程可得預測的送貨時間為6.749小時:

95%置信度下,送貨時間的置信區間為:

Excei計算結果中有Se的值,但是沒有包含t統計量:

t統計量值用公式:=T.INV.2T(0.05,7)得到2.365,所以該題中送貨時間區間為:(6.749-2.365*0.639,6.749+2.365*0.639)(5.24,8.26)所以該條件下送貨時間區間為5.24小時~8.26小時。
推薦閱讀:
相关文章