1,什麼是方差分析:
方差分析(analysis of variance,ANOVA)是分析類別變數對數值因變數影響的一種統計方,其中類別變數稱為因子,類別變數的值稱為處理或水平。接受處理的對象或實體稱為實驗單元,方差分析的原理:通過對數據誤差的分析來判斷類別自變數對數值因變數的影響效果是否顯著。
2,誤差分解:
3,方差分析的基本假定:
正態性:每個處理所對應的總體服從正態分布
方差齊性:各個總體的方差必須相等
獨立性:每個樣本數據都來自不同處理的獨立樣本
4,單因子方差分析:
線性模型:
其中 表示第i個處理的第j個觀察值; 表示第i個處理的平均值, 表示第i個處理的第j個觀察值的隨機誤差。
然後根據統計量F計算出P值,與置信水平做出判斷。
R模擬操作:(研究品種與產量的方差分析)
> example8_2 # A tibble: 30 x 4 X1 地塊 品種 產量 <int> <int> <chr> <int> 1 1 1 品種1 81 2 2 2 品種1 82 # ... with 20 more rows
檢驗:
#正態檢驗 > library(car) > library(carData) > attach(example8_2) > qqPlot(lm(產量~品種)) #方差檢驗 > bartlett.test(產量~品種,data=example8_2) Bartlett test of homogeneity of variances data: 產量 by 品種 Bartletts K-squared = 0.30152, df = 2, p-value = 0.8601
方差分析:由於P=0.000158<0.05,所有品種對產量存在影響。
> mode1_1w=aov(產量~品種) > summary(mode1_1w) Df Sum Sq Mean Sq F value Pr(>F) 品種 2 560 280.00 12.31 0.000158 *** Residuals 27 614 22.74 --- Signif. codes: 0 『***』 0.001 『**』 0.01 『*』 0.05 『.』 0.1 『 』 1
5,效應量分析:
在單因子方差分析中因子平方和與總體平方和之比,它反映量在因變數取值的總誤差中被因子解釋的比例,效應量越大說明自變數與因變數之間的關係就越強。公式為:
6,多重比較:對不同處理之間的均值配對比較就是方差分析的多重比較,主要方法有Fisher的LSD(最小顯著差異)法,Tukey-Krammer的HSD方法,感興趣可以自己查閱資料。
7,雙因子方差分析只從與單因子方差分析不同的角度,簡單描述:
7.1,模型較複雜:(是否考慮交互效應r可分為兩種情況)
R模擬雙因子分析:
> attach(example8_5) The following objects are masked from example8_2:
產量, 品種, X1
> par(family =SimSun) > boxplot(產量~品種+施肥方式,col=c("gold","green","red"),ylab="產量",xlab="品種+施肥方式", data = example8_5)
主效應方差分析表
> model1_2w<-aov(產量~品種+施肥方式, data=example8_5) > summary(model1_2w) Df Sum Sq Mean Sq F value Pr(>F) 品種 2 560 280.0 54.33 5.18e-10 *** 施肥方式 1 480 480.0 93.13 4.42e-10 *** Residuals 26 134 5.2 --- Signif. codes: 0 『***』 0.001 『**』 0.01 『*』 0.05 『.』 0.1 『 』 1 > #主效應方差分析模型的參數估計 > model1_2w$coefficients (Intercept) 品種品種2 品種品種3 施肥方式乙 80 -10 -2 8 >
交叉效應方差分析表:
> model1_2wi<-aov(產量~品種+施肥方式+品種:施肥方式, data=example8_5) > summary(model1_2wi) Df Sum Sq Mean Sq F value Pr(>F) 品種 2 560.0 280.0 54.37 1.22e-09 *** 施肥方式 1 480.0 480.0 93.20 9.73e-10 *** 品種:施肥方式 2 10.4 5.2 1.01 0.379 Residuals 24 123.6 5.1 --- Signif. codes: 0 『***』 0.001 『**』 0.01 『*』 0.05 『.』 0.1 『 』 1 > #交叉效應方差分析的模型的參數估計 > model1_2wi$coefficients (Intercept) 品種品種2 品種品種3 80.2 -9.6 -3.0 施肥方式乙 品種品種2:施肥方式乙 品種品種3:施肥方式乙 7.6 -0.8 2.0 >
最後,我們可以做模型對比:主效應方差分析與交叉效應方差分析模型對比,來佐證交叉效應是否顯著。