引用百度較全面的方差分析概念(涉及基礎,原理,分類等): 方差分析_百度百科

方差分析(Analysis of Variance,簡稱ANOVA),又稱「變異數分析」,是R.A.Fisher發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。 由於各種因素的影響,研究所得的數據呈現波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。

方差分析:單因素方差分析

從分析步驟角度再次介紹單因素方差分析:

對多個總體均值進行檢驗,需要用到方差分析方法(ANalysis Of VAriance,簡稱ANOVA)。例如,某工廠有A、B、C三台軋制板材的設備,如果想知道這三台設備軋制板材的厚度是否一致,就可以轉化為檢驗來自三個總體的均值是否相同的問題。以上面所說軋制板材為例,檢驗A、B、C三台設備軋制的板材厚度是否一致,可以建立如下假設:

H0: μ1=μ2=…=μr;H1: μ1,μ2,…,μr不全相等。三個總體均值是否相等無從知道,但是可以通過樣本均值是否有顯著差異來檢驗總體均值是否相等。因為,如果H0為真時,則可以期望樣本均值很接近,如果樣本均值很接近,則推斷總體均值相等的證據很充分,就可以接受H0。否則,當樣本均值相距較遠,就認為總體均值相等的證據不充分,從而拒絕H0,接受H1。樣本均值之間距離的所謂遠近是相對的,是通過假定的共同方差的兩個點估計值比較得出的。第一個點估計是組內方差,用各個樣本方差估計得到的,只與每個樣本內部的方差有關,反映各個水平內部隨機性的變動。第二個點估計值是組間方差,在H0為真的前提下,由均值抽樣平均誤差計算得到,這樣得到的方差包含兩部分的變動:一是各個水平內部的隨機性變動,二是各個水平之間的變動。將組間方差與組內方差相比,可以得到一個F統計量(F=組間方差/組內方差),可以證明該統計量服從F分布。由推斷可知,如果三台設備軋制板材的厚度均值相差很小,即組間方差中的各個水平之間的變動很小,F比值會接近於1。反之,則F的比值會顯著地大於1,根據上面計算得到的F值,在顯著性水平α給定的情況下,就可以做出是否接受三台設備軋制板材厚度均值相等的假設。單因素方差分析步驟現在假定一個因素B具有c個水平的因變數進行方差分析檢驗,例如上面提到的工廠軋制設備是因素,分別試驗軋制了10塊板材是水平。1、建立假設H0: μ1=μ2=…=μc;

H1: μ1,μ2,…,μc不全相等。

2、計算樣本均值和樣本方差

3、計算組間方差

4、組內方差的估計

5、構造F統計量進行檢驗F=組間方差/組內方差=MSB/MSE~F(c-1, nT-1)如果c個總體均值不相等,則組間方差(MSB)會大於組內方差(MSE)。當F值大到某一臨界值時,就可以拒絕H0。臨界值的大小由給定的α和自由度決定。所以,當給定顯著性水平為α時,F的拒絕域為F>Fα(c-1,nT-c)。6、方差分析表

範例分析

例題:有8位食品專家對三種配方的食品隨機品嘗,然後給食品的口感分別打分(滿分10分),如下表。問三種配方的平均分數是否相同?(α=0.05)(假定打分服從標準相等的正態分布)。

解:設μA,μB,μC分別代表配方1、2、3。已知因變數是分數,因素是配方,水平為3,具有相同的樣本容量8。根據題意建立假設:H0: μA=μB=μC;H1: 總體均值不全相等。首先,計算樣本均值及方差

其次,計算組間方差MSB

第三,計算組內方差MSE

第四,計算F統計量

最後,查表Fα(c-1,nT-c)= F0.05(2,21)=3.47。因為F=1.119<3.47= F0.05(2,21),落在接受域。所以接受H0,拒絕H1,即三種配方的口感分數沒有顯著的差異。

方差分析:有交互作用的兩因素方差分析

在多樣本的參數估計與假設檢驗基礎和方差分析:單因素方差分析中以單因素方差分析為例,介紹了對於多個總體(大於等於3)均值假設檢驗的原理和假設檢驗過程,文章中多個總體是以單因素為標準劃分的,不同總體有n個水平,以下表為例:

如果多個總體由兩個因素影響,需要用到兩因素方差分析,就是在方差分析中需要考慮兩個因素對因變數結果的影響,兩因素方差分析有兩種類型:1、有交互作用的方差分析:兩個因素對因變數都有影響,同時還有兩因素同時存在時,共同對因變數產生的影響。2、無交互作用的方差分析:兩個因素對因變數的影響是獨立的,不存在對因變數的共同影響。它們的取樣要求也是不一樣的:

進行無交互作用的方差分析,一般是在完成有交互作用方差分析之後,當檢驗結果證明交互作用不顯著時,就可以不考慮這個影響,重新進行無交互作用的方差分析。或者是在觀察(試驗)之前,有意識地控制某一因素,主要研究另一因素對因變數的影響,這樣的觀察(試驗)的結果也適合做無交互作用方差分析。

有交互作用方差分析步驟

1、建立建設對於A因素(行因素)H0: μ1=μ2=…=μr;H1: μ1,μ2,…,μr不全相等。對於B因素(列因素)H0: μ1=μ2=…=μc;H1: μ1,μ2,…,μc不全相等。對於AB交互因素H0: 不存在交互作用影響;

H1: 存在交互作用影響。

2、各均值的計算公式

3、計算各項離差平方和

4、計算均方MSA=SSA/(r-1)MSB=SSB/(c-1)MSAB=SSAB/(c-1)(r-1)MSE=SSE/rc(n-1)5、構造檢驗的F統計量對於A因素,FA=MSA/MSE~Fα[r-1,rc(n-1)]對於B因素,FB=MSB/MSE~Fα[c-1,rc(n-1)]對於AB交互因素,FAB=MSAB/MSE~Fα[(c-1)(r-1),rc(n-1)];對於上述三個因素,如果給定α,當F>Fα時,則可拒絕各自的H0,接受H1;如果F<Fα,則接受各自的H0,拒絕H1。上述計算結果可以通過方差分析表:

範例分析如果人事部門想同時研究獎勵制度和領導的類型兩個因素對員工生產力的影響,則需要調查更多的數據。下表給出了每個水平交叉單元都包含三個數據的調查資料。試檢驗各因素對員工生產力的影響是否一致?(α=0.05)

解:1、建立假設關於獎勵制度假設H0: μ1=μ2=μ3;H1: μ1,μ2,μ3不全相等。關於領導類型假設H0: μ1=μ2=μ3;H1: μ1,μ2,μ3不全相等。關於交互作用假設H0: 不存在交互作用的影響;H1: 存在交互作用的影響。2、各均值的計算

根據題目數據,求出各均值,列於下表:

3、計算各項離差平方和

同樣可以證明SST=SSA+SSB+SSAB+SSE=6.222+28.667+65.775+25.333=1264、計算均方因素A差異,自由度為r-1=3-1=2,所以因素A均方MSA為:MSA=6.222/2=3.111因素B差異,自由度為c-1=3-1=2,所以因素A均方MSB為:MSB=28.667/2=14.333交互因素AB差異,自由度為(r-1)(c-1)=(3-1)(3-1)=4,所以交互因素AB均方MSAB為:MSAB=65.778/4=16.444內部差異,自由度為rc(k-1)=3*3*(3-1)=18,所以內部均方為:MSE=25.333/18=1.4075、構造檢驗的F統計量FA=MSA/MSE=3.111/1.407=2.211FB=MSB/MSE=14.333/1.407=10.184FAB=MSA/MSE=16.444/1.407=11.684方差分析表:

根據給定顯著水平α=0.05,查F分布表,得F0.05(2,18)=3.55,F0.05(4,18)=2.93。對於A因素,FA=2.211<3.55= F0.05(2,18),落在接受域,即領導的類型對員工生產力的影響沒有顯著差別。對於B因素,FB=10.184>3.55= F0.05(2,18),落在拒絕域,即獎勵制度對員工生產力的影響顯著不同。對於AB交叉作用,FAB=16.444>2.93= F0.05(4,18),落在拒絕域,即AB交互作用對員工的生產力的影響是顯著不同的。這就是說,領導的類型的水平本身沒有影響,但當與獎勵制度水平結合時就產生了交互作用的影響。在進行兩因素方差分析時,如果存在交互作用,主要影響就變得不再重要,就不能再使用通常的方法分析主要影響,檢驗結果已不能明確地說明行或列影響的差異是否顯著。因此,當存在交互作用的影響時,一般不應去解釋行或列因素的主要影響。

方差分析:無交互作用的兩因素方差分析 進行無交互作用的方差分析,一般是在完成有交互作用方差分析之後,當檢驗結果證明交互作用不顯著時,就可以不考慮這個影響,重新進行無交互作用的方差分析。或者是在觀察(試驗)之前,有意識地控制某一因素,主要研究另一因素對因變數的影響,這樣的觀察(試驗)的結果也適合做無交互作用方差分析。無交互作用兩因素方差分析假設A和B兩個因素,因素A有r個水平,因素B有c個水平。假定不存在A與B的交互作用,或已知交互作用對因變數影響很小,則在觀察或試驗時,在r*c個整體中只抽取一個樣本或只做一次試驗即可,如下表:

無交互作用兩因素方差分析步驟與有交互的一致:1、建立建設對於A因素H0: μ1=μ2=…=μr;H1: μ1,μ2,…,μr不全相等。對於B因素H0: μ1=μ2=…=μc;H1: μ1,μ2,…,μc不全相等。2、計算各項離差平方和

3、計算均方MSA=SSA/(r-1)MSB=SSB/(c-1)MSE=SSE/(c-1)(r-1)4、構造檢驗的F統計量對於A因素,FA=MSA/MSE~Fα(r-1,(c-1)(r-1));對於B因素,FB=MSB/MSE~Fα(c-1,(c-1)(r-1));對於給定的α,A因素的拒絕域為FA>Fα(r-1,(c-1)(r-1));B因素的拒絕域為FB> Fα(c-1,(c-1)(r-1))上述計算結果可以通過方差分析表表示出來:

範例分析某人事部門想研究獎勵制度對員工生產力是否有不同的影響。為了消除不同類型領導對員工生產力的影響,分別按三種領導的類型調查了9個公司的員工生產力情況,如下表所示。表中數字是生產力分數(分數高代表生產力高)。試檢驗三種獎勵制度對員工生產力的影響是否一致?(α=0.05)

解:假設領導類型與獎勵制度沒有交互作用,按無交互作用的方差分析方法。1、建立假設關於獎勵制度假設H0: μ1=μ2=μ3;H1:μ1,μ2,μ3不全相等;關於領導類型假設H0: μ1=μ2=μ3;H1:μ1,μ2,μ3不全相等。2、計算各項離差平方和將題目信息整理如下表:

離差平方和計算如下:

3、計算各項均方MSA=SSA/(c-1)=13.556/2=6.778MSA=SSB/(r-1)=20.222/2=10.111MSE=SSE/(c-1)(r-1)=9.778/2*2=2.4444、計算F統計量對於領導類型:FA=MSA/MSE=6.778/2.444=2.773對於獎勵制度:FB=MSB/MSE=10.111/2.444=4.136

5、查F分布表確定臨界值已知α=0.05,對於獎勵制度,查的F0.05(2,4)=6.94。因為FB=4.136<6.94= F0.05(2,4),落在接受域。所以接受H0,拒絕H1,即三種獎勵制度對於員工的生產力沒有明顯差別。同理因為FA=2.773<6.94= F0.05(2,4),所以領導類型對員工生產力的影響也無明顯差別。
推薦閱讀:
相关文章