如何用SPSS進行多因素方差分析?

多因素方差分析是對一個獨立變數是否受一個或多個因素或變數影響而進行的方差分析。SPSS調用「Univariate」過程,檢驗不同水平組合之間因變數均數,由於受不同因素影響是否有差異的問題。在這個過程中可以分析每一個因素的作用,也可以分析因素之間的交互作用,以及分析協方差,以及各因素變數與協變數之間的交互作用。該過程要求因變數是從多元正態總體隨機採樣得來,且總體中各單元的方差相同。但也可以通過方差齊次性檢驗選擇均值比較結果。因變數和協變數必須是數值型變數,協變數與因變數不彼此獨立。因素變數是分類變數,可以是數值型也可以是長度不超過8的字元型變數。固定因素變數(Fixed Factor)是反應處理的因素;隨機因素是隨機地從總體中抽取的因素。

[例子]

研究不同溫度與不同濕度對粘蟲發育歷期的影響,得試驗數據如表5-7。分析不同溫度和濕度對粘蟲發育歷期的影響是否存在著顯著性差異。

表5-7 不同溫度與不同濕度粘蟲發育歷期表

相對濕度(%)

溫度℃

重 復

1

2

3

4

100

25

91.2

95.0

93.8

93.0

27

87.6

84.7

81.2

82.4

29

79.2

67.0

75.7

70.6

31

65.2

63.3

63.6

63.3

80

25

93.2

89.3

95.1

95.5

27

85.8

81.6

81.0

84.4

29

79.0

70.8

67.7

78.8

31

70.7

86.5

66.9

64.9

40

25

100.2

103.3

98.3

103.8

27

90.6

91.7

94.5

92.2

29

77.2

85.8

81.7

79.7

31

73.6

73.2

76.4

72.5

數據保存在「DATA5-2.SAV」文件中,變數格式如圖5-1。

1)準備分析數據

在數據編輯窗口中輸入數據。建立因變數歷期「歷期」變數,因素變數溫度「A」,濕度為「B」變數,重複變數「重複」。然後輸入對應的數值,如圖5-6所示。或者打開已存在的數據文件「DATA5-2.SAV」。

圖5-6 數據輸入格式

2)啟動分析過程

點擊主菜單「Analyze」項,在下拉菜單中點擊「General Linear Model」項,在右拉式菜單中點擊「Univariate」項,系統打開單因變數多因素方差分析設置窗口如圖5-7。

圖5-7 多因素方差分析窗口

3)設置分析變數

設置因變數: 在左邊變數列表中選「歷期」,用向右拉按鈕選入到「Dependent Variable:」框中。

設置因素變數: 在左邊變數列表中選「a」和「b」變數,用向右拉按鈕移到「Fixed Factor(s):」框中。可以選擇多個因素變數。由於內存容量的限制,選擇的因素水平組合數(單元數)應該盡量少。

設置隨機因素變數: 在左邊變數列表中選「重複」變數,用向右拉按鈕移到「到Random Factor(s)」框中。可以選擇多個隨機變數。

設置協變數:如果需要去除某個變數對因素變數的影響,可將這個變數移到「Covariate(s)」框中。

設置權重變數:如果需要分析權重變數的影響,將權重變數移到「WLS Weight」框中。

4)選擇分析模型

在主對話框中單擊「Model」按鈕,打開「Univariate Model」對話框。見圖5-8。

圖5-8 「Univariate Model」 定義分析模型對話框

在Specify Model欄中,指定分析模型類型。

① Full Factorial選項

此項為系統默認的模型類型。該項選擇建立全模型。全模型包括所有因素變數的主效應和所有的交互效應。例如有三個因素變數,全模型包括三個因素變數的主效應、兩兩的交互效應和三個因素的交互效應。選擇該項後無需進行進一步的操作,即可單擊「Continue」按鈕返回主對話框。此項是系統預設項。

② Custom選項

建立自定義的分析模型。選擇了「Custom」後,原被屏蔽的「Factors & Covariates」、「Model」和「Build Term(s)」欄被激活。在「Factors & Covariates」框中自動列出可以作為因素變數的變數名,其變數名後面的括弧中標有字母「F」;和可以作為協變數的變數名,其變數名後面的括弧中標有字母「C」。這些變數都是由用戶在主對話框中定義過的。根據表中列出的變數名建立模型,其方法如下:

在「Build Term(s)」欄右面的有一向下箭頭按鈕(下拉按鈕),單擊該按鈕可以展開一小菜單,在下拉菜單中用滑鼠單擊某一項,下拉菜單收回,選中的交互類型佔據矩形框。有如下幾項選擇:
  • Interaction 選中此項可以指定任意的交互效應;
  • Main effects 選中此項可以指定主效應;
  • All 2-way 指定所有2維交互效應;
  • All 3-way 指定所有3維交互效應;
  • All 4-way 指定所有4維交互效應
  • All 5-way 指定所有5維交互效應。

③ 建立分析模型中的主效應:

在「Build Term(s)」欄用下拉按鈕選中主效應「Main effects」。

在變數列表欄用滑鼠鍵單擊某一個單個的因素變數名,該變數名背景將改變顏色(一般變為藍色),單擊「Build Term(s)」欄中的右拉箭頭按鈕,該變數出現在「Model」框中。一個變數名佔一行稱為主效應項。欲在模型中包括幾個主效應項,就進行幾次如上的操作。也可以在標有「F」變數名中標記多個變數同時送到「Model」框中。

本例將「a」和「b」變數作為主效應,按上面的方法選送到「Model」框中。

④ 建立模型中的交互項

要求在分析模型中包括哪些變數的交互效應,可以通過如下的操作建立交互項。

例如,因素變數有「a(F)」和「b(F)」,建立它們之間的相互效應。

  • 連續在「Factors &」框的變數表中單擊「a(F)」和「b(F)」變數使其選中。
  • 單擊「Build Term(s)」欄內下拉按鈕,選中交互效應「Interaction」項。
  • 單擊「Build Term(s)」欄內的右拉按鈕,「a*b」交互效應就出現在「Model」框中,模型增加了一個交互效應項:a*b

⑤ Sum of squares 欄分解平方和的選擇項

  • Type I項,分層處理平方和。僅對模型主效應之前的每項進行調整。一般適用於:平衡的AN0VA模型,在這個模型中一階交互 效應前指定主效應,二階交互效應前指定一階交互效應,依次類推;多項式回歸模型。嵌套模型是指第一效應嵌套在第二 效應里,第二效應嵌套在第三效應里,嵌套的形式可使用語句指定。
  • Type II項,對其他所有效應進行調整。一般適用於:平衡的AN0VA模型、主因子效應模型、回歸模型、嵌套設計。
  • Type III項,是系統默認的處理方法。對其他任何效應均進行調整。它的優勢是把所估計剩餘常量也考慮到單元頻數中。對沒 有缺失單元格的不平衡模型也適用,一般適用於:Type I、Type II所列的模型:沒有空單元格的平衡和不平衡模型。
  • Type IV頂,沒有缺失單元的設計使用此方法對任何效應F計算平方和。如果F不包含在其他效應里,Type IV = Type IIIl = TypeII。如果F包含在其他效應里,Type IV只對F的較高水平效應參數作對比。一般適用於:Type I、Type lI所列模型; 沒有空單元的平衡和不平衡模型。

⑥ Include intercept in model欄選項

系統默認選項。通常截距包括在模型中。如果能假設數據通過原點,可以不包括截距,即不選擇此項。

5)選擇比較方法

在主對話框中單擊「Contrasts」按鈕,打開「Contrasts」比較設置對話框,如圖5-9所示。

如圖5-9 Contrasts對比設置框

在「Factors」框中顯示出所有在主對話框中選中的因素變數。因素變數名後的括弧中是當前的比較方法。

① 選擇因子

在「Factors」框中選擇想要改變比較方法的因子,即滑鼠單擊選中的因子。這一操作使「Change Contrast」欄中的各項被激活。

② 選擇比較方法

單擊「Contrast」參數框中的向下箭頭,展開比較方法表。用滑鼠單擊選中的對照方法。可供選擇的對照方法有:

  • None,不進行均數比較。
  • Deviation,除被忽略的水平外,比較預測變數或因素變數的每個水平的效應。可以選擇「Last」(最後一個水平)或 「First」(第一個水平)作為忽略的水平。
  • Simple,除了作為參考的水平外,對預測變數或因素變數的每一水平都與參考水平進行比較。選擇「Last」或「First」作為 參考水平。
  • Difference,對預測變數或因素每一水平的效應,除第一水平以外,都與其前面各水平的平均效應進行比較。與Helmert對照 方法相反。
  • Helmert,對預測變數或因素的效應,除最後一個以外,都與後續的各水平的平均效應相比較。
  • Repeated,對相鄰的水平進行比較。對預測變數或因素的效應,除第一水平以外,對每一水平都與它前面的水平進行比較。
  • Polynomial,多項式比較。第一級自由度包括線性效應與預測變數或因素水平的交叉。第二級包括二次效應等。各水平彼此 的間隔被假設是均勻的。

③ 修改比較方法

先按步驟①選中因子變數,再選比較方法,然後單擊「Change」按鈕,選中的(或改變的)比較方法顯示在步驟①選中的因子變數後面的括弧中。

④設置比較的參考類

在「Reference Category」欄比較的參考類有兩個,只有選擇了「Deviation」或「Simple」方法時才需要選擇參考水平。共有兩種可能的選擇,最後一個水平「Last」選項和第一水平「First」項。系統默認的參考水平是「Last」。

6) 選擇均值圖

在主對話框中單擊「Plot」按鈕,打開「Profile Plots」對話框,如圖5-10所示。在該對話框中設置均值輪廓圖。

如圖5-10 「Profile Plots」對話框

均值輪廓圖(Profile Plots)用於比較邊際均值。輪廓圖是線圖,圖中每個點表明因變數在因素變數每個水平上的邊際均值的估計值。如果指定了協變數,該均值則是經過協變數調整的均值。因變數做輪廓圖的縱軸;一個因素變數做橫軸。

做單因素方差分析時,輪廓圖表明該因素各水平的因變數均值。

雙因素方差分析時,指定一個因素做橫軸變數,另一個因素變數的每個水平產生不同的線。如果是三因素方差分析,可以指定第三個因素變數,該因素每個水平產生一個輪廓圖。雙因素或多因素輪廓圖中的相互平行的線表明在因素間無交互效應;不平行的線表明有交互效應。

  • Factors 框中為因素變數列表。
  • Horlzontal Axis 橫坐標框,選擇選擇「Factors」框中一個因素變數做橫坐標變數。被選的變數名反向顯示,單擊向右拉箭 頭按鈕,將變數名送入相應的橫坐標軸框中。 如果只想看該因素變數各水平的,因變數均值分布,單擊「Add」按鈕,將所選因素變數移入下面的「Plots」框中。否 則,不點擊「Add」按鈕,接著做下步。
  • Separate Lines 分線框。如果想看兩個因素變數組合的各單元格中因變數均值分布,或想看兩個因變數間是否存在交互效應, 選擇「Factors」框中另一個因素變數,單擊右拉按鈕將變數名送入「Separate Lines」框中。單擊「Add」按鈕,將自動生成 的圖形表達式送入到「Plots」欄中。分線框中的變數的每個水平將在圖中是一條線。圖形表達式是用「*」連接的兩個因素變 量名。
  • Separate Plots 分圖框。如果在「Factors」欄中還有因素變數,可以按上述方法,將其送入「Separate Plot」框中,單擊 「Add」按鈕,將自動生成的圖形表達式送入到「Plots」欄中。圖形表達式是用「*』連接的三個因素變數名。分圖變數的每個 水平生成一張線圖。
  • 將圖形表達式送到「Plots」框後發現有錯誤,單擊選錯的變數,單擊「Remove」按鈕,將其取消,再重新輸入正確內容。

在檢查無誤後,按「Continue」按鈕確認,返回到主對話框。如果取消做的設置單擊「Cancel」按鈕

7) 選擇多重比較

在主對話框中單擊「Post Hoc」選項,打開「Post Hoc Multiple Comparisons for Observed Means」對話框,從「Factor(s)」框選擇變數,單擊向右拉按鈕,使被選變數進入「Post Hoc test for」框。本例子選擇了「a」和「b」。

然後選擇多重比較方法。在對話框中選擇多重比較方法。本例子選擇了「Duncan」和「Tamhanes T2」。

8)選擇保存運算值

圖5-11 Save對話框

在主對話框中,單擊「Save」按鈕,打開「Save」設置對話框,如圖5-11所示。通過在對話框中的選擇,可以將所計算的預測值、殘差和檢測值作為新的變數保存在編輯數據文件中。以便於在其他統計分析中使用這些值。

① Predicted Values 預測值

  1. Unstsndardized,非標準化預測值。
  2. Weighted,如果在主對話框中選擇了WLS變數,選中該複選項,將保存加權非標準化預測值。
  3. Standard error,預測值標準誤。

② Diagnostics 診斷值

  1. Cook』s distance,Cook 距離。
  2. Leverage values,非中心化 Leverage 值。

③ Residuals 殘差

  1. Unstsndardized,非標準化殘差值,觀測值與預測值之差。
  2. Weighted,如果在主對話框中選擇了WLS變數,選中該複選項,將保存加權非標準化殘差。
  3. Standardized,標準化殘差,又稱Pearson殘差。
  4. Studentized,學生化殘差。
  5. Deleted,剔除殘差,自變數值與校正預測值之差。

④ Save to New File 保存協方差矩陣

選中」Coefficient statistics」項,將參數協方差矩陣保存到一個新文件中。單擊「File」按鈕,打開相應的對話框將文件保存。

9)選擇輸出項

在主對話框中單擊「Options」按鈕,打開「Options」輸出設置對話框,見圖5-12。

圖5-12 「Options」輸出設置對話框

① Estimated Marginal Means 估測邊際均值設置

  • 在「Factor(s) and Factor Interactions」框中列出「Model」對話框中指定的效應項,在該框中選定因素變數的各種效應項, 單擊右拉按鈕就將其複製到「Display Means for」框中。選擇主效應,則產生估計的邊際均值表;選擇二維交互效應產生的估計 邊際均值表實際上是典型的單元格均值表。選擇三維交互效應也是單元格均值表。
  • 在「Display Means for」框中有主效應時激活此框下面的「Compare main effects」複選項,對主效應的邊際均值進行組間的配 對比較。
  • Confidence interval adjustment參數框,進行多重組間比較。打開下拉菜單,共有三個選項: LSD(none)、Bonferroni、Sidak.。

② 在「Display」欄中指定要求輸出的統計量

Descriptive statistics項,輸出描述統計量:觀測量的均值、標準差和每個單元格中的觀測量數。

Estimates of effect size項,效應量估計。選擇此項,給出η2(eta-Square)值。它反應了每個效應與每個參數估計值可以歸於

因素的總變異的大小。

Observed power複選項,選中此項給出在假設是基於觀測值時各種檢驗假設的功效。計算功效的顯著性水平,系統默認的臨界值

是0.05。

Parameter estimates項。選擇此項給出了各因素變數的模型參數估計、標準誤、t檢驗的t值、顯著性概率和95%的置信區間。

Contrast coefficient matrix項,顯示協方差矩陣。

Homogeneity test項,方差齊次性檢驗。本例子選中該項。

Spread vs.level plot項,繪製觀測量均值對標準差和觀測量均值對方差的圖形。

Residual plot項,繪製殘差圖。給出觀測值、預測值散點圖和觀測量數目,觀測量數目對標準化殘差的散點圖,加上正態和標準化

殘差的正態概率圖。

Lack of fit項,檢查獨立變數和非獨立變數間的關係是否被充分描述。

General estimable function項,可以根據一般估計函數自定義假設檢驗。對比係數矩陣的行與一般估計函數是線性組合的。

③ Significance level 框設置

改變「Confidence intervals」框內多重比較的顯著性水平。

10) 提交執行

設置完成後,在多因素方差分析窗口框中點擊「OK」按鈕,SPSS就會根據設置進行運算,並將結算結果輸出到SPSS結果輸出窗口中。

11) 結果與分析

主要輸出結果:

結果分析:

方差不齊次性檢驗顯著

表5-8 方差齊次性檢驗表明:方差不齊次性顯著,p<0.05。

方差分析:

表5-9 主效應方差分析表:在表的左上方標明研究的對象是粘蟲歷期。

偏差來源和偏差平方和:

  • Source 列是偏差的來源。其次列是「Type III Sum of Squares」偏差平方和。
  • Corrected Model 校正模型,其偏差平方和等於兩個主效應a、b平方和加上交互a*b的平方和之和。
  • Intercept 截距。
  • a 溫度主效應,其偏差平方和反應的是不同溫度造成對粘蟲歷期的差異。與b偏差平方相同均屬於組間偏差平方和。
  • b 濕度主效應,其偏差平方和反應的是不同濕度計量造成的粘蟲歷期之差異。
  • a*b 溫度和濕度交互效應,其偏差平方和反應的是不同溫度和濕度共同造成的粘蟲歷期的差異。
  • Error 誤差。其偏差平方和反應的是組內差異。也稱組內偏差平方和。
  • Total 是偏差平方和在數值上等於截距、主效應、次效應和誤差偏差平方和之總和。
  • Corrected Total 校正總和。其偏差平方和等於校正模型與誤差之偏差平方和之總和。
  • df 自由度
  • Mean Square 均方,數值上等於偏差平方和除以相應的自由度。
  • F 值,是各效應項與誤差項的均方之比值
  • Sig 進行F檢驗的p值。p≤0.05,由此得出「溫度」和「濕度」對因變數「粘蟲歷期」在0.05水平上是有顯著性差異的。

根據方差分析表明:

  • 不同溫度(a)對粘蟲歷期的偏差均方是1575.434,F值為90.882,顯著性水平是0.000,即p<0.05存在顯著性差異;
  • 不同濕度(b)對粘蟲歷期的偏差均方是322.000,F值為18.575,顯著性水平是0.000,即p<0.05存在顯著性差異;
  • 不同溫度和不同濕度(a*b)共同對粘蟲歷期的偏差均方是19.809,F值為1.143,顯著性水平是0.358,即p>0.05存在不顯著性差異。cda數據分析培訓

多重比較

由於方差不齊次性,應選擇方差不具有齊次性時的「Tamhanes T2」t檢驗進行配對比較。表5-10 多重比較表就是「溫度」各水平「Tamhanes T2」方法比較的結果。表中的各項說明參見表5-6(5.2.2節)。

  • 溫度25℃與27℃、29℃和31℃之間都有顯著性差異;
  • 溫度27℃與25℃、29℃和31℃之間都有顯著性差異;
  • 溫度29℃與26℃和27℃之間都有顯著性差異;與31℃無顯著性差異;
  • 溫度31℃與25℃和27℃之間都有顯著性差異;與29℃無顯著性差異。

不同濕度水平之間無顯著性差異存在,這裡沒有列出多重比較表。


推薦閱讀:
相关文章