一、問題與數據

某研究者想要觀察戒煙幹預的效果,招募了50名研究對象,其中吸煙者和不吸煙者各25名。所有研究對象均觀看吸煙導致癌症的視頻。兩周後,研究者詢問研究對象是否還在吸煙。

研究者收集了所有研究對象的幹預前吸煙狀態(before)和幹預後吸煙狀態(after)。兩個變數均為二分類變數,即不吸煙與吸煙(分別賦值為1和2),部分數據如下圖。

其中,Individual scores for each paticipant列出了每一個研究對象的情況,而Total count data (frequencies)則是對相同情況研究對象的數據進行了匯總。

二、對問題的分析

研究者想了解同一人羣幹預前後的吸煙狀態,且吸煙狀態為二分類變數。針對這種情況,可以使用McNemar』s檢驗,但需要先滿足2項假設。

假設1:變數為二分類,且兩類之間互斥。

假設2:所有研究對象均有前後兩次測量數據。

這2項假設均與研究設計和數據類型有關。

三、SPSS操作

1. 數據加權

如果數據是匯總格式(如上圖中的Total count data),則在進行卡方檢驗之前,需要先對數據加權。如果數據是個案格式(如上圖中的Individual scores for each paticipant),則可以跳過「數據加權」步驟,直接進行SPSS操作。

數據加權的步驟如下:

在主界面點擊Data→Weight Cases,彈出Weight Cases對話框後,點擊Weight cases by,激活Frequency Variable窗口。將freq變數放入Frequency Variable欄,點擊OK。

2. McNemar』s檢驗

在主界面點擊Analyze→Nonparametric Tests→Related Samples。出現Nonparametric Tests:Two or More Related Samples對話框。確認在What is your objective?區域勾選了Automatically compare observed data to hypothesized。

點擊Fields,將變數Before和After選入Test Fields:框。(如果使用的數據是Total count data的形式,則Fields中還有變數freq,但其餘操作都相同)。

點擊Settings,選擇Customize tests並勾選Test for Change in Binary Data區域的McNemar』s test (2 samples),點擊Run。

四、結果解釋

1. 統計描述

McNemar』s檢驗的最終檢驗結果如下圖:

雙擊Hypothesis Test Summary,啟動Model Viewer窗口。

右側出現Related-Samples McNemar Change Test,下方的表則包含多個統計量,首先查看Related-Samples McNemar Change Test。

研究者可以觀察到只有條形圖的格子,沒有觀測數和期望數,將滑鼠移到條形圖區域即可顯示觀測數和期望數。

報告McNemar檢驗結果前,研究者需要了解數據才能更好地解讀。其中最重要的就是分別彙報幹預前吸煙者在幹預後繼續吸煙和戒煙的比例。研究者在進行McNemar檢驗前可以計算這些比例,也可以利用Related-Samples McNemar Change Test計算。

50例研究對象中25例為不吸煙者,即幹預前不吸煙者的比例為50% (25 ÷ 50 = 50%)。幹預後,50例研究對象中有36例不吸煙,因此不吸煙者的比例上升至72% (36 ÷ 50 = 72%)。除此之外,還應該報告幹預前後吸煙狀態發生改變的研究對象。

該圖的左下角格子表示,有16例研究對象幹預前吸煙,幹預後戒煙。右上角格子表示, 5例研究對象幹預前不吸煙,幹預後開始吸煙。

因此,研究者應該彙報:本研究招募了50例研究對象參與有關戒煙的幹預試驗,其中吸煙者和不吸煙者各佔50%。幹預後,不吸煙者比例增加到72%,吸煙者比例降低至28%。16例吸煙者在幹預後戒煙,另有5例不吸煙者在幹預後開始吸煙。

2. McNemar檢驗結果

將前述的「Model Viewer」中的檢驗結果,整理後如下圖:

Hypothesis Test Summary表的注釋1說明瞭根據二項式分佈用精確法得到P值。可以看到,Hypothesis Test Summary表「Sig.」一列的值,與右側表中的「Exact Sig. (2-sided test)」的值相等。

McNemar檢驗的P值可以根據二項分佈得出精確P值,也可通過卡方分佈(自由度為1)得出近似P值。如果圖中左下和右上背景標黃的格子中研究對象總數小於等於25時,採用精確法計算。

從上圖中可以看到兩個格子相加的觀測數為21(16+5=21),小於25,因此本例中根據二項分佈計算精確P值。

輸出結果的表格中,「Exact Sig. (2-sided test)」一行的P值為0.027,「Asymptotic Sig. (2-sided test)」一行的近似P值為0.029。(如果左下和右上格子相加的觀測數大於25,不展示精確P值,只展示近似P值,此時Hypothesis Test Summary表中結果也是近似P值)。

不管SPSS給出精確P值還是近似P值,判斷假設檢驗的方法仍然相同。如果P值小於0.05,McNemar檢驗有統計學意義,即幹預前和幹預後不吸煙者的比例有統計學差異。

五、撰寫結論

如果得到的是根據二項分佈計算McNemar檢驗的精確P值(即本例中的情況),則彙報:

本研究招募了50例研究對象參與有關戒煙的幹預試驗,其中吸煙者和不吸煙者各佔50%。幹預後,不吸煙者比例增加到72%(36例),吸煙者比例降低至28%(14例)。16例吸煙者在幹預後戒煙,另有5例不吸煙者在幹預後開始吸煙。採用McNemar精確檢驗發現,幹預前後不吸煙者比例的差異有統計學意義,P=0.027。

如果得到的是根據卡方分佈計算McNemar檢驗的近似P值(非本例情況),則彙報:

本研究招募了50例研究對象參與有關戒煙的幹預試驗,其中吸煙者和不吸煙者各佔50%。幹預後,不吸煙者比例增加到72%(36例),吸煙者比例降低至28%(14例)。16例吸煙者在幹預後戒煙,另有5例不吸煙者在幹預後開始吸煙。採用校正卡方檢驗發現,幹預前後不吸煙者比例的差異有統計學意義,P=0.027。

(想要及時獲得更多內容可關注「醫咖會」微信公眾號:傳播研究進展,探討臨牀研究設計與醫學統計學方法;也可查看醫咖會 - 臨牀研究設計和醫學統計交流平臺,獲取60篇統計方法的詳細SPSS教程。)


推薦閱讀:
相關文章