提到控制混雜因素,你可能聽說過:分層分析法和多因素調整分析法,這兩種方法操作起來較為簡單也易於理解,但是他們都有一個共同的侷限性,也就是同時調整的混雜因素的數量不能太多,且受到結局事件例數的限制。
如果有大量的混雜因素需要同時進行調整的話,此時該怎麼辦呢?今天我們來為大家介紹一種控制混雜因素的常用方法——傾向性分析(Propensity Analysis)。
傾向性評分
在介紹傾向性分析方法之前,我們先介紹一個非常重要的概念:傾向性評分。顧名思義,傾向性評分是指在一定協變數條件下,一個觀察對象接受某種暴露/處理因素的可能性,它是一個從0到1的範圍內連續分佈的概率值。
其基本原理是將多個混雜因素的影響用一個綜合的傾向性評分來表示,從而降低了協變數的緯度,減少了自變數的個數,有效的克服了分層分析和多因素調整分析中要求自變數個數不能太多的短板。
那麼在進行傾向性分析之前,第一步就是要計算出每個研究對象的傾向性評分。傾向性評分的估計是以暴露/處理因素作為因變數Y(0或1),其他混雜因素作為自變數X,通過建立一個回歸模型來估計每個研究對象接受暴露/處理因素的可能性,最為常用的是logistic回歸模型。
用logistic回歸模型估計傾向性評分,操作簡單容易實現,可以直接得到傾向性評分分值,結果也易於理解。傾向性評分越接近於1,說明患者接受某種暴露/處理因素的可能性更高,越接近於0,說明患者不接受任何暴露/處理因素的可能性更大。
在觀察性研究中,通過傾向性評分來調整組間個體的差異,除了暴露/處理因素和結局變數分佈不同外,可認為其他混雜因素都均衡可比,相當於進行了「事後隨機化」,使觀察性研究的數據達到近似隨機分配的效果。
目前應用傾向性評分來控制混雜因素的方法主要有四種,下面我們將一一向大家進行介紹。
一、傾向性評分匹配法
在觀察性研究中,如病例對照研究,經常會見到匹配的概念,即按照某些因素或特徵,將病例組(或暴露組)和對照組的研究對象進行匹配,以保證兩組研究對象具有可比性,從而排除匹配因素的幹擾。
同樣,既然傾向性評分是一個能夠反映多個混雜因素影響的綜合評分,我們也可以將兩組人羣按照傾向性評分從小到大來進行匹配,僅用匹配傾向性評分一個指標來達到同時控制多個混雜因素的目的。傾向性評分匹配是傾向性分析中應用最為廣泛的一種方法。
首先我們要計算出每一個研究對象的傾向性評分,然後從小到大進行排序,對於每一個暴露/處理組的研究對象,從對照組中選取與其傾向性評分最為接近的所有個體,並從中隨機抽取一個或N個研究對象作為匹配對象,直至所有的研究對象均匹配完畢,未匹配上的研究對象則進行捨去。
(傾向性評分匹配的具體軟體操作過程:SPSS操作:輕鬆實現1:1傾向性評分匹配;SPSS詳細操作:1:n傾向性評分匹配)
當然,有多少研究對象可以成功匹配,常常與選擇匹配的比例和匹配的標準有關。匹配的比例最常見的為1:1匹配,需要根據兩組人羣的數量來決定合適的匹配比例,建議不要超過1:4匹配。
對於匹配標準,如果匹配的標準很高,則能夠成功匹配的對象就可能會少,甚至出現匹配不上的現象,造成研究對象信息的浪費,如果匹配的標準很寬泛,則匹配的效果就會較差,有可能出現兩組人羣在匹配後依然存在混雜因素分佈不均衡的現象。
例如某個個體的傾向性評分為0.8,如果設定匹配標準為±0.02,則需要為其尋找傾向性評分在0.78-0.82之間的對照進行匹配,匹配範圍太窄就可能出現匹配不上的情況;如果設定匹配標準為±0.2,則需要為其尋找傾向性評分在0.8-1.0之間的對照進行匹配,匹配範圍太寬則可能降低匹配的效果。
我們用上一篇講解多因素調整法時所引用的研究作為實例進行講解。該研究一共納入了122124名名研究對象,其中有60%的患者(73238)在住院30天內接受了心臟介入治療,40%的患者(48886)接受了保守治療,兩組人羣基線特徵分佈很不均衡(表1)。