提到控制混雜因素,你可能聽說過:分層分析法多因素調整分析法,這兩種方法操作起來較為簡單也易於理解,但是他們都有一個共同的侷限性,也就是同時調整的混雜因素的數量不能太多,且受到結局事件例數的限制。

如果有大量的混雜因素需要同時進行調整的話,此時該怎麼辦呢?今天我們來為大家介紹一種控制混雜因素的常用方法——傾向性分析(Propensity Analysis)

傾向性評分

在介紹傾向性分析方法之前,我們先介紹一個非常重要的概念:傾向性評分。顧名思義,傾向性評分是指在一定協變數條件下,一個觀察對象接受某種暴露/處理因素的可能性,它是一個從0到1的範圍內連續分佈的概率值。

其基本原理是將多個混雜因素的影響用一個綜合的傾向性評分來表示,從而降低了協變數的緯度,減少了自變數的個數,有效的克服了分層分析和多因素調整分析中要求自變數個數不能太多的短板。

那麼在進行傾向性分析之前,第一步就是要計算出每個研究對象的傾向性評分。傾向性評分的估計是以暴露/處理因素作為因變數Y(0或1),其他混雜因素作為自變數X,通過建立一個回歸模型來估計每個研究對象接受暴露/處理因素的可能性,最為常用的是logistic回歸模型。

用logistic回歸模型估計傾向性評分,操作簡單容易實現,可以直接得到傾向性評分分值,結果也易於理解。傾向性評分越接近於1,說明患者接受某種暴露/處理因素的可能性更高,越接近於0,說明患者不接受任何暴露/處理因素的可能性更大。

在觀察性研究中,通過傾向性評分來調整組間個體的差異,除了暴露/處理因素和結局變數分佈不同外,可認為其他混雜因素都均衡可比,相當於進行了「事後隨機化」,使觀察性研究的數據達到近似隨機分配的效果。

目前應用傾向性評分來控制混雜因素的方法主要有四種,下面我們將一一向大家進行介紹。

一、傾向性評分匹配法

在觀察性研究中,如病例對照研究,經常會見到匹配的概念,即按照某些因素或特徵,將病例組(或暴露組)和對照組的研究對象進行匹配,以保證兩組研究對象具有可比性,從而排除匹配因素的幹擾。

同樣,既然傾向性評分是一個能夠反映多個混雜因素影響的綜合評分,我們也可以將兩組人羣按照傾向性評分從小到大來進行匹配,僅用匹配傾向性評分一個指標來達到同時控制多個混雜因素的目的。傾向性評分匹配是傾向性分析中應用最為廣泛的一種方法。

首先我們要計算出每一個研究對象的傾向性評分,然後從小到大進行排序,對於每一個暴露/處理組的研究對象,從對照組中選取與其傾向性評分最為接近的所有個體,並從中隨機抽取一個或N個研究對象作為匹配對象,直至所有的研究對象均匹配完畢,未匹配上的研究對象則進行捨去。

(傾向性評分匹配的具體軟體操作過程:SPSS操作:輕鬆實現1:1傾向性評分匹配;SPSS詳細操作:1:n傾向性評分匹配)

當然,有多少研究對象可以成功匹配,常常與選擇匹配的比例和匹配的標準有關。匹配的比例最常見的為1:1匹配,需要根據兩組人羣的數量來決定合適的匹配比例,建議不要超過1:4匹配

對於匹配標準,如果匹配的標準很高,則能夠成功匹配的對象就可能會少,甚至出現匹配不上的現象,造成研究對象信息的浪費,如果匹配的標準很寬泛,則匹配的效果就會較差,有可能出現兩組人羣在匹配後依然存在混雜因素分佈不均衡的現象。

例如某個個體的傾向性評分為0.8,如果設定匹配標準為±0.02,則需要為其尋找傾向性評分在0.78-0.82之間的對照進行匹配,匹配範圍太窄就可能出現匹配不上的情況;如果設定匹配標準為±0.2,則需要為其尋找傾向性評分在0.8-1.0之間的對照進行匹配,匹配範圍太寬則可能降低匹配的效果。

我們用上一篇講解多因素調整法時所引用的研究作為實例進行講解。該研究一共納入了122124名名研究對象,其中有60%的患者(73238)在住院30天內接受了心臟介入治療,40%的患者(48886)接受了保守治療,兩組人羣基線特徵分佈很不均衡(表1)。

為了控制混雜因素的影響,研究人員採用傾向性評分匹配的方法,以傾向性評分±0.1、年齡±5歲為標準進行匹配,最終共成功匹配31193組研究對象,其基線特徵比較也基本達到了均衡,如表2所示。

以此計算的HR=0.53(95% CI:0.51-0.54),提示心臟介入治療可以有效降低心梗患者47%的死亡相對風險,與多因素調整法計算的HR=0.51(95% CI:0.50-0.52)結果基本一致。

二、傾向性評分分層法

在第一期的內容中我們介紹了傳統的分層分析法,是利用原始的混雜因素來進行分層,當有K個混雜因素時,就需要將樣本一共分為2k個層,混雜因素較多時,就有可能出現某些層裏只有幾個同時滿足分層條件的研究對象,甚至是沒有滿足條件的研究對象,在這種情況下傳統的分層分析計算較為複雜,且結果也會產生一定的偏倚。

現在我們可以通過構建回歸模型,利用K個混雜因素計算出傾向性評分值,僅用傾向性評分一個變數來進行分層,避免產生分層過多的問題,同時每個層裏的研究對象也具有較高的同質性。通常情況下,我們可以按照傾向性評分的大小,將研究對象分為5-10層,在每一層混雜因素達到均衡的狀態下,分析暴露/處理因素X與因變數Y之間的關係。

我們依然用上一篇講解多因素調整法時所引用的研究作為實例進行講解。研究人員通過構建logistic回歸模型,其中因變數為是否接受心臟介入治療,自變數與多因素調整法中納入的自變數相同,共65個混雜因素,以此模型來計算傾向性評分。然後將傾向性評分進行十分位分層,如表3所示。

結果顯示,傾向性評分的範圍為0-0.98,在十分位的每一分層內,不管是心臟介入治療組還是保守治療組,預測的1年死亡率都非常接近,特別是在第3層到第8層,死亡率幾乎相等,說明通過傾向性評分進行分層,使得每一層內兩組研究對象的基線特點達到了均衡的分佈狀態,從而起到了控制混雜因素的作用。

在此前提下,我們發現隨著傾向性評分的升高,預測的1年死亡率則呈現下降的趨勢。前面我們已經介紹過,傾向性評分越高,越接近於1,說明研究對象接受心臟介入治療的可能性就越大,而此時其死亡率越低,提示心臟介入治療對於死亡風險來說是一個保護因素。

以此計算的HR=0.54(95% CI:0.53-0.55),提示心臟介入治療可以有效降低心梗患者46%的死亡相對風險,與多因素調整計算的HR=0.51(95% CI:0.50-0.52)和傾向性評分匹配計算的HR=0.53(95% CI:0.51-0.54)結果基本一致。

三、傾向性評分校正法

傾向性評分校正的方法是將傾向性評分和傳統的回歸分析相結合的一種方法。我們在介紹多因素調整的方法中提到,其控制混雜因素的個數主要取決於發生結局事件的多少,控制的混雜因素越多,所需要的結局事件的例數就越多。因此對於一些罕見病的研究,或是當收集到的結局事件很少時,如果採用多因素調整的方法,就很難全面控制多個混雜因素。

傾向性評分的一個優勢就在於,它可以將多個混雜因素的影響用一個綜合的傾向性評分來表示,從而減少了自變數的個數。在構建回歸模型時,只需要將傾向性評分作為一個協變數,然後再將暴露/處理因素作為分析變數納入到回歸模型中,以此分析在控制傾向性評分後,暴露/處理因素與結局變數之間的關聯性,因此通過控制傾向性評分一個變數,就達到了控制多個混雜因素的作用,是不是so easy呢!

四、傾向性評分加權法

傾向性評分加權法的原理與傳統的標準化法的原理類似。標準化法的基本思想是制定一個統一的「標準人口」,按照「標準人口」中混雜因素構成的權重來調整兩組觀察效應的平均水平,從而消除兩組之間由於內部混雜因素分佈不同對效應值的影響。

傾向性評分加權法在計算得出傾向性評分的基礎上,利用標準化法的原理,通過傾向性評分值賦予每個研究對象一個相應的權重進行加權,使得各組中傾向性評分分佈一致,從而達到消除混雜因素影響的目的。因此傾向性評分加權法是一種基於個體化的標準化法。

在實際的應用中,根據選擇的標準化人羣的不同,傾向性評分加權法可以分為逆概率處理加權法(the inverse probability of treatment weighting,IPTW)和標準化死亡比加權法(the standardized mortality ratio weighting,SMRW)。

IPTW法是以所有觀察對象作為標準人羣進行調整,暴露/處理組各觀察對象的權重為Wt=Pt/PS,對照組各觀察對象的權重為Wc=(1-Pt)/(1-PS)。(其中Pt為整個人羣中接受暴露/處理因素的比例,PS為每個研究對象的傾向性評分)

SMRW法是以處理組觀察對象作為標準人羣進行調整,暴露/處理組各觀察對象的權重為Wt=1,對照組各觀察對象的權重為Wc=[PS(1-Pt)]/[(1-PS)Pt]。

當每一個觀察對象的權重計算出來之後,就可以使用加權回歸的方法來估計暴露/處理因素的效應值。

總結一下,傾向性分析的方法,是通過計算出每個研究對象的傾向性評分,從而可以用傾向性評分一個指標來集中體現多個混雜因素的綜合影響,然後再使用分層、匹配、校正或加權等多種方法進行分析,以達到控制混雜因素的目的。

參考文獻

1. JAMA. 2017 Feb 21;317(7):748-759

2. JAMA. 2007 Jan 17; 297(3): 278–285

(想要及時獲得更多內容可關注「醫咖會」微信公眾號和網站:傳播研究進展,探討臨牀研究設計與醫學統計學方法)

醫咖會 - 臨牀研究設計和醫學統計交流平臺?

www.mediecogroup.com
圖標

推薦閱讀:
相關文章