臨床試驗中的多重比較,通常存在於有若干研究目標的臨床試驗中,比如含有多個終點事件或者多個劑量-對照組別、多個亞組人群等。進行比較的次數越多,造成假陽性的可能性就越大。選擇適當的統計方法來處理多重比較的問題,控制I型錯誤的發生率(假陽性率),對於提升臨床試驗推斷的可靠性和成功率至關重要。

例如,自身免疫病和心血管疾病的病因較複雜,通常需要多個主要終點來準確描述治療效益。Ⅲ期臨床試驗中也會預先設定一系列次要終點,來獲得新療法的療效特徵、確定差異化的影響因素。

控制總體I型錯誤,最常用的方法Bonferroni法,其基本原理為:若進行了n次檢驗,檢驗水準α應校正為α/n,或將P值乘以n後再與α比較。比如,某試驗具有三個終點,則採用Bonferroni法進行多重性校正後的檢驗水準α』= 0.05/3 = 0.0167。

Bonferroni法可以控制有多個終點臨床試驗的總體I型錯誤率,但該方法仍是最為保守的多重性校正方法。因此,Bonferroni法也出現了多種擴展形式。

第一種是Fallback法

以治療轉移性去勢抵抗性前列腺癌的Ⅲ期試驗為例,該試驗擬評估阿比特龍聯合潑尼松 VS. 單獨用潑尼松對患者生存的獲益。其主要結局指標是放射學無進展生存期(rPFS)和總生存期(OS)。由於該試驗具有兩個結局指標,因此採用Bonferroni法在雙側α=0.05的水平上控制總I型錯誤率,但總I型錯誤率在不同結局指標之間進行了不均勻分配

該試驗中,檢驗分為兩步。第1步,rPFS的組間差異檢驗,定義在P≤0.01的水平。如果rPFS療效顯著,則確證OS獲益的概率可能會增加。

因此,第2步時做如下考慮:如果第1步中rPFS的療效顯著,那麼OS的分析將設定在更高的水平(P≤0.05);否則,第2步的分析將設定在P≤0.04。

圖1. 具有兩個終點的3期腫瘤學試驗中不均衡的α分配策略及Fallback檢驗的決策規則(註:兩個主要終點是rPFS和OS)

第2種方法是Holm法

腫瘤學試驗的另一重要特徵是在總生存期分析之前,進行無進展生存期的分析。此時也可以用效率更高的Holm法檢驗。圖2展示了具有兩個主要終點(終點1和終點2)試驗的檢驗策略。

圖2. 具有兩個終點的3期試驗中均衡的α分配策略及Holm檢驗的決策規則

註:第1步,終點1的顯著療效建立在P≤0.025的水平。如果第1步中終點1的療效顯著,那麼終點2的顯著性水平為P≤0.05;如果第1步中終點1的療效不顯著,那麼終點2的顯著性水平為P≤0.025。最後第3步,如果第1步中終點1療效不顯著,那麼可以對終點1再次檢查。如果第2步中終點2的療效顯著,並且終點1療效的P≤0.05,那麼終點1的顯著療效被確證。

Fallback法和Holm法也可以簡單擴展到具有三個或者更多終點的試驗中。

本文主要內容摘自新英格蘭醫學雜誌(NEJM)上的一篇最新綜述《Multiplicity Considerations in Clinical Trials》

參考文獻:Dmitrienko A, DAgostino SR. Multiplicity Considerations in Clinical Trials. N Engl J Med, 2018, 378(22):2115-22.

(想要及時獲得更多內容可關注「醫咖會」微信公眾號和網站:傳播研究進展,探討臨床研究設計與醫學統計學方法)

醫咖會 - 臨床研究設計和醫學統計交流平台?

www.mediecogroup.com


推薦閱讀:

相关文章