聊聊臨床試驗中多重比較的問題

臨床試驗中的多重比較，通常存在於有若干研究目標的臨床試驗中，比如含有多個終點事件或者多個劑量-對照組別、多個亞組人群等。進行比較的次數越多，造成假陽性的可能性就越大。選擇適當的統計方法來處理多重比較的問題，控制I型錯誤的發生率（假陽性率），對於提升臨床試驗推斷的可靠性和成功率至關重要。

例如，自身免疫病和心血管疾病的病因較複雜，通常需要多個主要終點來準確描述治療效益。Ⅲ期臨床試驗中也會預先設定一系列次要終點，來獲得新療法的療效特徵、確定差異化的影響因素。

控制總體I型錯誤，最常用的方法Bonferroni法，其基本原理為：若進行了n次檢驗，檢驗水準α應校正為α/n，或將P值乘以n後再與α比較。比如，某試驗具有三個終點，則採用Bonferroni法進行多重性校正後的檢驗水準α』= 0.05/3 = 0.0167。

Bonferroni法可以控制有多個終點臨床試驗的總體I型錯誤率，但該方法仍是最為保守的多重性校正方法。因此，Bonferroni法也出現了多種擴展形式。

第一種是Fallback法。

以治療轉移性去勢抵抗性前列腺癌的Ⅲ期試驗為例，該試驗擬評估阿比特龍聯合潑尼松 VS. 單獨用潑尼松對患者生存的獲益。其主要結局指標是放射學無進展生存期（rPFS）和總生存期（OS）。由於該試驗具有兩個結局指標，因此採用Bonferroni法在雙側α=0.05的水平上控制總I型錯誤率，但總I型錯誤率在不同結局指標之間進行了不均勻分配。

該試驗中，檢驗分為兩步。第1步，rPFS的組間差異檢驗，定義在P≤0.01的水平。如果rPFS療效顯著，則確證OS獲益的概率可能會增加。

因此，第2步時做如下考慮：如果第1步中rPFS的療效顯著，那麼OS的分析將設定在更高的水平（P≤0.05）；否則，第2步的分析將設定在P≤0.04。

圖1. 具有兩個終點的3期腫瘤學試驗中不均衡的α分配策略及Fallback檢驗的決策規則（註：兩個主要終點是rPFS和OS）

第2種方法是Holm法。

腫瘤學試驗的另一重要特徵是在總生存期分析之前，進行無進展生存期的分析。此時也可以用效率更高的Holm法檢驗。圖2展示了具有兩個主要終點（終點1和終點2）試驗的檢驗策略。

圖2. 具有兩個終點的3期試驗中均衡的α分配策略及Holm檢驗的決策規則

註：第1步，終點1的顯著療效建立在P≤0.025的水平。如果第1步中終點1的療效顯著，那麼終點2的顯著性水平為P≤0.05；如果第1步中終點1的療效不顯著，那麼終點2的顯著性水平為P≤0.025。最後第3步，如果第1步中終點1療效不顯著，那麼可以對終點1再次檢查。如果第2步中終點2的療效顯著，並且終點1療效的P≤0.05，那麼終點1的顯著療效被確證。

Fallback法和Holm法也可以簡單擴展到具有三個或者更多終點的試驗中。

本文主要內容摘自新英格蘭醫學雜誌（NEJM）上的一篇最新綜述《Multiplicity Considerations in Clinical Trials》

參考文獻：Dmitrienko A, DAgostino SR. Multiplicity Considerations in Clinical Trials. N Engl J Med, 2018, 378(22):2115-22.

（想要及時獲得更多內容可關注「醫咖會」微信公眾號和網站：傳播研究進展，探討臨床研究設計與醫學統計學方法）

醫咖會 - 臨床研究設計和醫學統計交流平台?

www.mediecogroup.com

聊聊臨床試驗中多重比較的問題

第一種是Fallback法。

第2種方法是Holm法。

热门新闻

周热门

聊聊臨床試驗中多重比較的問題

第一種是Fallback法。

第2種方法是Holm法。

在醫院工作一年，轉做CRA可以么？

CRA是不是經常會被罵?被罵的原因會有什麼?

普蕊斯CRC見習需要關注什麼?

關於CRC，CTA,CRA的選擇和未來發展？

CRA新人一期工作一個月，現在有好的崗位，一個恆瑞四期腫瘤，一個2-3期的CRO公司。怎麼選擇發展好？

做crc好還是做cra好？

有沒有從CRC轉CRA的前輩，CRA真的比CRC要香嗎？

在CRO當臨床監查員怎麼樣，有哪些CRO公司推薦的嗎？

CRC轉CRA合資腫瘤藥廠CRA，內資器械CRO的CRA，應該選擇哪個offer？

想諮詢各位大佬：本人一年經驗的CRA，想學專業知識，該如何選擇下一個公司。?

crc沒有經驗可以求內推嗎？

一年申辦方II/III期腫瘤經驗，要跳到昆拓做CRA嗎?

SSU的工作到底在做什麼？

30歲仍是CRA 不做管理會被淘汰嗎?

中國研發新冠重組蛋白疫苗進入臨床試驗，這意味著什麼？

热门新闻

周热门