結合多個研究實例,說說ITT分析和PP分析
Stuart J. Pocock在Journal of the American College of Cardiology上發表了系列文章,介紹了臨牀研究報告中一些統計學考慮[1]。主要參考該文章的內容,我們結合一些實例,和大家說說ITT分析和PP分析。
ITT分析
意向性分析(Intention-to-treat Analysis, ITT分析)意味著一個臨牀試驗的結果包含全部隨機分組患者的隨訪數據(還沒搞懂ITT的小夥伴趕緊戳:不明覺厲的統計學術語之ITT分析)。目前,RCT研究都將ITT分析作為臨牀療效比較的主要分析方法。
ITT分析的優勢在於它提供了一個沒有偏倚的療效比較方法(每一個研究對象無論是否都隨訪至觀察終點,都將按照最初的隨機分組全部參與最終的統計分析,即不會破壞組間可比性),但是仍有兩個問題需要考慮:
- 所有研究對象都有可供分析的全部數據嗎?
- 一項臨牀研究的成敗全部靠ITT分析結果合適嗎?
有關第一點,研究隨訪過程中不可避免會出現失訪,這時候越多研究對象失訪, ITT分析的結果就越遠離真實情況。因此,在臨牀試驗的實施過程中,減少研究對象的失訪尤為重要。保持研究對象較高的依從性是第一步。此外,當研究對象退出臨牀試驗時,如果可能的話,對他們的隨訪應該繼續下去。
在多數生存分析中,研究對象的實際隨訪情況差別很大。一般而言,研究對象的招募需要1-2年,所有的研究對象都會按照一個固定的訪視時間進行隨訪。如果所有沒有出現主要結局的研究對象都隨訪到了研究觀察終點,就可以獲得一個真實的ITT分析,並且繪製K-M生存曲線,這時候的刪失可以明確為未出現目標結局。
但是,如果患者在隨訪早期即發生失訪,這時候是很難假定其發生是隨機的。例如,失訪的患者可能病情更嚴重,主要結局發生的風險更高,但這些都是無法記錄的。因此,失訪是潛在的信息刪失,並且可能導致臨牀療效比較出現偏倚。如果失訪率以及失訪原因在治療組間不同,療效比較的結果不免會遭到質疑。
舉個實例,ATLAS ACS 2研究[2]比較了利伐沙班兩個劑量和安慰劑對照治療急性冠脈綜合徵患者的獲益,共納入15526名患者,平均隨訪時間為13個月。已發表的研究結果看起來特別地支持利伐沙班低劑量組——在主要複合終點(心血管死亡、心梗、卒中)以及全因死亡方面,伐沙班低劑量組都表現十分優異,儘管與安慰劑組比較會輕微地增加出血事件的發生風險。
然而,在覈查整個臨牀試驗過程中,發現15.5%的研究對象過早的退出了臨牀試驗,特別是8.3%患者撤銷了知情同意,並且無法獲知這部分研究對象在觀察終點時的健康狀態。這種情況無疑會引起對於臨牀試驗結果的懷疑,並且影響審批機構對於該藥物上市的批准。儘管很難做到100%隨訪,但是ATLAS ACS 2研究在這方面顯然做得不夠好。
儘管報告了ITT分析結果,ATLAS ACS 2將重點放在了所謂的校正ITT分析上,即研究治療中斷超過30天發生的任何事件在分析時都會被剔除掉,但是這種分析方法通常作為次要分析。
使用「校正ITT分析」在臨牀試驗報告中是非常普遍的,即獲得試驗資料的「全分析集」(通過對所有隨機化受試者的數據做最少和公正的剔除之後所得到的數據集,保持原始數據集的完整性,減少偏倚),但是目前缺乏有關這一問題的共識。事後排除無疑可能會導致偏倚發生,更多情況下,可接受的「校正」是排除那些被隨機分組的不合格研究對象,並且在雙盲試驗中,排除那些沒有接受任何治療的研究對象。
APPROVe研究[3,4]說明瞭獲得一個合適的ITT分析對於得到一個可信的有效結論是多麼重要。該研究是一項多中心、隨機、安慰劑對照、雙盲試驗,旨在評價羅非昔布預防結腸直腸息肉再次複發的療效。2000-2001年間共招募了2587例有結腸直腸腺瘤病史的患者。對受試者在治療期間及治療後14天內發生的不良事件進行隨訪。
然而,該試驗由於心血管毒性而提前終止,之後研究者嘗試在治療終止後隨訪所有隨機化的患者至少1年。主要複合終點包括心梗、卒中以及全因死亡。84%受試者獲得了治療後延長隨訪期間的心血管資料,95%獲得死亡資料。
該研究首次報告結果時,僅包括在治療期間(從開始治療一直到最後一次給葯後14天內)發生的終點事件,進而認為兩組的終點事件發生率在過去前18個月是相近的,而兩組出現差異是在此之後。
但是這種分析方法並沒有給出臨牀試驗的全貌,並且隨後的ITT分析(包含失訪病例),顯示不同的結果:羅非昔布組有59例,安慰劑組有34例發生主要終點事件(HR= 1.79; 95% CI: 1.17-2.73, P = 0.006)。在治療終止後的第1年,主要終點事件發生風險未觀察到顯著增加,即HR並未隨時間發生明顯變化。(圖1)