Stuart J. Pocock在Journal of the American College of Cardiology上發表了系列文章,介紹了臨牀研究報告中一些統計學考慮[1]。主要參考該文章的內容,我們結合一些實例,和大家說說ITT分析和PP分析。

ITT分析

意向性分析(Intention-to-treat Analysis, ITT分析)意味著一個臨牀試驗的結果包含全部隨機分組患者的隨訪數據(還沒搞懂ITT的小夥伴趕緊戳:不明覺厲的統計學術語之ITT分析)。目前,RCT研究都將ITT分析作為臨牀療效比較的主要分析方法。

ITT分析的優勢在於它提供了一個沒有偏倚的療效比較方法(每一個研究對象無論是否都隨訪至觀察終點,都將按照最初的隨機分組全部參與最終的統計分析,即不會破壞組間可比性),但是仍有兩個問題需要考慮:

  1. 所有研究對象都有可供分析的全部數據嗎?
  2. 一項臨牀研究的成敗全部靠ITT分析結果合適嗎?

有關第一點,研究隨訪過程中不可避免會出現失訪,這時候越多研究對象失訪, ITT分析的結果就越遠離真實情況。因此,在臨牀試驗的實施過程中,減少研究對象的失訪尤為重要。保持研究對象較高的依從性是第一步。此外,當研究對象退出臨牀試驗時,如果可能的話,對他們的隨訪應該繼續下去。

在多數生存分析中,研究對象的實際隨訪情況差別很大。一般而言,研究對象的招募需要1-2年,所有的研究對象都會按照一個固定的訪視時間進行隨訪。如果所有沒有出現主要結局的研究對象都隨訪到了研究觀察終點,就可以獲得一個真實的ITT分析,並且繪製K-M生存曲線,這時候的刪失可以明確為未出現目標結局。

但是,如果患者在隨訪早期即發生失訪,這時候是很難假定其發生是隨機的。例如,失訪的患者可能病情更嚴重,主要結局發生的風險更高,但這些都是無法記錄的。因此,失訪是潛在的信息刪失,並且可能導致臨牀療效比較出現偏倚。如果失訪率以及失訪原因在治療組間不同,療效比較的結果不免會遭到質疑。

舉個實例,ATLAS ACS 2研究[2]比較了利伐沙班兩個劑量和安慰劑對照治療急性冠脈綜合徵患者的獲益,共納入15526名患者,平均隨訪時間為13個月。已發表的研究結果看起來特別地支持利伐沙班低劑量組——在主要複合終點(心血管死亡、心梗、卒中)以及全因死亡方面,伐沙班低劑量組都表現十分優異,儘管與安慰劑組比較會輕微地增加出血事件的發生風險。

然而,在覈查整個臨牀試驗過程中,發現15.5%的研究對象過早的退出了臨牀試驗,特別是8.3%患者撤銷了知情同意,並且無法獲知這部分研究對象在觀察終點時的健康狀態。這種情況無疑會引起對於臨牀試驗結果的懷疑,並且影響審批機構對於該藥物上市的批准。儘管很難做到100%隨訪,但是ATLAS ACS 2研究在這方面顯然做得不夠好。

儘管報告了ITT分析結果,ATLAS ACS 2將重點放在了所謂的校正ITT分析上,即研究治療中斷超過30天發生的任何事件在分析時都會被剔除掉,但是這種分析方法通常作為次要分析。

使用「校正ITT分析」在臨牀試驗報告中是非常普遍的,即獲得試驗資料的「全分析集」(通過對所有隨機化受試者的數據做最少和公正的剔除之後所得到的數據集,保持原始數據集的完整性,減少偏倚),但是目前缺乏有關這一問題的共識。事後排除無疑可能會導致偏倚發生,更多情況下,可接受的「校正」是排除那些被隨機分組的不合格研究對象,並且在雙盲試驗中,排除那些沒有接受任何治療的研究對象。

APPROVe研究[3,4]說明瞭獲得一個合適的ITT分析對於得到一個可信的有效結論是多麼重要。該研究是一項多中心、隨機、安慰劑對照、雙盲試驗,旨在評價羅非昔布預防結腸直腸息肉再次複發的療效。2000-2001年間共招募了2587例有結腸直腸腺瘤病史的患者。對受試者在治療期間及治療後14天內發生的不良事件進行隨訪。

然而,該試驗由於心血管毒性而提前終止,之後研究者嘗試在治療終止後隨訪所有隨機化的患者至少1年。主要複合終點包括心梗、卒中以及全因死亡。84%受試者獲得了治療後延長隨訪期間的心血管資料,95%獲得死亡資料。

該研究首次報告結果時,僅包括在治療期間(從開始治療一直到最後一次給葯後14天內)發生的終點事件,進而認為兩組的終點事件發生率在過去前18個月是相近的,而兩組出現差異是在此之後。

但是這種分析方法並沒有給出臨牀試驗的全貌,並且隨後的ITT分析(包含失訪病例),顯示不同的結果:羅非昔布組有59例,安慰劑組有34例發生主要終點事件(HR= 1.79; 95% CI: 1.17-2.73, P = 0.006)。在治療終止後的第1年,主要終點事件發生風險未觀察到顯著增加,即HR並未隨時間發生明顯變化。(圖1)

圖1. APPROVe研究ITT分析和PP分析結果

PP分析

另外一種臨牀研究常用的統計分析方法是符合研究方案(Per-protocol, PP)分析,對應的試驗資料「符合方案集」(是全分析集中一個子集,其受試者對方案具有充分的依從性,能夠用來對處理的效應進行估計)。

例如,TECOS研究[5]比較了西他列汀與安慰劑在2型糖尿病中的獲益情況。主要複合終點(心血管死亡、心梗、卒中、不穩定型心絞痛)。ITT分析顯示,西格列汀組與安慰劑組受試者主要終點事件發生率分別為11.4%與11.6%(HR=0.98; 95%CI; 0.89-1.08)。

然而,在平均3年的隨訪過程中,有相當一部分患者停止服藥。PP分析結果顯示,西他列汀組和安慰劑組主要終點事件發生率均為9.6%(HR=0.98; 95%CI; 0.88-1.09)。在兩個治療組中,ITT分析得到事件發生率比PP分析的要高。也就是說,依從性差的研究對象往往有著較高的結局事件發生風險,而這種情況在多數RCT中都比較常見。

ROCKET-AF[6]比較了利伐沙班和華法林治療冠脈纖維化患者的療效,ITT分析和PP分析是不一致的。ITT分析顯示,利伐沙班組主要終點事件(卒中、系統性栓塞)發生風險與華法林組並無顯著差異(HR= 0.88; 95%CI: 0.75-1.03, P=0.12),進一步採用PP分析,結果卻支持利伐沙班獲益更高(HR=0.79; 95%CI: 0.66-0.96, P =0.02)。

一般而言,PP分析會導致偏倚——依從性差的研究對象是一個被選擇人羣,經常(非隨機地)有著較高的結局事件發生風險,因而會降低結果的可信性。

總之,ITT分析傾向於低估真實的療效差異,而PP分析可能高估療效。兩種分析方法的結果應該被同時呈現在研究報告中,一致纔能有助於確定研究結論,不一致則需要進一步的分析討論。

參考文獻

1. J Am Coll Cardiol. 2015; 66:2648-62

2. J Am Coll Cardiol. 2013; 62:777-81

3. N Engl J Med. 2005; 352:1092-102

4. Lancet. 2008; 372:1756–64

5. N Engl J Med. 2015; 373:232-42

6. N Engl J Med. 2011; 365:883-91

(想要及時獲得更多內容可關注「醫咖會」微信公眾號:傳播研究進展,探討臨牀研究設計與醫學統計學方法;也可查看醫咖會 - 臨牀研究設計和醫學統計交流平臺,獲取60篇統計方法的詳細SPSS教程。)


推薦閱讀:
相關文章