搞科研

經費不足、

研究持續時間有限、

人羣研究應答率、

依從性低

……

電子病歷資料庫(EHRs)的及時出現為開展臨牀研究,尤其是基於隊列的大樣本臨牀研究提供了低成本的願景和機遇。隨著2009年美國衛生信息技術法案的推出,美國80%的醫療機構實現了病歷電子化,全球EHRs的普及率亦逐漸增加。人們越來越關注如何基於EHRs開展二手數據分析,以期最終促進醫療服務的改善。但由於EHRs收集的初衷是為了臨牀診療而非臨牀研究需要,因此利用EHRs開展臨牀研究仍存在很多問題,如:數據信息的完整性、就診人羣的代表性、數據處理的複雜性等。

那麼,我們如何利用EHRs開展臨牀研究呢?在面臨上述問題所致研究結論產生系統誤差時,我們又如何控制偏倚呢?

現分享北京協和醫院基礎醫學研究所流行病學系王麗、程凱亮發表在《協和醫學雜誌》中的文章,用實例探討EHRs及臨牀研究相關問題~

原文作者:王麗,程凱亮

首發於「xieheyixue」協和醫學雜誌微信號

電子病歷資料庫在臨牀研究中的應用及偏倚控制

1電子病歷資料庫的定義及基本特徵

無論哪種研究設計方法,臨牀流行病學研究的核心均是在控制了混雜變數的情況下,探討暴露因素與結局之間的關聯。

定義:EHRs是醫療機構對門診、住院患者(或保健對象)臨牀診療和指導幹預的數字化醫療記錄,包括患者歷次就診的人口學信息、生命指徵、診斷、實驗室檢查、用藥、影像學檢查、既往病史、免疫接種史等[1]。

EHRs信息與臨牀研究中變數的對應關係:

(圖片來源於《協和醫學雜誌》)

EHRs信息可對應臨牀研究中的不同角色,提示利用EHRs開展臨牀流行病學研究的可行性。但由於EHRs信息的收集是基於臨牀診療需求,因此患者使用何種藥物、進行何種檢查以及被隨訪的頻次等均受到患者及醫生抉擇的影響,最終影響對疾病患病率、發病率及暴露因素風險的估計。同時,基於不同環境建立的EHRs,如某單一醫療機構EHRs、區域醫療健康資料庫,其涵蓋的人羣特徵、用藥信息、檢查、診斷及其他個人信息(如人口學特徵、生命指徵、家族史及個人史等)的數據特點不同[2],導致在回答臨牀研究問題的優勢與侷限性方面亦不同。

我國目前各醫院EHRs的現狀分類:

(1)以各種臨牀業務為中心,患者信息散落在多個相對獨立的系統中;

(2)對於大部分三級醫院,各醫療機構內部已實現了以患者為中心的信息收集,但資料庫中僅涵蓋了患者在該醫療機構的就診信息;

(3)極少數城市已實現建立區域化的EHRs,解決了區域內各醫院數據的信息共享。研究者需根據所使用的EHRs特點來確定其可能回答的臨牀研究問題,並對結果進行合理解釋。

2基於電子病歷資料庫可以解決的研究問題

EHRs作為針對患者臨牀診療相關健康信息的縱向電子記錄,可實現對疾病轉歸及診療全過程的評估。

A.描述疾病的流行病學特徵及分佈,

B.探討疾病的療效或病因,

C.評價真實就診環境下的依從性、療效,以及政策對於臨牀用藥的影響等。

針對不同科學問題,其對應的研究設計方法不同,包括:

橫斷面研究、生態學研究

病例對照研究、隊列研究

下文主要針對疾病流行病學特徵分佈、療效研究以及政策對於療效評價的影響等進行討論。

2.1疾病流行病學特徵及其分佈描述

2.1.1患病率

患病率是指研究特定時間點或期間某特定人羣現患病者所佔比例,明確目標人羣並實現準確診斷是獲得真實患病率估計的前提。

疾病患病率的估計通常基於嚴格的抽樣調查而獲得,耗時耗力。而EHRs中涵蓋的大量患者的臨牀診斷及檢驗信息,為在較低成本下描述疾病的發病率及患病率提供了可能。

以一項利用醫院數據估計炎症性腸病(IBD)疾病分佈為例,該研究納入了中國香港1981至2014年7個區13家醫院就診的IBD患者信息,以每年13家醫院IBD就診人羣除以當年香港人口數來估算當年IBD患病率[5]。估算的前提是此13家醫院覆蓋95%的香港IBD患者,能否依靠EHRs來估計疾病患病率的前提是能確定產生病例的「源人羣」。但更多情況下,尤其是基於某單一醫療機構的EHRs,由於不能確定EHRs中病例的「源人羣」,即不能獲得計算患病率所需的分母,此時只能計算構成比而非患病率。同時研究顯示,即使能獲得EHRs對應的「源人羣」,其最終獲得的患病率估計與人羣調查獲得的患病率之間仍存在差別,其差別的方向與疾病特徵、年齡、性別等密切相關[6-7]。

2.1.2發病率

EHRs作為針對患者臨牀診療相關健康信息的縱向電子記錄,原則上研究者可利用其構建回顧性、前瞻性或雙向隊列以估計發病率。但其根本問題是不能僅僅依賴EHRs區分新發和現患病例。對於上述情況,可採用查病歷或補充調查的方法應對,但其工作量大,費時費力,同時對於無住院病歷的患者很難實現病歷查詢。研究者提出了多種解決EHRs新發病例確定問題的方法。最簡單的方法是將首次診斷日期確定為新發日期,但前提是該資料庫能長時間覆蓋某個區域或全國人羣,同時疾病嚴重程度高[8]。但對於大多數疾病,尤其是慢性病,上述方法並不能很好地區分新發和現患病例。

Mamtani

等[9]的研究顯示,採用Joinpoint回歸通過確定不同時間間隔糖尿病發病率的變化拐點能較好區分EHRs中的現患與新發糖尿病患者。其他更複雜的方法,如基於回溯生存分析或等候時間分佈等方法也越來越多被應用於EHRs數據中新發病例的確定[8]。

2.2療效評價

EHRs為在真實臨牀就診環境下開展療效研究提供了可能。

中國臺灣Wu等[10]基於全民健康保險研究資料庫開展了「慢性乙型肝炎患者抗病毒治療對肝癌發生影響」的研究,探討核苷類似物抗病毒藥物治療是否可減少慢性乙型肝炎患者肝癌的發生風險。

為此,該研究納入了1997年1月1日至2010年12月31日臺灣地區所有被診斷為慢性乙型肝炎[國際疾病分類-9(ICD-9):070.2,070.3和V02.61]至少3次,同時使用核苷類藥物或保肝藥物,並排除合併其他病毒性肝炎、艾滋病病毒感染以及在隨訪前3個月發生肝癌的患者。其中使用核苷類藥物≥3個月者被定義為抗病毒治療者,<3個月者被定義為非抗病毒治療者。

通過上述入選和排除標準,199 451例慢性乙型肝炎患者中72 458例納入該研究。對於使用抗病毒治療者,隊列隨訪起點為首次核苷類藥物處方時間,而對於非抗病毒治療者,則以首次使用保肝類藥物為隨訪起點;隨訪終點為發生肝癌、死亡或2010年12月31日。

最終研究顯示,抗病毒治療者發生肝癌的風險較非抗病毒治療者減少63%(HR=0.37,95% CI:0.34~0.39)。

實現上述研究的前提主要包括以下3點:

(1)研究人羣代表性問題:中國臺灣1997年開始實行強制性全民醫保覆蓋,同時所有乙型肝炎抗病毒藥及保肝葯均可報銷,保證了所有可能使用抗病毒藥物者的納入;

(2)可明確獲得慢性乙型肝炎診斷時間和用藥時間,保證了暴露信息及隨訪起點的可獲得性;

(3)該醫保資料庫中災難性疾病患者登記資料庫保證了結局信息的可獲得性。但由於EHRs是基於真實就診環境的數據收集,治療不僅僅是一種暴露因素,更是一種臨牀決策,患者是否使用核苷類抗病毒藥物受年齡、疾病嚴重程度、經濟水平等多方面因素影響,導致使用核苷類藥物者和未使用者在可能影響肝癌發生的因素分佈上不可比,即存在選擇偏倚,因此在分析時需要採用統計分析方法進一步控制。

除了選擇偏倚外,當利用EHRs開展臨牀療效研究時,通常還會面臨一系列刪失問題,包括不能保證獲得每個隨訪者的結局(右刪失)、不知道每個患者何時開始治療(左刪失)。右刪失可通過生存分析方法解決,但左刪失則需通過精巧的設計來避免。例如,在利用EHRs評價HBeAg陽性患者HBsAg滴度水平對未來HBsAg陰轉的預測價值時,由於很難根據EHRs確定患者首次治療時間,此時可結合臨牀實際意義,選擇HBeAg陽性患者中發生HBeAg陰轉的患者作為研究對象,從而確定隨訪起點。

2.3政策對療效評價的影響

臨牀藥物使用與醫保政策密切相關。醫保政策對患者臨牀藥物使用及療效的影響不太可能使用實驗性研究來評價。

Qiu等[11-12]利用北京市某傳染病醫院的醫保和非醫保患者在政策執行前後的EHRs探討2011年7月1日開始執行的乙型肝炎抗病毒藥物醫保報銷政策對於慢性乙型肝炎患者抗病毒用藥種類選擇、用藥依從性及成本的影響,並開展成本效果分析,從而綜合評價該政策對於北京市慢性乙型肝炎患者用藥及療效影響。

但需注意的是,以單中心EHRs來評價患者用藥時可能會因「不能獲得患者在其他醫院或藥房拿葯的信息」而產生信息偏倚,因此有必要評價不同類型患者(醫保和非醫保患者)在政策執行前後在外院取葯的信息來校正可能產生的偏倚[11]。

3基於電子病歷資料庫開展臨牀流行病學研究面臨的問題

與科學研究驅動的研究設計不同,EHRs為基礎的研究相對更省時省力、樣本人羣更大。然而,基於EHRs,尤其是基於單中心的EHRs研究,仍然面臨人羣代表性、影響暴露因素與結局關係的混雜因素在人羣分佈不均勻、混雜因素收集不完整、數據收集不準確等一系列問題,從而最終使研究結論產生系統誤差。下文著重討論選擇偏倚和混雜偏倚的控制。

3.1選擇偏倚

當總體人羣中單一個體進入樣本的概率與暴露及結局因素密切相關,導致樣本人羣與總體人羣在暴露因素與結局相關的特徵分佈上出現系統誤差,則可能產生選擇偏倚。

對於基於EHRs的研究來說,產生選擇偏倚的原因包括但不僅限於以下幾方面:

(1)入院率偏倚,即患者的年齡、性別、疾病嚴重程度、地域特點、醫療保險狀態等均可能影響患者是否到醫院就診或是否到某個醫院就診,從而最終影響EHRs人羣的代表性。

因此,在使用EHRs開展臨牀研究時,有必要對患者年齡、性別、種族及其他相關人口學特徵與總體患者人羣比較,以評價研究對象的代表性。

例如,如果想利用北京市某傳染病醫院的門診及住院EHRs來估計慢性乙型肝炎患者的直接醫療費用,則需評價在該醫院就診的慢性乙型肝炎患者年齡、性別及疾病嚴重程度相關指標與總體慢性乙型肝炎患者人羣的可比性。

(2)數據缺失,尤其是非隨機缺失。仍以利用EHRs評價HBeAg陽性患者HBeAg陰轉時HBsAg滴度水平對未來HBsAg陰轉的預測價值為例,由於臨牀並非所有慢性乙型肝炎患者在HBeAg陰轉時均會行HBsAg滴度檢查,此時如果有HBsAg滴度檢查的患者疾病嚴重程度指標與未行檢查者不可比,則會產生選擇偏倚,從而最終影響對HBsAg陰轉的預測。探討數據缺失的機理(完全隨機缺失、隨機缺失或非隨機缺失)是評價缺失對於研究結果影響的關鍵。

3.2混雜偏倚

基於EHRs的療效或病因學研究中,由於治療不僅僅是一種暴露因素,更是一種臨牀決策,患者是否使用某種治療受患者年齡、疾病嚴重程度、經濟水平等多種混雜因素的影響,如何控制混雜因素是基於EHRs開展臨牀療效或病因研究的關注熱點。

以Wu等[10]開展的抗病毒治療是否降低肝癌發生風險的研究為例,對最終納入的符合入選和排除標準的47

611例未使用抗病毒藥物和24 847例使用抗病毒藥物治療的患者基線特徵分析顯示,除年齡外,其他所有可能影響結局發生的因素如其他藥物使用情況、主要共患病、肝硬化程度等均顯著不同,提示控制混雜因素的必要性。目前除在研究設計階段採用匹配或限制方法控制混雜因素外,還可在分析階段採用傳統控制混雜的統計方法,包括分層分析、多因素分析等[13-15]。隨著現代流行病學的發展,研究者們提出了傾向性評分法[16]、工具變數法[17]、雙重差分法[18]等新的控制混雜偏倚的方法。

傾向性評分以給定的一組協變數,通過構建協變數與處理因素之間的函數關係,確定任意一個研究對象劃分到處理組的概率,即傾向分值。基於估計的傾向分值,傳統的傾向性評分方法包括傾向性評分匹配法、分層、協變數校正(又稱回歸法)和加權法。

仍以Wu等[10]的研究為例,研究者以是否接受抗病毒治療為因變數,以年齡、性別、主要共患病、肝硬化程度、其他藥物使用情況等為協變數,建立Logistic回歸模型,估算72

458例患者進入抗病毒治療組的概率,即傾向分值。依據傾向分值按照最臨近卡鉗匹配法為每例抗病毒治療患者匹配一例對照,匹配後的抗病毒治療組和非抗病毒治療組患者傾向分值的分佈基本吻合,提示依據傾向分值抗病毒治療組和對照組在協變數的整體分佈上具有可比性;同時該研究對匹配後抗病毒治療組和對照組每個協變數是否均衡可比進行了檢驗(但檢驗均衡性的統計分析方法並不合適,通常建議採用標準化差別的方法以校正樣本量的影響)。最後通過比較匹配後的兩組人羣肝癌的發生率差異來評價抗病毒藥物的長期療效。

傾向性評分方法能否準確控制混雜偏倚的前提是如何構建協變數與處理因素的模型,從而準確估計傾向分值。目前納入什麼協變數仍然存在爭議。

以傾向性評分匹配法為例,Austin等[19]的研究顯示,僅納入與處理因素有關的協變數與其他納入協變數的方法(包括僅與結局因素有關或同時與協變數和處理因素有關)相比,會導致可匹配的對子數減少,從而導致處理效應估計值的精度下降。需注意的是,最終確定哪些協變數納入模型並不取決於模型擬合的好壞,而是基於傾向性評分匹配後處理組和對照組的各協變數分佈是否可比。

貝葉斯傾向性評分則在傳統傾向性評分基礎上,進一步將傾向性評分引入由現有數據建立的結局事件與處理因素、協變數構建的聯合分佈模型[20-21]。通過該分佈模型可同時控制測量和未測量的混雜因素,包括缺失數據影響,從而獲得比較真實可靠的效應值[22-25]。但其計算量大,需藉助馬爾科夫鏈蒙特卡羅法實現。

例如,在利用醫院病歷資料庫評價他汀類藥物對急性心肌梗死患者全因死亡率的影響研究發現,貝葉斯傾向性評分法較傳統logistic傾向性評分所獲得的效應值更準確,置信區間更寬[20]。

由於EHRs主要是因臨牀診療需要而構建,影響疾病預後的很多環境或遺傳暴露因素很難在臨牀實際就診記錄中收集,因此控制未測量混雜因素在基於EHRs的研究中顯得尤為重要。對未測量混雜因素的處理方法包括工具變數法[17]、雙重差分法[18]、基於傾向性評分法的敏感性分析等。

工具變數法主要是通過找到一個合適的變數,該變數與研究結局及混雜因素無關,僅與處理因素有關,將變數替代實際處理因素,通過比較不同工具變數狀態人羣結局的差異得到不同處理因素效應值的無偏估計[26]。

例如Stukel等[27]基於1994至1995年全美566個冠狀動脈造影服務機構急性心肌梗死患者的研究,由於不同服務機構患者疾病嚴重程度無差別,但30

d內接受心導管術的患者比例(即心導管手術率)不同,因此將不同地區心導管手術率作為工具變數,通過比較不同心導管手術率患者7年生存率的差別來評價心導管手術對於患者長期生存的影響。

雙重差分法則主要用於幹預效果評價研究[28]。

例如,黃遠飛等[29]分別從2014年和2015年廣州市南沙區城鄉居民醫療保險的就診數據中分別抽取農村和城鎮參保人各800人,評價廣州市2015年1月1日開始執行的城鎮居民基本醫療保險和新型農村合作醫療整合政策效果。由於整合前原新農合和城鎮居民醫保的參保人在醫療保險待遇、年齡、性別、家庭規模、患病情況等方面均可能存在差異,無法僅通過兩種類型參保對象之間的前後或橫向對比來分析政策實施對醫療服務消費的影響。故採用雙重差分模型法,將原新農合參保人定義為處理組,假設整合實施後其醫療服務支出和補償力度均增加,但城鎮參保人由於待遇提升幅度不大,對其醫療服務支出影響較少,將其定義為對照組;通過比較原新農合居民政策前後醫療總費用及自付比例改變與城鎮參保人政策前後醫療總費用及自付比例改變,同時校正參保人性別、年齡、慢性病患病情況以及家庭規模等變數,來評價新的政策對新農合患者的影響。

4結語

綜上所述,在目前這個充滿前景、陷阱和挑戰的大數據時代,仍需回歸流行病學的本質,結合EHRs的具體特點和所提出的科學問題,充分考慮研究設計、數據分析等過程中出現的偏倚,並結合巧妙的設計和合理的統計學分析方法才能真正實現EHRs與臨牀研究的整合。

參考文獻略


推薦閱讀:
相關文章