一直以來,大數據與商業就密不可分。以前,覺得所有數據零散在每個角落,無法統計,讓多少市場因此無法描述用戶畫像,導致市場分析出現偏差、錯誤,影響整個決策力的制定和執行。現在,那些無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據,都被抓取和利用,具有5V特點【由IBM提出:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)】的大數據,正在明目張膽改變著各行各業。

醫學,當然也不例外。

醫學大數據的應用

醫學大數據的應用目前主要有兩方面,第一個是發現新知識、認識新規律,第二個是促進精準適度醫療,提升醫療價值。

以往受數據採集與分析能力的限制,醫學主要依靠抽樣研究來發現新知識、認識新規律,但不同樣本間的差距經常導致結論不一致甚至截然相反。隨著大數據技術的發展,醫學研究由抽樣的小樣本研究進入到超大樣本、甚至全樣本研究時代,從嚴格篩選患者入組進行研究到全面觀察各種影響因素的真實世界研究時代。美國 2015 年啟動了「觀察阿司匹林效果與劑量」的大規模觀察性醫學研究,多達 30 萬人參加基於大數據的觀察性研究得出的結論更具現實指導意義,甚至推翻了之前一些建立在小樣本數據基礎上的「科學」結論。

斯坦伯格 (Steinberg) 等人在 3 萬餘人兩年的保險記錄、化驗記錄、用藥記錄、就醫記錄中挖掘出新的代謝綜合徵預測模型,用 80% 的人作為訓練集,20% 的人作為測試集,在貝葉斯框架下依據最大熵原理,對數據中未知的參數進行分佈邊緣化來計算模型的結構概率,綜合考慮模型的複雜性和與數據的匹配性建立起新的預測模型,從 4000 餘個參數中篩選出腰圍、用藥依從性等與代謝綜合徵密切相關的因素。

隨著醫學的進步,源於個體的數據越來越豐富,包括組學數據、健康監護數據、影像數據等。計算機科學與醫學結合能夠挖掘出新的知識,開創新的診療模式。例如心理問題一般是通過臨牀觀察或自我就醫的方式被發現並診斷的,現實中缺乏客觀有效的診斷方法,而基於說話模式的數據挖掘,能夠發現患者條理表達能力的下降,進而成功預警心理問題,在小樣本人羣實驗中達到了 100% 的準確度。通過機器學習對一些複雜信息進行處理,也能對心臟病、哮喘、癌症等疾病作診斷和預測,能夠達到或超越專家的診斷水平。

適度醫療、精準醫療與大數據

精準醫療、適度醫療和過度醫療,三者既有聯繫,又有區別。做到精準醫療,不一定就做到了適度醫療,適度醫療更多的是對醫療價值層面的考量,關注獲益是否大於風險,以及獲益和成本的關係。由於多種原因引起的超過疾病實際需要的診斷和治療的行為或過程就是過度醫療。正如德國醫生尤格·布來克在《無效的醫療》一書中所說「很多不該喫的葯,喫了 ;很多不需要的治療,做了 ;很多手術會使病人更加痛苦,卻也在做。」在美國,40% 的醫療被認為是無效的。在我國,過度診療的現象也不同程度地存在。

當過度醫療如此猖獗,就需要大數據的參與和幫助,來實現適度醫療或精準醫療。為什麼過度診療會成為世界性的問題,其中一個重要的原因是個體的差異性,同一種藥物對不同人有不同的效果。而每個個體都是特殊的,每個人的健康卻是同等重要的,醫學大數據對數據的精準性有更高的要求和標準。

如吉非羅齊 (emfibrozil),它的上市應用主要基於赫爾辛基心臟研究,經過 5 年的雙盲實驗(一批人服用吉非羅齊,一批人服用安慰劑),實驗結果顯示用藥組比安慰劑組患心肌梗死的相對危險度下降了 34%,但實際上分析表明,用藥組的心梗絕對危險度僅下降了 1.4%,即 71 個患者治療 5 年時間,該葯只對 1 個人起到了預防心肌梗死的作用。如何能從這 71 個人中找到有效的那 1個人,即實現精準醫療,還需要通過大數據研究。

一方面要收集個人基因組、蛋白質組的數據,另一方面要收集個人行為、用藥、心理以及環境的數據,通過分析藥物組和服用安慰劑人羣中出現心梗和未出現心梗的人的特徵,從而區分出哪些人屬於不喫藥也不會心梗的(低風險),哪些人屬於喫了葯有效果的(預防了心梗),哪些人喫了葯也沒能預防心梗的,對於後者還要繼續分析原因,是藥物的劑量不足,還是有其他因素導致的心梗,這樣我們的治療和預防手段就會越來越有針對性,達到個體化的精準醫療。

趨利避害,醫療大數據還要走的更遠

當然,大數據如很多新潮工具一樣,也是一把雙刃劍,如果說做到量體裁衣、辨證施治是醫學大數據應用的重大課題,那麼它的前提基礎是擁有長期、全面、準確的人羣健康數據。對於不精準的那些「垃圾」數據,數據量越大,謬誤與危害越大。當前,大部分行業在數據基礎系統架構和數據分析方面都面臨著諸多挑戰,醫學領域也是如此。根據產業信息網調查,目前國內大部分企業的系統架構在應對大量數據時均有擴展性差、資源利用率低、應用部署複雜、運營成本高和高能耗等缺陷。

同時大數據的管理一直是一個難以控制的問題,由於大數據已經成為了一種商業資本,各地數據的流失、泄露和私下買賣越來越多,這也讓醫療屆的信息如同沒有關門的家園一般,毫無隱私,任人索取。醫療機密和個人患病信息的流失,令數據安全形勢變得複雜。

如此情況下,趨利避害,做好長期、全面、準確的人羣健康數據研究與管理,纔是醫療大數據的長遠之計

小邁的技術和研發團隊,一直沒日沒夜的奮戰在一線,蒐集海量數據進行篩選和錄入,力保展現給會員們的是最精準有效的高質量資料,未來,我們會更多的進行數據的深入統計、分析、研究,真正做到,跨國界醫療研發服務,讓天下沒有難做的醫療研發。

-END-


推薦閱讀:
相關文章