紮實解決人工智能的核心問題

9月20日，2018深圳國際BT領袖峯會在深圳會展中心5樓舉行，大會主題爲“引領精準醫療，共享健康生態”。

會上，中國工程院院士、國家心血管病中心主任、中國醫學科學院阜外醫院院長鬍盛壽發表了主題爲“智慧醫療——離我們很近，也很遠”的演講。以下爲演講實錄：

先生們、朋友們，大家上午好！

很高興受邀在這裏進行演講，我是一名心臟外科醫生，心臟動脈搭橋手術、心臟移植是我的專業，我同時作爲國家心臟中心的主任和心血管重點實驗室的主任，在健康大數據和智慧醫療這個領域裏，我們做過很多探索，所以非常高興有這樣的機會在這裏和在座各位就我們的粗淺認識和大家進行分享。

中國工程院院士、國家心血管病中心主任、

中國醫學科學院阜外醫院院長胡盛壽

我演講的題目是“智慧醫療——離我們很近，也很遠”。首先說智慧醫療似乎離我們很近，爲什麼這樣講？

如果我們自己要在Google查閱一下最時髦關鍵詞，出現頻率最高的關鍵詞，大家一定會發現，以下這些關鍵詞搜索的頻率會非常高，特別是大數據，包括人臉識別。在這些關鍵詞頻繁出現的背後，預示着我們國家在大數據、智慧醫療領域裏已經發生了深刻的變化。

但是我們要問，大數據或是基於大數據的智慧醫療興起的背後如此的熱門，我們怎麼看待？大家可能要問，這一次的人工智能熱潮炒得很熱，不光是專業領域，老百姓的心目中也產生了非常大的共鳴，主要得益於有一件事情在老百姓、專業人士中都產生重要影響，就是Alpha Go。

2016年Alpha Go學習人類的棋譜，以4:1戰勝了韓國最知名的九段棋手李世石。2017年5月Alpha GoMaster問世，實現人類棋譜自我對弈，3:0戰勝我們國家頂級九段棋手柯潔，第三盤輸的時候，柯潔流下傷心的眼淚，這個畫面影響很多人。2017年12月Alpha Go的升級版zero出臺以後，和上一代Master進行比拼，100:0完勝上一代，預示着人類的智慧在和所謂計算機的智慧之間的較量中給我們打開了完全不同的一扇窗。

人工智能迅速得到各國的關注，2016年10月12日白宮發佈《準備迎接人工智能未來》，2017年7月8日國務院印發新一代人工智能發展規劃，金小桃主任就是這個項目很重要的執行方面，各大院校對於人工智能的關注更是風起雲涌，北京大學、清華大學、南京都建立了人工智能專業，人工智能甚至已經進入了中學的教材。

人工智能在醫療領域也取得了很多的進展，比如說科大訊飛智慧醫療的助理醫療參加2017年國家執業醫師資格考試比試，排名前5%。天壇醫院進行人機大戰，準確率遠遠超過醫生們的答卷。

其他很重要的專業雜誌、頂級期刊，過去幾年中，智慧醫療成爲發表最重要論文的領域，美國FDA已經審批通過12個泛AI醫療產品進入臨牀，比如說Apple Watch 、Dr Master。

大量的企業紛紛踏入這個行業，百度大數據醫療，阿里健康，似乎智慧醫療離我們很近，但是我們要看到另外一面，它又似乎離我們還有一段距離。

比如說智慧醫療昔日的老大Watson腫瘤診斷在全世界範圍內，所有使用最廣泛的智慧醫療工具，Watson在jeopardy節目上打敗人類，2016年Watson診斷罕見白血病只花了十分鐘。

但2018年Watson的股價持續下跌，健康部門裁員70%，一方面是工具初步得到了認可，一方面是他們的產業自身發展的艱難，形成了很大的反差，可能人們要問爲什麼。

中國的情況也是一樣，醫療人工智能產業雷聲大雨點小，落地非常困難。智慧醫療市場規模，2018年超過200億，新成立的公司不斷出現，醫療人工智能的熱度不斷高漲，到目前爲止國內還沒有一款真正的智慧醫療的產品通過了FDA的認證，用於到臨牀。

這裏我想從三個方面，就我們自己的認識和在座各位做分享，智慧醫療的產業鏈條中包括三個非常重要的環節：一是研發；二是應用；三是評價監管。

研發到應用，應用反過來促進研發，評價和監管始終貫穿研發到應用的全生命週期。

講到智慧醫療的研發自然提到數據，數據、算力和算法這是智慧醫療的三駕馬車。

我們首先講一下算力，也就是我們通常所說的硬件，應該說在過去的二三十年中，計算機技術的硬件已經得到了長足的發展，無論是從CPU到現在的GPU，它的硬件應該講是快速的發展，還在不斷的更新，比如說並行計算，技術得到了非常大的跨越，硬件發展的速度非常快，爲智慧醫療奠定了所謂的物質基礎。

但是我們不得不看到，目前使用的主流深度學習計算機平臺均是國外公司開發的，需要將數據上傳到雲端，自然存在數據全方位安全性的問題，東西都存在雲端別人的手上。

廣泛的基層醫療機構，醫療設施、信息化水平，還相距甚遠，簡單的話講，基層醫療機構用不起智慧醫療產品，第一代、第二代、第三代，硬件設施的進步在大多數的基層醫療機構有多少具備這個條件？

二是算法，概念和算法的不斷進步是人工智能發展的軟件基礎，從最早的人工智能到機器學習，再到當下的深度學習是在不斷演進，而且演變的過程實際上是充滿了爭議，而且充滿了不可預知。

軟件的開發和相對的硬件成熟形成了非常大的反差，其實我們現在所說的機器學習、深度學習只是整個人工智能軟件開發中的幾個小的分支，從這個意義上講，我們在算力、算法方面還有很長的路要走。

人工智能的學習我還要講另外一個話題，人工智能的學習和人腦的學習是完全不一樣的，比如說圖像的對稱學習，以這個爲例，人類只需要臨牀醫生幾十張圖的訓練，基本上有可以大致發現規律，但是從深度學習來講，計算機則需要上萬圖像反覆的訓練才能得出這種結論。

這個圖可能在座的有些人見過，人工智能的核心，核心的問題與毫無相關混雜的因素常常會使人工智能造成混亂，肉眼看兩張圖是沒有差別的。肉眼無法分辨的幾個像素的改動，無法影響人類，但是讓人工智能可能會做出錯誤的判斷，這就是現在的人類和智慧醫療之間從軟件的開發角度不可忽略的路徑，我們怎麼跨過？

人工智能的學習原理仍然處在所謂的“黑箱”狀態，成爲醫療落地的障礙問題，時間的關係我不展開講，比如說深度需要到底學到什麼，是如何學習的？我們知道嗎？

智能醫療產品的診斷依據到底是什麼？比如說人工智能，比如說醫生得出診斷結果，它是怎麼出來的？我們如何監管它？出現錯誤如何修正？產品上市以後能否學習新的數據和自我的進化？這都成爲人工智能中我們看不見的東西，它是黑箱操作，這個意義上講，我們人類如何掌控它？

我再講另外一個要素就是數據，這張圖能很好的說明大數據的海洋裏，人類現在得到數據的量級，從它的完整性和系統性上講只是鳳毛麟角，比如說我們常見到的Watson和前不久開發出來的眼底疾病的診斷，僅僅是依據臨牀信息中的影像，臨牀中只佔30%，臨牀信息中的百分之幾是所謂的影像數據，也許是百分之零點幾的數據產生Watson，你說它能正確的判斷腫瘤疾病的產生？從數據的完整性、系統性的角度講，現有的智能產品失真的可能性有多大？可想而知。

智慧醫療的核心就是數據的要求，我們還是講IBM的Watson，它與MSK腫瘤中心專家合作四年，完成60萬份臨牀病例標註，現在還有專家不斷更新數據，我們國家張康教授團隊在CELL雜誌上發表人工智能用於診斷眼底圖象的文章，研究團隊獲取20萬OCT圖像，初篩後淘汰一半，經不同級別醫生三輪的注視用於機器的學習，這個過程很漫長，處理圖像只是很小的一部分。

最後是要採取工具和人的使用，各類比賽用的人工智能完勝醫學專家至今卻是沒有一個人工智能用於臨牀，國內做了很多，包括衛生部考試中心做的模擬的，我記不清山東還是浙江做了一個考試系統，一個是機器、一個是人蔘加同樣的考試。訓練和比賽用的一套數據題，相當於提前放出題庫，考試只是考的原題，訓練場景沒有經過清洗、標註，實際應用場景數據是千差萬別，參差不齊的，這個意義上講，兩者之間沒有什麼可比性。換句話說，所謂的機器打敗人類，後面是偷換了概念，從數據的角度講，兩者之間根本就沒有可比性。

國內臨牀醫療數據可利用率低下，這是我們不可迴避的事實，高危篩查項目對全國3602個機構全方位進行分析，數據之所以可以用，它與結構化、電子化的程度統一規範是緊密相連的，缺了這個數據再多也是垃圾。

數據的完整性和真實性在我們國家是堪憂的，我這裏講的內容比較多，時間的關係不能展開。比如說診斷行爲不規範，信息產生、採集的錯誤百出。

我是一個心臟外科醫生，也是一家醫院的院長，我們電子病例經常查，全國很多醫院，非常知名的醫院，抽查門診病例，合格率能達到50%到60%已經相當不錯了。經常在醫院性別搞錯了，比如說很多醫院說男性有月經史的情況，這種比比皆是的錯誤，基於這種錯誤能作爲未來醫療的智慧數據採用嗎？

醫療機構爲保證醫療質量、漂亮，併發症、死亡率數據的失真是不可迴避的客觀事實，醫療、社保、安全系統信息的不互通仍然造成我們很多的數據孤島，信息的敏感性、信息孤島現象在當今醫療領域裏其實是非常普遍的現象，如果說用不真實的數據培育、產生出來的智能產品大家可以想象，很可能不僅是貽笑大方，很可能是產生更加危害的結果。

所以數據是關鍵，數據是智慧醫療的核心，基礎不穩沒有真實的數據做依託，你產生出來的產品一定是效率低下甚至可能是貽害大方的。

從這個意義上講，本來國家心臟中心、和深圳市政府要籤一個合作協議，和社保數據庫系統、醫院數據庫系統，開發基於大數據的基層醫療衛生服務能力提升的命題，我們團隊聯合耶魯大學和牛津大學的團隊一塊對深圳的三大數據庫系統進行初步的觀摩，實際上發現這中間數據的可利用程度實在是堪憂的，數據的標準化、規範化完全不一，很多人說我用了多少數據，如果數據不是真實、不是完整的、標準不是統一的，它不叫數據叫條目，所以要從底層完善數據的標準化、結構化、規範化，是成爲智慧醫療最關鍵的基礎。

第二，應用，智慧醫療產品，任何一種產品的應用發生在患者之間形成的關係，我們的智慧醫療工具可以輔助醫生，也可以間接的輔助患者，同時醫生又可能成爲監督智慧工具的方面，三者間到底是什麼樣的關係？很大程度上要取決於應用過程中不同產品在不同場合、不同的領域、不同的疾病中確定相互關係，沒有一個是可以公用的。這就構成在應用領域裏使用更加複雜，而應用的過程決定了這個產品是否有價值。

從臨牀應用的角度看，有很多的問題遠遠沒有解決，需要反覆的臨牀實驗確定，什麼纔是正確的應用？我們在使用某一個工具，不是所有人拿在手上多能用，怎麼用？什麼是正確的使用？這個產品什麼是他的合理使用範圍？應用的流程和路徑應該怎麼樣確定？如何建立檢測手段和標準？都成爲應用中我們必須系要去跨越的，我們必須要解決的問題，才能促進產品真正的健康、有效率的使用。

美國過去幾年中，美國FDA對AI的產品認證已經初步形成一個流程，無論按照一類、二類、三類產品申請，初步形成了一個流程，其中很重要的是要確認原來產品中的可對比性，按照分類標準確定一、二、三類，不同類別的產品進入不同的路徑審批。美國FDA批准12個泛AI的醫療產品，PMA還有510K等效的醫療器械，還有Denovo的新分類，12個泛AI的醫療產品中，僅有兩個是按照三類醫療器械審批，其餘做了類化和簡化，也是初級版的初級階段。

舉一個例子關於IDx-Dr，主要是檢測糖尿病、視網膜眼底病變的篩查軟件，輸出最後的結果，檢測到高精度的糖尿病視網膜病變，轉診至專業人士，未檢出高度的視網膜病變強行要求做複查，圖像不清楚的一定要排除在外，他是隻做診斷不做治療，嚴格限定應用場景。

臨牀評價來講，2012年到2014年，美國五個中心600例隨機前瞻性的對比研究，2017年做了多中心非隨機的橫斷面的觀察性研究，然後再去預測、發現軟件或是智能工具，在哪些場合應用、哪些層面應用的敏感性、準確性，最後得出結論，只適用於初級的篩查。

IDx-Dr 軟件的批准過程，首先是要做突破性資格申請；二是軟件認證預確認；三是臨牀試驗；四是重複性研究，24個人各10次，達到99.6%的一致性；五是圖像採集培訓課程認證；六是廠家制定會引起產品重大變更的技術規格特徵。審批的過程花了將近七年的時間，還不包括研發。

一個人工智能產生遠非我們想象那麼簡單，國內至今還沒有一個人工智能、智慧醫療的產品進入臨牀，也沒有相應的審批途徑，在這裏面剛剛開始討論，長春長生疫苗事件，開了一系列的研討會，是我們如何應對人工智能產品審批的問題，2018年8月1日真正開始，發佈《醫療器械分類目錄》新設泛AI類產品註冊，不給出結論診斷的按照二類醫療器械管理，並能提供明確診斷，對其風險進行相對比較高的識別，把它列爲三類醫療器械，僅僅是剛剛開始，還是專家層面參考FDA的討論版，它到底適不適合我們國家的現狀？是不是正確審批的途徑？現在打了大大的問號，無論是國家層面還是政府官員層面。

智慧醫療的評價其實不僅包括產品上市之後，研發開始，數據層面要對它進行監管、評價，算法層面上也要對它進行分析、監管，最後它用到患者進入臨牀實驗的時候必須要進行所謂的臨牀評價，三個環節我們設想一下，我們對AI的監管能力，觀念、行爲、路徑幾乎是個空白。

基於上面的認識和大家分享一點體會：

醫療人工智能我們還有很長的路要走，如果把算法和數據的有效性作爲橫座標，我們國家尚處在初級階段，第一階段是數據整合階段我們還沒做完，美國進入了第二階段，數據的共享和感知智能。第三個階段是認知智能+健康大數據，形成基於大數據智慧醫療產品臨牀的應用進入現實的醫療健康產業中，中美醫療智能反戰的差距，心血管大數據層面來看，現階段在於數據的有效性方面我們還有很大的距離。

發展人工智能，既看到我們有很大的弱點和不足，另一方面我們又有很大的優勢，全球領先的互聯網產業在深圳，比如說騰訊、華爲，比如說微信、淘寶我們走在世界的前列，已經積累了相當的資源和能力，加上13億人口，龐大的市場資源和需求，政府層面的大力支持。金小桃主任講的來自政府很多的政策指導思想等，都爲我國的人工智能發展提供了廣闊的前景。

我是臨牀醫生，講講現場的需求，大家都知道大醫院人滿爲患，我們國家醫療改革很重要的是要解決醫療配置合理的問題，優質醫療資源下沉的問題，解決基層服務能力的問題，大部分的常見病基層醫生可以診斷，我們如何提升基層醫生的服務能力，還是對基層全科醫生進行培訓嗎？猴年馬月能把家庭醫生、基層醫生培養成讓患者相信的基層醫生呢？傳統的路顯然是有很多問號或是走不通，我們需要藉助基於健康大數據的智慧醫生系統。

還是回到Alpha Go的例子，比如說中國的高血壓患者已經超過3個多億，難道所有的高血壓病人都需要到大醫院的門診就診嗎？基層醫生、家庭醫生很多人都不相信，我們開發了1.0版的高血壓醫生，設想一下兩三千種的高血壓藥物，藥代學、藥動學的量多大？哪個聰明的醫生可以記住，患者來講，個人的信息、家庭信息、遺傳背景因素，大量臨牀實踐積累起來的《指南》和對治療本身判斷效果得出的數據，三大類的數據集成在一塊，產生智能的高血壓醫生，哪個大醫院的高血壓主任能夠和它相提並論？這就是我們說的九段棋手和Alpha Go的較量。

這個層面上，智慧醫療在改變基層醫療公共服務能力方面是大有可爲的。一定要基於互聯網和智能技術的有效結合，單個的數據產生開始，數據的收集再到基於數據產生工具，再到基於數據對智能工具的使用進行監管，現在是我們正在探索的模式，我們接下來到深圳就是要做這個事情，縣級、國家級的數據中心，靠數據的結構化傳輸、集成產生產品，同時監測產品的應用，形成完整的鏈條纔是未來改善基層衛生服務能力很重要的舉措。

解決人工智能的核心問題，我們現在是需要平心靜氣、紮紮實實的做好基礎工作，以下這些方面我們都是剛剛開始，地基不牢出來的東西一定不會持久，甚至會誤人子弟。

基於數據的角度，國家衛生計生委出的電子病歷系統，貴陽也開了會，大家可以看一下，別說基層衛生，大醫院裏的數據結構性、完整性和準確性都是嚴重不足的，打好基礎的工作，做到數據的準確、完整、結構化我們的機器纔可讀，才能基於正確的數據產生正確的AI產品。

算法，針對不同類型的數據需要探索合適的算法，不是一招先走遍全天下，我自己不是學計算機，相信在場有很多做計算的，這個領域裏的空間是非常大的，還充滿奧祕，很多都沒有解決。

再就是解決人才的問題，智能工具產生的時候，搞數學、計算的人，臨牀醫生產生數據，還有做醫療評價的人，中間有一個一個需要我們跨越，培養複合型的專家人才，是我們解決未來在中國能快速產生高效率的智能工具非常重要的不可或缺因素。

我們需要搭建一個機制，各方面的人才聚集到一起，資金融入到正確的項目、正確人的身上，才能高效的產出我們需要的人工智能產品。

從政府來講，監管在一開始就要走在前面，再也不要置於背後被動的捱打，一個檢查產生一個重大的事件倒一批官員，害了一批患者。我們需要走在前面，從現在開始，從產品的開始研發階段，我們的監管系統就必須要進入。

我們究竟需要什麼樣的智能產品？需求導向，核心算法的智能化，用戶體驗智能化，無論爲創新、爲醫生、爲病人還是爲社會，它的價值、目的是不言而喻的。

人工智能不是一個新話題，其實是一個老話題，不是一個新鮮事物，1956年就開始講人工智能，我們經歷了第一次浪潮和第二次浪潮，現在是第三次人工智能浪潮的到來，前兩次起來一陣風浪很快過去，我們衷心的期待第三次浪潮的到來，真正形成可以持續影響我們國家基於大數據的醫療健康產業，這個領域我們國家應該有所作爲，也一定能有所作爲，謝謝大家。

來源：深圳國際BT領袖峯會及展會