如果非典時期大數據體系成熟,會給現在的新型冠狀病毒疫情帶來多大程度的幫助?
利益相關:
生物高中水平,化學大一水平的程序員一名。
目前也是AI行業水貨從業者一名。
作為目前被堵在武漢老家出不來的人,我說點實際的。
雖然前幾天對本地zf的xx行為大為震怒,氣得基本說不出話。
現在中央和解放軍來了,事情逐漸得到控制。
雖然還有硬仗要打,但至少開始轉向明朗。
先說一個觀點:
非典時期我們掌握的數據這次確實起了很大作用。
尤其是對RNA序列、氨基酸序列的掌握,保證了我們有大量的庫可以匹配。
如果從零開始攻關科研,進展的速度是不可想像的,時間代價也是不可承受的。
當然不會從零開始:
- 從確診試劑的研製、優化、量產,
- 到各種研究論文的火速產出,
- 再到新聞通稿迅速傳到到百姓,用科學的結論穩定民心,
一切都是合作和積累。
我以上說的每一條,都是幾天內飛速更新。
至少我自己過目了,鑒別了,並且分享了的。
絕不是空口白話。
然後談談這一周以來感受到的大數據和AI對於抗擊疫情做出的貢獻:
(以下表述中CS部分是我的專業領域,生物領域可能會接近小學生水平,望海涵。)
- 人口遷徙用大數據+可視化可以看的一清二楚,我不信有人在這個計算結果面前還能明目張胆地瞞報。這次省市兩級政府做得如何呢?請靜候任免通知。在那之前我們先一起抗擊肺炎。
- 傳染病模型有最基本的SIR,還有稍複雜的SEIR,這些作為起點,結合現在的ML、DL、RL方法去訓練模型,預測傳染病擴散趨勢。這比恐慌和指責有用。
- 本次肺炎病毒是RNA病毒,RNA、DNA測序涉及到大數據處理和模式匹配,找某些特定蛋白的表達位點,對特定序列進行分類和定位,從鹼基序列到氨基酸序列,這可以幫我們找出可能用於抗體研究的片段。對蛋白質的研究顯然不是從零開始,一旦你從鹼基序列里匹配到了,可能後面的抗原、抗體相關研究之前已經做過了,然後破案就會非常快。中間這個匹配過程就是一個序列標註+多分類的任務。改一行代碼修一個大bug,大家能嘗試理解嗎?
- 當恐慌情緒傳播,一方面高實時性的爬蟲爬取官方消息保證了推送質量,另一方面闢謠平台也在收集各路非官方消息進行antispam分析,避免輿情爆炸。這不也是平時整天說的大數據和演算法嗎?
從這次的論文、專業討論的更新頻率來看,危機關頭的跨學科合作是非常必要,而且卓有成效的。
我自己在家裡都跟醫學院的老同學保持高頻溝通,隨時同步最新進展。
同時,別忘了撐過艱苦卓絕期的武漢本地醫療隊伍和隨後馳援的全國各地醫療人員、志願者、解放軍們。
這些不需要太高深的科技,要的是一顆紅心+清醒的頭腦+足夠的力氣。
而對於那些造成「艱苦卓絕」的人,秋後。
最後,我目前還沒發病,狀況平穩。
希望各位平安度過這段時間,祝好。
希望有在前線的醫療人員、志願者、解放軍,和在後方研究病毒、試劑、疫苗的科研人員來回答這個問題。
在知乎上也看到幾位生物、醫學、藥學博士在實際參與科研,而且忙得團團轉。
只想說你們辛苦了,知識就是力量。
現在還是別打擾他們,他們都在忙著救命。
2020.1.26 01:16,
於武漢漢口家中。
首先,說明大數據的應用很廣泛,不僅僅是在科學研究當中(即在未來的醫療防護產生作用),並且能直接為傳染病預防提供依據。
從目前的防控傳染來說,著名的案例倫敦霍亂地圖,直接定位傳染源為水井。
案例詳見:
經典信息圖-1854年倫敦霍亂爆發?www.jianshu.com
那這次的新型冠狀病毒,是否大數據也有作用呢?
答案是肯定的。
1.傳染源的確定。
前期患病者均來源華南海鮮市場,且有一部分是密切接觸人群。封殺了華南海鮮市場這個主要傳染源,在一定程度上是有意義的。
(2020年2月10日,財新新聞,更新:該傳染源前期疫情發生有用,也有論文認為可能不是第一傳染源。確診條件可能導致華南海鮮市場傳染源這個結論的錯誤,詳情見文底鏈接:公開數據在疫情中能讓我們知道什麼?)
2.人口流動地圖。
在1月中旬,由於武漢前期潛在的輕度患者或者說疑似患者的流出給全國造成的潛在的隱患。於是,有公司提供了在華南海鮮市場的人口全國流動圖(圖來源微博):