前言
恩。。最近太忙了,一直在忙著自己的研究生畢業設計,剛剛才提交了初稿,很多內容沒有及時更新,見諒見諒...
今天來講講基於DeepVariant框架的簡化版,Simple Convolutional Neural Network for Genomic Variant Calling with TensorFlow
這是一個工程師的博客內容,他工作在一間單分子測序的公司,不算是一篇文章,但是思路還是很好的,和大家分享一下。
網頁: 主要介紹了作者的一些動機和方法介紹
源碼地址:也用tensorflow寫的,不過框架相對簡單
Motivation
深度學習的快速發展改變著對待基因組學的方式。許多初創企業都強調將人工智慧和機器學慣用於他們的研究和產品。但是工業上的公司更加註重於深度學習帶來的對於傳統工業行業的改變,谷歌的deepVariant改變了很多人對於想法,相比與對於直接數據的分析測定,一個端到端的網路的會有這麼強的表現。
作者指出了如果使用deepVariant的計算流程用於異常檢測,特別是在單分子異常檢測的情況下,會導致信息的丟失,因為DeepVariant的計算流程其實是只用了例如base quality、 變異位點序列信息等等,因此在原始序列轉圖像序列的過程中會產生信息的丟失,其次,deepvariant的網路也更加複雜, 訓練和計算都相對耗時,因此,作者希望通過設計一個專門用於單分子測序異常檢測的演算法。
工作流程
具體的工作流程在作者的論文中已經給出: