生物信息遇上Deep learning(2): VariantNet

前言

恩。。最近太忙了，一直在忙著自己的研究生毕业设计，刚刚才提交了初稿，很多内容没有及时更新，见谅见谅...

今天来讲讲基于DeepVariant框架的简化版，Simple Convolutional Neural Network for Genomic Variant Calling with TensorFlow

这是一个工程师的博客内容，他工作在一间单分子测序的公司，不算是一篇文章，但是思路还是很好的，和大家分享一下。

网页: 主要介绍了作者的一些动机和方法介绍

源码地址：也用tensorflow写的，不过框架相对简单

Motivation

深度学习的快速发展改变著对待基因组学的方式。许多初创企业都强调将人工智慧和机器学惯用于他们的研究和产品。但是工业上的公司更加注重于深度学习带来的对于传统工业行业的改变，谷歌的deepVariant改变了很多人对于想法，相比与对于直接数据的分析测定，一个端到端的网路的会有这么强的表现。

作者指出了如果使用deepVariant的计算流程用于异常检测，特别是在单分子异常检测的情况下，会导致信息的丢失，因为DeepVariant的计算流程其实是只用了例如base quality、变异位点序列信息等等，因此在原始序列转图像序列的过程中会产生信息的丢失，其次，deepvariant的网路也更加复杂，训练和计算都相对耗时，因此，作者希望通过设计一个专门用於单分子测序异常检测的演算法。