台湾 || 语言: 大陆简体港澳繁體台灣正體

第四章Illumina測序數據分析方法簡介

雪花台灣 2019-07-13 15:46

第四章Illumina測序數據分析方法簡介

第一節下機數據的初步處理一、CASAVA的運行和參數設置在Illumina數據下機後的輸出文件中，並不直接存在後續分析所需要的Fastq文件，需要通過bcl2fastq Conversion Software（v1.8.4; http://support.illumina.com/ downloads/bcl2fastq_con version _software_184.html）（該軟體原名為CASAVA，後更名為bcl2fastq）來實現。（一）樣品清單

以處理Hiseq2500測序儀下機數據為例，在運行bcl2fastq時，需要提供所有樣本名稱與對應Index表格，稱為樣品清單（sample sheet），具體格式如圖4.1所展示；其中FCID為flow cell的編號；Lane列為樣本所在Lane編號；Sample ID列為樣本名稱；Index列為樣本對應的Index序列，同一條Lane的樣本不能使用相同Index；如果在同一條Lane中混合不同的測序樣本，建議盡量使每個樣本的Index與其他樣本之間至少有2個鹼基的差異；如果在HiSeq2500測序中引入了雙Index標記，在樣品清單中可以使用「-」連接兩組Index；Sample Project列為樣本所屬的研究項目名稱（project）。

相关文章