第四章Illumina測序數據分析方法簡介
第一節 下機數據的初步處理一、CASAVA的運行和參數設置在Illumina數據下機後的輸出文件中,並不直接存在後續分析所需要的Fastq文件,需要通過bcl2fastq Conversion Software(v1.8.4;
http://support.illumina.com/ downloads/bcl2fastq_con version _software_184.html
)(該軟體原名為CASAVA,後更名為bcl2fastq)來實現。
(一)樣品清單
以處理Hiseq2500測序儀下機數據為例,在運行bcl2fastq時,需要提供所有樣本名稱與對應Index表格,稱為樣品清單(sample sheet),具體格式如圖4.1所展示;其中FCID為flow cell的編號;Lane列為樣本所在Lane編號;Sample ID列為樣本名稱;Index列為樣本對應的Index序列,同一條Lane的樣本不能使用相同Index;如果在同一條Lane中混合不同的測序樣本,建議盡量使每個樣本的Index與其他樣本之間至少有2個鹼基的差異;如果在HiSeq2500測序中引入了雙Index標記,在樣品清單中可以使用「-」連接兩組Index;Sample Project列為樣本所屬的研究項目名稱(project)。