高通量測序,或稱下一代測序(Next Generation Sequencing,NGS)方法在研究中的運用已經很廣泛了,它能產生非常豐富的信息量,有助於探索幾乎所有性狀、疾病的遺傳學特徵,已經對許多疾病的研究都做出了貢獻。
但放下研究者的滿腔熱血,還是要冷靜地想,這種方法並不是沒有偏倚,不恰當的設計仍然會帶來錯誤的結論。要避免偏倚則要從研究設計階段就做好控制,否則後邊執行或發文章時可糟心了。
NGS研究的設計有和其他研究的共同之處,但也有它自身的特色。近期BMJ上發文討論了NGS研究設計中的四個原則,是避免偏倚、假陽性等問題需要注意的,可供不太熟悉NGS的臨床研究者參考。
1設立實時對照組
要看一個遺傳變異是否與疾病相關,一般要設立病例和對照組進行比較。有些研究者就會選用現有資料庫中的數據作為對照組,自己收集病例組做新的檢測,以此節省成本。
儘管DNA突變相比於其他遺傳學特徵,如表達量、甲基化等,可重複性要好一些,但自己同時做個對照組仍然很有用,尤其是全外顯子測序(WES)及其他靶向測序的研究。
與全基因組測序(WGS)不同的是,WES和其他靶向測序應用商業生產的「釣餌」(捕捉探針)等工具來實現特定基因組位置的測序,而生產商可能會對這些產品如探針、試劑、儀器等定期更新,來提升覆蓋度。
而且,不同的歷史資料庫也有可能採用了不同的試劑、測序深度,或靶向不同的區域,或用不同的生信工具、流程進行處理。所以資料庫中的歷史數據是否仍能作為新樣本的對照呢?
如果沒有實時對照,若現在測出的跟歷史數據不一樣,則可能是由於技術不同,但卻會讓研究者誤以為是疾病和對照組的不同。進一步講,有自身對照、用同樣的技術流程去檢測就更好了。
還有一種兩步法設計,即用新樣本病例組的測序數據去跟歷史數據對比,排除常見變異,而剩下的變異再拿去跟新樣本對照組對比,這回用一種稍便宜的測序方法。不過如果能在第一步就用上一些新樣本對照組,或許能排除部分假陽性,總體上仍然降低成本。