NGS研究設計的四項基本原則

高通量測序，或稱下一代測序（Next Generation Sequencing，NGS）方法在研究中的運用已經很廣泛了，它能產生非常豐富的信息量，有助於探索幾乎所有性狀、疾病的遺傳學特徵，已經對許多疾病的研究都做出了貢獻。

但放下研究者的滿腔熱血，還是要冷靜地想，這種方法並不是沒有偏倚，不恰當的設計仍然會帶來錯誤的結論。要避免偏倚則要從研究設計階段就做好控制，否則後邊執行或發文章時可糟心了。

NGS研究的設計有和其他研究的共同之處，但也有它自身的特色。近期BMJ上發文討論了NGS研究設計中的四個原則，是避免偏倚、假陽性等問題需要注意的，可供不太熟悉NGS的臨床研究者參考。

1設立實時對照組

要看一個遺傳變異是否與疾病相關，一般要設立病例和對照組進行比較。有些研究者就會選用現有資料庫中的數據作為對照組，自己收集病例組做新的檢測，以此節省成本。

儘管DNA突變相比於其他遺傳學特徵，如表達量、甲基化等，可重複性要好一些，但自己同時做個對照組仍然很有用，尤其是全外顯子測序（WES）及其他靶向測序的研究。

與全基因組測序（WGS）不同的是，WES和其他靶向測序應用商業生產的「釣餌」（捕捉探針）等工具來實現特定基因組位置的測序，而生產商可能會對這些產品如探針、試劑、儀器等定期更新，來提升覆蓋度。

而且，不同的歷史資料庫也有可能採用了不同的試劑、測序深度，或靶向不同的區域，或用不同的生信工具、流程進行處理。所以資料庫中的歷史數據是否仍能作為新樣本的對照呢？

如果沒有實時對照，若現在測出的跟歷史數據不一樣，則可能是由於技術不同，但卻會讓研究者誤以為是疾病和對照組的不同。進一步講，有自身對照、用同樣的技術流程去檢測就更好了。

還有一種兩步法設計，即用新樣本病例組的測序數據去跟歷史數據對比，排除常見變異，而剩下的變異再拿去跟新樣本對照組對比，這回用一種稍便宜的測序方法。不過如果能在第一步就用上一些新樣本對照組，或許能排除部分假陽性，總體上仍然降低成本。