從零開始生物信息學(4):序列比對-Blast演算法簡介

前言

Blast演算法的全稱是(Basic Local Alignment Search Tool)，中文叫做基本局部相似性比對搜索工具，在1990年由Altschul等人提出的雙序列局部比對演算法，是一套在蛋白質資料庫或DNA資料庫中進行相似性比較的分析工具。Blast程序能迅速與公開資料庫進行相似性序列比較。BLAST結果中的得分是對相似性的統計說明。還有，Blast演算法是一種啟發式的演算法。

為什麼需要Blast?

這是因為傳統的基於動態規劃的局部性比對性演算法例如常見的Smith–Waterman採用的是精確的序列比對，也就是演算法得到的是比對序列的局部最優解，雖然有著較好的比較結果，但是對於長度為n和m的兩個待比較序列，局部性比對演算法的時間複雜度有O(mn)，這個時間複雜度對於序列匹配來說代價太大，特別是當序列長度較長的時候。Blast是一種在局部性比對基本上一種近似比對的演算法。它在保持較高精度的情況下可以大大減少程序運行的時間，是大規模序列對比問題一個速度和精確性都可以接受的一個解決方法。因此Blast演算法很適合用於實際場景中。