談談公安領域聲紋資料庫的建設

作為聲紋識別領域從業人員，每次與客戶交流講解時，總會被問到一個很現實卻非常重要的問題：有沒有現成的聲紋庫？

眾所周知，要實現聲紋比對，需要有參照聲紋，用採集到的未知聲音與聲紋庫中的巨量聲紋進行比對，從而確定未知聲音的身份，若沒有此基礎聲紋庫，聲紋比對也就沒有應用的前提。

既然大家都知道聲紋資料庫的重要性，那麼，應該從哪裡獲取聲紋庫呢？很遺憾的是，聲紋不像人臉或指紋那樣，在公安部門做身份登記時強制進行採集，造成目前國家並沒有權威的聲紋庫，在每個聲紋的應用領域都需要自行建庫，以滿足各領域應用場景下的需求。

在公安領域中，聲紋識別是繼指紋、DNA庫後又一個生物特徵庫，為案件偵破提供一種新的技術手段，從而為各警種建立一套基於聲紋的新的個體識別應用平臺。公安聲紋識別應用系統通過預先建立的重點人員聲紋資料庫和應用基於智能語音技術的語音監控系統能快速確認說話人身份、語種、方言口音以及檢測通話中的敏感內容，為案件偵破過程提供新的線索和證據，對於提高辦案效率，優化辦案方式，提高辦案質量，提升案件偵破能力都將起到積極的推動作用，在維護國家安全、打擊犯罪工作中具有非常重要的意義。因此，公安機關聲紋庫的建設顯得非常重要。

公安機關聲紋庫具有數量非常龐大及覆蓋人羣非常多的特點，在產品設計上應具備靈活的體系架構，可以在保持整體架構穩定的前提下，通過不斷完善和擴展來保持整體系統的可持續發展。

聲紋資料庫按分庫建設為設計思想，根據聲紋的來源與特徵劃分為多個子庫，其中聲紋庫大類包括：

現場檢材庫：存放由用戶提交的檢材數據，這些數據源於未破案件的未知人員聲紋樣本。
人員樣本庫：庫中包含採集系統所採集的人員信息和聲紋，以及用戶所提交的比對樣本數據，這些數據都有明確對應的人員信息。人員樣本按人員性別、區域、口音、人員屬性等多個維度進行組織和存放，以方便後續的大規模1：N聲紋檢索。
專案聲紋庫：結合用戶在處理專案、專題時的業務場景，為了區別於其他的人員信息與聲紋數據，由用戶選擇建立專案聲紋庫，並將涉案的檢材與樣本上傳至該專案庫中存儲，以便於對重大案件的相關聯聲紋的統一管理；

聲紋庫建設中最重要的聲音來源主要包括兩大類：

存量錄音文件：一般在公安機關會有巨量的錄音文件，包括以往案件的錄音等，可從此存量錄音文件中提取有用部分建立聲紋庫。由於存量錄音文件存在不同的編碼格式及封裝格式，在處理上比較複雜，一般會經歷文件預處理、脫敏處理、聲紋特徵提取、聲紋特徵建庫等主要流程。
增量錄音文件：辦理身份證時，在個人身份信息採集流程中增加聲紋信息的採集，以逐步形成聲紋資料庫；

聲紋資料庫的建設可按分步、分人羣、分區域的原則進行，先對重點區域（如重點電話詐騙高發地）重點人羣（如抓進派出所的人羣）進行聲紋建庫，再逐步擴散到普通百姓，經過多期建設以形成越來越完善的權威聲紋資料庫。

聲紋資料庫的建設是一個長期持續的過程，但絕對是一個值得投入、利國得民的項目。聲紋識別作為最前沿的生物識別技術，隨著技術的成熟，將會在越來越多的應用場景下落地，我們相信在不久的將來，在第三代身份證上，聲紋將成為繼指紋、人像後又一個新增的公民身份ID。聲音將在我們未來的科技生活中扮演眼越來越重要的角色，在安全上承擔守衛的角色。

歡迎有興趣的朋友交流！