最近在精讀一本書,開個系列做筆記。
書名《Audio Source Separation and Speech Enhancement》
editor: Emmanuel Vincent ,Tuomas Virtanen ,Sharon Gannot
出版:2018 Wiley
本文粗略介紹語音中的時頻分析。分兩大類:線性時頻變換與非線性時頻變換。
時頻變換過程略述,詳述為什麼和各自優勢。總結在文章末尾,沒時間的同學可以跳著看。
一、線性時頻變換
在語音中,線性時頻變換最常見的方法就是STFT了。其流程如下: