語音信號重構方法
對語音信號進行分幀處理,觀測每一幀信號所包含的頻率分量,或者在時頻域對語音信號進行增強處理,需要用到短時傅里葉變換(Short Time Fourier Transform,STFT)技術。在得到STFT結果並處理之後,如何從短時傅里葉變換結果中重構出原始信號呢?針對語音信號重構,傳統的方法有Filter-Bank-Summation(FBS)和Overlap-and-Add(OLA)。從濾波的角度理解STFT,可以得到基於FBS的語音信號重構方法。從傅里葉變換角度理解STFT(對每一幀語音信號進行加窗處理,然後再對其進行傅里葉變換得到輸出結果),可以得到基於OLA的語音信號重構方法。
A. Filter-Bank-Summation方法
離散傅里葉變換表示為
(1)
離散短時傅里葉變換表示為
(2)
其中, 表示第 個頻點, 表示第 個頻點上面的窗函數。根據上式內容,可以將 看作是 經過一組濾波器並進行指數加權得到的結果。
根據 可得
(3)
令 ,那麼 可以表示為
(4)
對 兩邊進行傅里葉變換可得
(5)
其中, 的頻域響應。
假設在所有頻點上的窗函數都是一樣的,也即 ,那麼 。當 在頻域均勻採樣時,有
(6)
令 ,那麼上式可以表示為
(7)
令 ,可得
(8)
因此,由 和 可得
(9)
如果要保證 的解具有唯一性,需要短時傅里葉變換在時頻域滿足採樣定理。上述的信號短時傅里葉變換和信號重構可以用如下圖1所示內容描述。