如果是對一整條語音做 FFT,或者對一整張圖片做 FFT,那麼相位譜比幅度譜包含了更重要的資訊。
用 表示一條語音或一張圖片, 表示它的傅立葉變換, 和 分別表示 的模和輻角。
只用幅度譜進行反變換,就是求 。這表示把許多幅度不同、但初相都為零的諧波往一起疊加,結果就是它們在時/空域的零點附近(即語音的兩端、圖片的四角)相位一致,取得很大的幅度,而其它位置只有很小的幅度。這樣當然無法恢復出原始語音或圖片。
只用相位譜進行反變換,就是求 。這表示把許多幅度相同、初相不同的諧波往一起疊加。因為各諧波的初相不同,所以有希望在語音或圖片的各個位置都疊加出有意義的東西來。當然只是這樣說的話,說服力並不強。我們換一個角度,把 看成是原始語音或圖片 經過濾波後的結果。這個濾波器的幅頻響應為 ,相頻響應恆為零,其單位衝激響應為 。注意這也是把許多幅度不同、但初相都為零的諧波往一起疊加,所以其結果與 類似,也是在時/空域的零點附近取得較大的幅度,或者說形成一個並不寬的波包。濾波的效果是用這個波包與原始訊號去卷積,因為波包不寬,所以對原始訊號的破壞不大。
注意上面說的都是對「一整條語音或一整張圖片」做 FFT。
實際中對語音很少這樣操作,都是分幀後做短時 FFT,得到語譜圖。在語譜圖中,大部分資訊就是包含在幅度譜而不是相位譜中了。
對於影象來說,也可以類似地去做局域 FFT,但這種做法似乎並不普及。
大概思路有兩種吧,一種直接求,如圖,另一種,可以令z=ejw,化z域零極圖,用零向量與極向量關係(可以參考奧本海默第二版)
如果是對一整條語音做 FFT,或者對一整張圖片做 FFT,那麼相位譜比幅度譜包含了更重要的資訊。
用 表示一條語音或一張圖片, 表示它的傅立葉變換, 和 分別表示 的模和輻角。
只用幅度譜進行反變換,就是求 。這表示把許多幅度不同、但初相都為零的諧波往一起疊加,結果就是它們在時/空域的零點附近(即語音的兩端、圖片的四角)相位一致,取得很大的幅度,而其它位置只有很小的幅度。這樣當然無法恢復出原始語音或圖片。
只用相位譜進行反變換,就是求 。這表示把許多幅度相同、初相不同的諧波往一起疊加。因為各諧波的初相不同,所以有希望在語音或圖片的各個位置都疊加出有意義的東西來。當然只是這樣說的話,說服力並不強。我們換一個角度,把 看成是原始語音或圖片 經過濾波後的結果。這個濾波器的幅頻響應為 ,相頻響應恆為零,其單位衝激響應為 。注意這也是把許多幅度不同、但初相都為零的諧波往一起疊加,所以其結果與 類似,也是在時/空域的零點附近取得較大的幅度,或者說形成一個並不寬的波包。濾波的效果是用這個波包與原始訊號去卷積,因為波包不寬,所以對原始訊號的破壞不大。
注意上面說的都是對「一整條語音或一整張圖片」做 FFT。
實際中對語音很少這樣操作,都是分幀後做短時 FFT,得到語譜圖。在語譜圖中,大部分資訊就是包含在幅度譜而不是相位譜中了。
對於影象來說,也可以類似地去做局域 FFT,但這種做法似乎並不普及。