回覆列表
-
1 # 老玩童
-
2 # 東北振興
一般的模式識別包括預處理,特徵提取,模式匹配等基本模組。
首先對輸入語音進行預處理,其中預處理包括分幀,加窗,預加重等。
其次是特徵提取,因此選擇合適的特徵引數尤為重要。常用的特徵引數包括:基音週期,共振峰,短時平均能量或幅度,線性預測係數(LPC),感知加權預測係數(PLP),短時平均過零率,線性預測倒譜系數(LPCC),自相關函式,梅爾倒譜系數(MFCC),小波變換系數,經驗模態分解係數(EMD),伽馬通濾波器係數(GFCC)等。
在進行實際識別時,要對測試語音按訓練過程產生模板,最後根據失真判決準則進行識別。
關注優就業,學習更多深度學習知識。
可以用語音識別晶片LD3320,電路圖你只要下了它的pdf就可以知道了,pdf裡面有典型的應用。 但我推薦你別用這個晶片,應為比較貴在100元左右。我推薦你用凌陽61微控制器,自帶語音識別模組,專為語音而生。而且官方提供很多函式,可以直接呼叫,並不需自己寫程式去控制聲音的中間處理過程。另外凌陽微控制器比較容易學習,比51還容易,而且是16位微控制器,相比51更有優勢。