回覆列表
-
1 # 用戶7069005516323
-
2 # 用戶593377996846467
聲紋識別,生物識別技術的一種。也稱為說話人識別,有兩類,即說話人辨認和說話人確認。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵範圍時可能需要辨認技術,而銀行交易時則需要確認技術。聲紋識別就是把聲信號轉換成電信號,再用計算機進行識別。對於模式識別,有以下幾大類方法:
1、模板匹配方法:利用動態時間彎折(DTW)以對準訓練和測試特徵序列,主要用於固定詞組的應用(通常為文本相關任務);
2、最近鄰方法:訓練時保留所有特徵矢量,識別時對每個矢量都找到訓練矢量中最近的K個,據此進行識別,通常模型存儲和相似計算的量都很大;
3、神經網絡方法:有很多種形式,如多層感知、徑向基函數(RBF)等,可以顯式訓練以區分說話人和其背景說話人,其訓練量很大,且模型的可推廣性不好;
4、隱式馬爾可夫模型(HMM)方法:通常使用單狀態的HMM,或高斯混合模型(GMM),是比較流行的方法,效果比較好;
5、VQ聚類方法(如LBG):效果比較好,算法複雜度也不高,和HMM方法配合起來更可以收到更好的效果;
6、多項式分類器方法:有較高的精度,但模型存儲和計算量都比較大。
關於錯誤接受率FAR和錯誤拒絕率FRR,這兩個指標是聲紋識別算法的核心指標,用於表明算法的準確性,標準6.1中明確錯誤接受率FAR≤0.5%,錯誤拒絕率FRR≤3%。