先回答聲紋支付的原理——聲紋識別。
聲紋是生物識別特徵的一種,是在說話人發聲時提取出來的,可以作為說話人的表徵和標識,能與其他人相互區別的語音特徵,以及基於這些特徵或引數所建立的語音模型的總稱。
聲紋識別又稱為說話人識別,是從說話人發出的聲音訊譜圖中提取身份特徵資訊和聲紋特徵,再把聲訊號轉換成電訊號,用計算機透過相關演算法進行比對識別的技術。
這個過程可以和指紋識別、人臉識別類比著理解:聲音、指紋、人臉作為你的生物特徵具有讓你區別於別人的特殊性,然後技術可以提取出這些特殊性確認你就是你。因為人的發聲器官存在著大小、形態和功能上的差異,這些差異導致發聲氣流的改變,進而導致了聲紋的差異,最明顯的就是,大家能很明顯聽出不同人說話音色、音質的不同。當然,這是最明顯的差異,透過機器學習,演算法可以識別包括但不限於這些差異的更多抽象的高維特徵。
人耳透過聽音色、音調和說話習慣可以判斷一個人,同樣的,演算法透過提取聲音中明顯的、抽象高維的聲紋特徵,訓練模型,來判斷一個人。
再來說說“它可以被偽造麼?”
聽起來相似不等於聲紋相似 ,聲紋識別準確率已超過99%。但——聲紋作為金融產品的認證,需要看具體場景。對於輔助核實身份、名單識別、防欺詐、聲紋鎖登入等場景使用是合適的;但在大額支付類的場景中,如果將聲紋作為唯一的認證手段,就需要充分評估風險。
1、聲紋識別不等於語音識別
聲紋識別:是個性識別,透過提取語音中的聲紋特性,判斷說話人是誰,即“誰在說話?”;
語音識別:確切說我要講的是語義識別,是共性識別,判斷的是說話的內容,即“說了啥?”。
比如,現在很火的智慧音箱,能聽懂你的指令,就是語義識別,但音箱不一定知道下命令的是誰及這個人有沒有資格對我下命令。搭載聲紋識別功能後,你說“放一首歌”,音箱才知道是誰在下命令,從而根據你的聽歌喜好進行個性化推薦,如果有人冒充你,音箱不聽指揮,這叫“控制權限限定”。這一點其實非常重要,在智慧家居、智慧車載場景下,許多許可權都需要限定。比如,汽車只在爸爸的“啟動”口令下啟動,小朋友說啟動汽車不做反應,否則,emmm……
2、聲紋確認不等於聲紋辨認
聲紋確認(1:1):確定待識別語音是否來自其所宣告的目標說話人,即確認你是你的過程。比如,在網路支付中增加聲紋確認環節,每次支付時都需要驗證聲紋,以確定發出支付命令的這個人就是你。
聲紋辨認(1:N):判定待識別語音屬於目標說話人模型集合中哪一個人,也就是在N個人中找到你的過程。比如,公安部門在某起電信詐騙案件中獲取了一段犯罪分子的作案語音證據,可以把這段語音和公安部門此前已有的重點監管人員聲紋資料庫對比,看看這次作案的是不是從前的某個慣犯,從而鎖定目標縮小範圍。
先回答聲紋支付的原理——聲紋識別。
聲紋是生物識別特徵的一種,是在說話人發聲時提取出來的,可以作為說話人的表徵和標識,能與其他人相互區別的語音特徵,以及基於這些特徵或引數所建立的語音模型的總稱。
聲紋識別又稱為說話人識別,是從說話人發出的聲音訊譜圖中提取身份特徵資訊和聲紋特徵,再把聲訊號轉換成電訊號,用計算機透過相關演算法進行比對識別的技術。
這個過程可以和指紋識別、人臉識別類比著理解:聲音、指紋、人臉作為你的生物特徵具有讓你區別於別人的特殊性,然後技術可以提取出這些特殊性確認你就是你。因為人的發聲器官存在著大小、形態和功能上的差異,這些差異導致發聲氣流的改變,進而導致了聲紋的差異,最明顯的就是,大家能很明顯聽出不同人說話音色、音質的不同。當然,這是最明顯的差異,透過機器學習,演算法可以識別包括但不限於這些差異的更多抽象的高維特徵。
人耳透過聽音色、音調和說話習慣可以判斷一個人,同樣的,演算法透過提取聲音中明顯的、抽象高維的聲紋特徵,訓練模型,來判斷一個人。
再來說說“它可以被偽造麼?”
聽起來相似不等於聲紋相似 ,聲紋識別準確率已超過99%。但——聲紋作為金融產品的認證,需要看具體場景。對於輔助核實身份、名單識別、防欺詐、聲紋鎖登入等場景使用是合適的;但在大額支付類的場景中,如果將聲紋作為唯一的認證手段,就需要充分評估風險。
1、聲紋識別不等於語音識別
聲紋識別:是個性識別,透過提取語音中的聲紋特性,判斷說話人是誰,即“誰在說話?”;
語音識別:確切說我要講的是語義識別,是共性識別,判斷的是說話的內容,即“說了啥?”。
比如,現在很火的智慧音箱,能聽懂你的指令,就是語義識別,但音箱不一定知道下命令的是誰及這個人有沒有資格對我下命令。搭載聲紋識別功能後,你說“放一首歌”,音箱才知道是誰在下命令,從而根據你的聽歌喜好進行個性化推薦,如果有人冒充你,音箱不聽指揮,這叫“控制權限限定”。這一點其實非常重要,在智慧家居、智慧車載場景下,許多許可權都需要限定。比如,汽車只在爸爸的“啟動”口令下啟動,小朋友說啟動汽車不做反應,否則,emmm……
2、聲紋確認不等於聲紋辨認
聲紋確認(1:1):確定待識別語音是否來自其所宣告的目標說話人,即確認你是你的過程。比如,在網路支付中增加聲紋確認環節,每次支付時都需要驗證聲紋,以確定發出支付命令的這個人就是你。
聲紋辨認(1:N):判定待識別語音屬於目標說話人模型集合中哪一個人,也就是在N個人中找到你的過程。比如,公安部門在某起電信詐騙案件中獲取了一段犯罪分子的作案語音證據,可以把這段語音和公安部門此前已有的重點監管人員聲紋資料庫對比,看看這次作案的是不是從前的某個慣犯,從而鎖定目標縮小範圍。