Google Duo新推出的WaveNetEQ音訊技術，對通話質量有多大的幫助？

首頁>Club>2021-01-18 05:59

Google Duo新推出的WaveNetEQ音訊技術，對通話質量有多大的幫助？

回覆列表

1 # cnBeta

據悉，其基於谷歌 DeepMind 部門的相關技術，旨在利用人工加入的噪音來抑制音訊的抖動。這種噪音聽起來就像人類在說話，但其實是透過機器學習技術產生的。

如果你曾經撥打過網路電話，那肯定多多少少地經歷過因連線不穩定而導致的音訊抖動。

當通話期間的部分音訊資料包在通訊過程中丟失、延遲過高、或順序錯誤時，就有可能發生這樣的情況。
谷歌表示，99% 的 Duo 通話都會出現資料包丟失，其中 20% 的丟失率超過 3%、另有 10% 的丟失率超過 8% 。

每款通訊應用都有采取某種方式來處理丟包問題，但谷歌表示，傳統的丟包掩飾（PLC）過程，或導致高達 60ms 的空缺。

相比之下，基於 DeepMind 神經網路技術的 WaveNetEQ 解決方案，已經在 48 種不同語言的 100 多個揚聲器資料上展開了訓練。

為增加說服力，谷歌還放出了一些 WaveNetEQ 與常見的 PLC 技術的比較音訊。當然，新技術能夠轉換多少音訊，還是有一定的侷限的。

谷歌表示，WaveNetEQ 旨在替換較短的音訊間隔，而不是真人通話期間漏掉的整個單次。因此在 120ms 之後，這套系統會淡出併產生靜音。
透過評估，谷歌確保了 WaveNetEQ 不會引入任何新運算的重音，此外所有處理都能夠在使用者的裝置端進行，畢竟 Google Duo 預設就開啟了端到端加密。

一旦網路連線變得順暢，真人的音訊會立即恢復，WaveNetEQ 將無縫地淡出介入。目前該技術已在 Pixel 4 智慧機上進行測試，後續該公司還將向更多裝置推廣。

∧ 中秋節和大豐收的關聯？

∨ DeepMind解密WaveNet，如何讓機器人自然發聲？

熱門排行

劇多

Google Duo新推出的WaveNetEQ音訊技術，對通話質量有多大的幫助？