語音識別技術如何入門？

首頁>Club>2022-01-31 14:36

語音識別技術如何入門？

回覆列表

1 # 深圳不要將我忘記

語音識別一般包括三個相互獨立有相互依存的環節，分別是語音—>文字，文字—>文字，文字—>語音，或文字—>命令。作為語音識別的入門級概念，下面就簡單做以說明。
一、語音到文字
這是語音識別的關鍵和基礎。在這個環節，識別演算法抓取語音中的特徵資訊（經過大資料分析），把語音（聲音資訊）“翻譯”成對應的文字資訊。前者屬於聲音檔案，後者屬於文字檔案。這一步只是做了“翻譯”，也可以理解為對聲音的“識別”—語音識別。
二、文字到文字
把由第一步獲得的文字資訊，透過“查字典”的方式，查詢對應的文字資訊（當然需要足夠龐大的文字釋義資料庫，和檢索的足夠高效率）。如語音解釋得到的文字“聽歌曲”就會查詢得到很多和“歌曲”相關的詞條：歌手名字檢索，流行歌曲檢索，英文歌曲檢索。。。這個環節也可以成為“語義解析”。
三、文字還原到語音或命令執行
把上個步驟查到的文字資訊，透過“語音合成”演算法，還原成自然人聲，就可以起到類似人和人交流的感覺。最典型的應用就是“線上翻譯”，和/或語音導航。

語音控制是目前智慧家居/智慧硬體最“時髦”的技術，就是在這個環節，把得到的“命令資訊”透過執行機構，讓硬體產品（如機器人）做出相應的動作。或智慧家居中的各種控制指令等等。
四、線上和離線/或雲端和本地語音識別的區別和聯絡
以上所講的重點立足於“實時語音識別”，就是說，使用者隨意講一句話，都可以得到一個結果（語音反饋，文字反饋，畫面反饋，機器人動作等等）。可想而知，在整個過程中，需要機器/裝置經過一些列的資料傳輸（連線到雲端）和運算（雲計算）。可以看出，真正意義上的有現實意義的語音識別控制系統（如智慧家居，人工智慧機器人等）是一個非常複雜的“系統工程”。這就是線上語音識別或稱雲端語音識別的特點和優勢；

向對應的，比如我們執行一個簡單的電燈的開關，如果也搞這麼複雜的系統，連線到雲端，顯然從成本考慮的角度，任何人心理上都不太能接受。這個時候，“物美價廉”的本地化，離線式、單晶片方案就顯得那麼的招人喜愛。

事實上，一般一個單晶片的控制方案（本地語音識別控制）成本也就十幾元，非常適合智慧家庭中智慧單品控制。
語音控制燈語音控制看電視
總結
語音控制是人工智慧（AI）核心技術，實現語音互動，人機對話，語音控制等等一些列智慧應用。“解放人手”，愜意人生。

2 # 科普達人線上

這個一般要到大學開始才能接觸，基礎的要學《數位電路技術》、《數字訊號處理》、《語音數字訊號處理》、《matlab程式設計》或《C語言程式設計》等課程，然後從基礎演算法到多種演算法處理，一步步進階，這也基本上開始進入研究生的方向課程學習了。
3 # 徐汝魁

語音識別技術，包括以下幾個重點。一是語音的輸入，把語音由聲波接收轉為模擬電訊號，然後放大，濾除語音外的高低頻訊號，再透過AD處理變為數字化資料。二是對資料的計算機語言演算法處理。三是作出相應的輸出反應。
所以，語音識別技術包括電子部分，要具備電子知識，相關電子的書籍可以看看。還有計算機語言，要深入學習，比如C語言，是必備知識。C語言的書籍也很多，多買幾本學習。另外，對聲波的知識也是重點，聲音的頻率，相位，各種特點的分解和對比是識別的關鍵，屬於核心技術，可能依賴書籍是不現實的，需要自己努力。

4 # 硬派數碼

作為硬體工程師，有做過智慧語音音箱方面的相關經歷和語音識別的硬體測試，下面我來分析一下。

語音識別技術的實現，主要三部分：
1. 硬體部分
硬體的實現主要是是語音訊號處理，語音從MIC進入，轉變成電訊號透過專門的AD晶片取樣給CPU處理。語音採集的質量由外界的影響因素比較多，包括MIC的密封性，通音孔的結構設計，PCB元器件的佈局，和訊號線的佈線等。語音的前端採集對於後端的識別至關重要。所以語音識別的硬體部分，是要下功夫學習的。現在提供語音識別服務的公司也比較多，有科大訊飛，思必馳，百度，XMOS,啟英泰倫等，他們一般會提供硬體開發的demo板。
2. 軟體部分
軟體部分主要包括外設的驅動，包括各個介面的驅動，除錯AD晶片的驅動，語音採集後的場景匹配，孤立詞識別，關鍵詞識別和連續語音識別，還有詞語的匹配。後面還要和雲端對接，使識別的內容對接網路，交換資料。供應商會有SDK開發包，一般基於安卓的，驅動也有C語言的。
3. 雲端部分
雲端主要包括語音識別後的的內容對接，包括天氣，新聞，音樂，購物，和各種有聲讀物等。百度雲，騰訊雲，還有其他內容供應商會提供這些介面的對接。

總結
5 # 貓的名字叫安生

手機上的輸入文字的功能，用過的一個非常好用的語音識別輸入文字的軟體。
1）在應用市場找到這個工具將它安裝在手機之後在語音識別的頁面中選擇：錄音機，就可以錄製音訊了；
2）等待錄製結束，這裡我們需要將音訊檔案儲存一份，然後進入手機檔案庫的頁面，找到錄製的音訊；
4）最後，我們同樣可以進入文字頁面，進行翻譯、複製、匯出等操作。
怎麼將錄音轉成文字？線上語音轉文字、手機音訊轉文字看這裡

6 # 是給你就泰格

想要入門語音識別的話不妨試試一些關於語音識別的軟體，把你來做識別，提高工作效率。
可以先開啟應用市場的錄音轉文字助手，在錄音實時轉寫、匯入音訊識別、語音翻譯、錄音機裡邊可以選匯入音訊識別，那裡支援會議音訊的轉換，不用聽著錄音打字了。
等待一會兒音訊也就識別成了文字了，可以對文字做翻譯
翻譯完了可以複製貼上文字，也可以匯出來發給好友。
7 # 貓的名字叫安生

手機上的輸入文字的功能，用過的一個非常好用的語音識別輸入文字的軟體。
1）在應用市場找到這個工具將它安裝在手機之後在語音識別的頁面中選擇：錄音機，就可以錄製音訊了；
2）等待錄製結束，這裡我們需要將音訊檔案儲存一份，然後進入手機檔案庫的頁面，找到錄製的音訊；
4）最後，我們同樣可以進入文字頁面，進行翻譯、複製、匯出等操作。
怎麼將錄音轉成文字？線上語音轉文字、手機音訊轉文字看這裡

∧ 中秋節和大豐收的關聯？

∨ 天龍八部裡有幾個壞人？理由是什麼？

熱門排行

劇多

語音識別技術如何入門？