回覆列表
  • 1 # 十項全能斜槓青年

    科大訊飛已經在做了。

    一段 20 分鐘的音訊,只用 20 秒就轉錄成比較準確的文字。

    作為一個經常需要採訪並且整理成文字的編輯,在如何將語音轉化成文字這件事上著實花費了不少心思。

    最傳統的方式是先開啟錄音功能,然後一邊打電話一邊速記要點,然後再利用音訊播放工具反覆重聽將所需要的細節進行完善。我知道你也許會說我很笨,但是我的確做不到一次性將採訪的內容全部記住。

    相信這樣的人也不在少數,那麼還有什麼其他好辦法麼?在我看來,訊飛聽見算一個。

    訊飛聽見作為科大訊飛自己的一套產品,包括三部分:PC 端網站、手機端 App 錄音寶、聽見錄音筆,形成了一套“軟體+硬體+服務”的完整體系。

    轉錄語音這件事,精確最重要!

    在去年的訊飛年度釋出會上,訊飛聽見就展現了一把自己的轉錄精確度,董事長在臺上演講,旁邊的螢幕上就直接出現演講的內容,精確度幾乎達到 99%。當然,這個具體的精確度還是要具體使用才知道。

    除了識別率之外,三款產品還有非常多的亮點,PC 端的處理速度非常快,官網上表示 1 小時的音訊只需 10 分鐘就可以處理完成。而在實際使用中,速度比這個還快,20 分鐘出頭的音訊通常不用 1 分鐘就可以完成轉錄。

    波形圖的下方,則直接分成兩部分:左邊是轉錄出來內容,右邊則是一個功能完善的文字編輯器。左邊的內容被智慧的分隔成很多段,使用者可以選擇將其中一段、幾段或是全文匯入到編輯器中。

    似乎沒有什麼意思?接下來才是重點

    右側的編輯器功能也比較強大,主要的文字格式編輯,比如字型、大小、顏色、背景色、粗體、斜體、劃線、下劃線都有,此外提供了猶如對齊和縮排的段落格式功能。

    只不過新增一個編輯器而已,真的有那麼重要麼?從實際的使用效果來看,除非錄音裝置很高階、錄音物件的發音非常清晰,透過機器轉錄的效果目前還沒有辦法達到 100% 準確。這也是新增一個編輯器的最大意義所在。

    當然如果你自己比較懶,訊飛聽見還提供了收費的人工轉錄服務,只要上傳了錄音你就能夠直接獲得最終的精準文字結果。

  • 2 # 霂夏581

    已經實現了。可以試試36氪新出的媒探APP。

    語音轉文字是近年發展的大趨勢,但最多隻是做到極大還原當事人現場語音而已(有時會把環境噪音也錯誤地轉錄進去),很少能根據當事人語調理清邏輯、準確無誤地去除多餘語氣助詞。

    所謂“精準轉錄”出來的文字是根本沒法看的,因為人類自然語言中註定帶有各種語氣詞:

    而我們要的是這樣一份文字:

    媒探可以透過智慧識別和語意辨析做到這樣的效果,還可以透過文字對應相關的音軌:

    可以在錄音過程中做標記、防干擾:

    還有藍芽遠端標記、記錄錄音地點等各種小功能。可以慢慢挖掘。

    最重要的是轉錄效果不錯,而且便宜。

  • 3 # 樂往科技

    目前人工智慧技術運用到語音識別科大訊飛已經是耕耘多年,採用科大訊飛語音識別的慧譯也是實現語音轉文字功能,在普通話標準前提下,識別率可達95%以上,接近人工智慧,技術是進步的,日後還會更上一層樓。

  • 4 # CccH

    一段語音怎麼轉換為文字,可能都會說微信呀,微信的功能語音轉換為文字。確實語音轉換為文字,我們比較常用到就是微信。收到一段語音,太長了不想聽,把它轉換為文字。但是,這僅在微信上可以用。如果是在網上下載下來的語音或者是下載音樂,要怎麼轉換為文字格式呢?可以轉換為一個檔案形式嗎?回答,可以的。操作如下,如果的需要的話可以收藏哦!

    下載工具地址:

    https://www.callmysoft.com/yuyinzhuanhuan

    操作步驟:

    第一步,選擇左邊的選項,語音轉換為文字

    第二步,新增需要轉換的語音檔案

    第三步,選擇識別的語種

    第四步,選擇轉出文字儲存的檔案格式

    第五步,自定義輸出位置

  • 中秋節和大豐收的關聯?
  • 2018年VR的發展趨勢是怎樣的,你怎麼看?