回覆列表
  • 1 # 孤猴78345271

    原創思想,本民科認為,毫無疑問,人的聽覺感知系統才是語音感知的權威,它可以正確感知無數人說的話,比如十億華人說的不太標準的普通話,這全仰仗聽覺感知的一項所謂`模式感知’功能(Patterns Perception),即把無數人說的語音歸結為極其有限的音位模式,大腦的語音感知屬於擬腦AI,而現在的所謂語音識別則完全是理工男鼓搗出來的,基於語音產生模型的各種演算法,重要資訊與非重要資訊鬍子眉毛一把抓,與語音模式感知毫不相干,所以要想取得突破是完全不可能的,所以現在的語音識別,`人工’有餘,可與人類的`智慧’扯不上關係,語音識別要想取得最終突破,只有聽覺模式感知一條路可走。擬腦AI是AI唯一的出路,但本民科的經歷表明,儘管步履艱難,但仍然能夠取得突破。

  • 2 # 我叫MTTM

    語音識別是屬於計算機的技術:

    語音識別是模式識別的一個分支,屬於訊號處理科學領域。它還與語音學,語言學,數理統計學和神經生物學學科有著非常密切的關係。另一方面,言語也是人類賴以思考的主要工具。因此,這門科學與認知科學和人工智慧領域的研究密不可分,是資訊科學研究領域發展最快的領域之一。

    語音識別研究的目的是讓機器“理解”人類的口語。它包括兩個方面:一是逐字理解未翻譯成書面語言的單詞;另一種是理解口語中包含的要求或查詢,並正確回答,而不受所有詞語的正確轉換的約束。語音識別系統可分為三種類型:孤立詞,連線詞和連續語音。從客戶的角度來看,它可以分為特定的人和非特定的人。也就是說,該系統僅適用於一個使用者或可用於任何使用者。

    語音識別研究始於20世紀50年代初,並開始成為20世紀60年代中期的一個重要課題。如今,隨著DTW的引入,HMM的引入,語言模型的建立等,語音識別研究取得了很大進展。自20世紀80年代以來,一些相對簡單的語音識別系統已進入商業化階段。在20世紀90年代,語音識別的主要方向被定義為連續語音,大詞彙量,非特定人識別演算法和系統開發。到目前為止,以IBM的Via Voice為代表的“聽寫機”系統已正式投放市場,並逐漸被人們接受。語音識別,語音合成,多媒體等技術的結合將為計算機提供友好的互動模式,為網路技術,計算機應用和普及提供必要的條件。

  • 中秋節和大豐收的關聯?
  • 臉上用什麼護膚品都覺得不吸收,用過之後臉上還會有輕微的刺痛,常爆痘,是激素臉嗎?