音訊識別和圖片識別作用？

首頁>Club>2021-04-11 05:06

音訊識別和圖片識別作用？

回覆列表

1 # 使用者2733457638172

語音識別技術雖然起源於1952年，但真正進入消費市場已經是上世紀90年代的事了。目前語音識別有兩大發展方向，一個是純機械指令，基於產品定位而設計命令片語，作為高效的輔助工具存在;一個是智慧化理解語境，與人進行互動交流，並承擔部分處理工作。後者可能是語音識別未來的發展方向，但實際應用中兩者並不衝突。簡單精準的機械指令讓工作更為純粹，沒必要做多餘的計算動作。而很多智慧裝置將語音作為“解放雙手”的第三類互動形態，就需要對人的語境進行“理解”，相信很多朋友都玩過siri、GoogleNow、Cortana，也同時體驗過這些語音助手“會錯意”的賣萌行為。老羅在去年堅果釋出會上曾說所有語音助手都是“偽”智慧，雖然有點以偏概全，但目前語音對語境的識別確實還不夠智慧，遠不如機械指令效率。不過這些問題隨著深度學習等AI領域技術的崛起將逐漸克服
影象識別從以圖搜圖到明星、物體識別，再到場景識別，甚至現在延伸到了影片領域，給行業帶來了太多驚喜。現在圖片內容的價值已經超越圖片本身，並且建立了從圖片到電商的商業模式。影象識別一般針對畫面中一個物件做識別，比如大眾熟知的人臉、明星臉等識別技術已經很成熟了，基本識別率達到90%以上。近年、服飾品牌的同款識別和風景識別大行其道，為旅遊行業和服飾行業創造了商機。影象識別在影片領域湧現出強大的應用前景，新興起的互動影片技術video++已經實現影片中的人臉和服飾同款的識別，基於影象識別技術發展影片中的商業場景。另外瞳孔識別的研究已經提上日程，不久的將來，科幻片中所見即所得的情景不再是幻想。

劇多

音訊識別和圖片識別作用？

相關內容