回覆列表
-
1 # AI最智慧
-
2 # HerrIdol705
這種通用好像沒太大實際價值,一個網路處理的資料的範圍越大,它的訓練過程越是複雜,又要影象又要聲音,即使聲音可以做成頻譜圖,和一般影象也有太大差別,硬做當然也行,可以用一個條件網路來做,先用圖片聲音識別生成條件
這種通用好像沒太大實際價值,一個網路處理的資料的範圍越大,它的訓練過程越是複雜,又要影象又要聲音,即使聲音可以做成頻譜圖,和一般影象也有太大差別,硬做當然也行,可以用一個條件網路來做,先用圖片聲音識別生成條件
對於目前的深度學習模型來說,儘管深度學習的一個目標是設計能夠處理各種任務的演算法,然而截至目前深度學習的應用仍然需要一定程度的特化,還沒有通用的神經網路處理模型。不過各個模型也在互相借鑑,彼此融合,共同提高,象有些創新能同時改進卷積神經網路和迴圈神經網路,比如批標準化與注意力等。通用的模型還有待未來研究提出。
影象和視訊處理,計算機視覺,目前最流行的是cnn,即卷積神經網路,及其變形和發展,cnn適合處理空間資料,在計算機視覺領域應用廣泛。象陸續出現的AlexNet,VGGNet,GoogLeNet,ResNet等都很有特色。以上幾種模型是影象分類識別使用的。象影象分割,目標檢測等還有更多針對性模型提出和得到廣泛應用。
語音處理,2012 年前,最先進的語音識別系統是隱馬爾可夫模型(HMM) 和高斯混合模型(GMM) 的結合。目前最流行的是深度學習的RNN迴圈神經網路,及其發展長短時記憶網路LSTM,以及GRU,雙向RNN,分層RNN等。
自然語言處理,除了傳統方法,目前深度學習用於自然語言處理的模型經歷了基於CNN的模型,基於RNN的模型,基於Attention機制的模型,基於Transformer的模型等幾個發展階段。NLP有很多模型和方法,不同的任務場景有不同的模型和策略來解決某些問題。