-
1 # 伏城在上海
-
2 # AI河馬
在機器翻譯(NMT),命名實體識別(NER),自然語言處理(NLP)以及計算機視覺任務(CV)上,神經網路的應用都取得了相當不錯的效果,那它為什麼會有用呢?
總結的話,有三點:
1.演算法
神經網路是一種模擬人腦的神經網路以期能夠實現類人工智慧的機器學習技術,透過模擬人腦的執行方式來實現其有效性。我們先來了解一個簡單且經典的神經網路架構
這是一個包含三個層次的網路架構,分別為輸入層,隱含層,輸出層;箭頭方向代表資料流向和傳播方向以及計算順序,每個連線代表不同的權值(訓練所得),節點代表神經元。
在設計一個網路架構的時候輸入層和輸出層往往是固定的,我們需要設定的為中間的隱含層,這也是神經網路的關鍵。一個神經網路的訓練演算法就是讓權重的值調整到最佳,以使得整個網路的預測效果最好。
我們給神經網路喂入資料,然後讓其訓練,透過反向傳播的時候透過啟用函式計算預測資料同目標資料的一個差值進行修正,最終訓練為一個有效地神經網路。
這一點就很像我們人腦去學習的方式,我們最初對這個世界是沒有定義的,但是透過學習,慢慢地對認知進行糾正,就形成了我們對這個世界的認知,並且在接收新事物的時候,我們可以利用我們的先驗知識進行識別。
2.資料集
最初的比較經典的和簡單的資料集-手寫數字Mnist資料集到現在的包含百萬影象,大小達到幾十G的資料集,隨著資料集的不斷更新和發展,能有更多的任務訓練不會因為資料集的缺乏而停滯。
3.計算能力
目前世界上運算速度最快的計算機系統為中國的“天河二號”,持續計算速度為每秒3.39億億次、峰值計算速度為每秒5.49億億次,成為目前世界運算最快的超級計算機。超級計算機效能的發展遵循千倍定律,即每隔10年超級計算計的效能就會提高1000倍。而隨著計算能力的提升,更多難以計算的資料都將被挖掘出來。
以上觀點若有不足,還請指正
-
3 # jkmb88
個人認為這要歸功於神經網路的泛逼近理論,需要什麼樣的對映(更具體的說是函式)把資料丟給神經網路去跑就完了。
回覆列表
作為一個AI量化老司機,回答這個問題簡直義不容辭。
回到問題上來,神經網路之所以有用,在於non linear activation function的加入,讓網路有了能夠擬合非線性目標函式的能力
另外隨著gpu等處理能力的加強,讓神經網路的訓練不再成為障礙,所以神經網路以及這基礎上的深度學習迎來了發展的高峰