回覆列表
  • 1 # 江蘇專轉本宋老師

    強化學習和深度學習是兩種技術,只不過深度學習技術可以用到強化學習上,這個就叫深度強化學習.

    1.強化學習其實也是機器學習的一個分支,但是它與我們常見的機器學習不太一樣。它講究在一系列的情景之下,透過多步恰當的決策來達到一個目標,是一種序列多步決策的問題。強化學習是一種標記延遲的監督學習。

    2.強化學習實際上是一套很通用的解決人工智慧問題的框架,很值得大家去研究。另一方面,深度學習不僅能夠為強化學習帶來端到端最佳化的便利,而且使得強化學習不再受限於低維的空間中,極大地拓展了強化學習的使用範圍。

  • 2 # 建戈說教育

    深度學習和強化學習都屬於機器學習,而機器學習又是人工智慧的一部分。深度學習和強化學習功能的有趣之處在於它們使計算機能夠自己開發規則來解決問題。這種學習能力對於計算機來說並不是什麼新鮮事,但直到最近,我們還沒有足夠的資料和計算能力使其工業化。

    什麼是深度學習?

    深度學習本質上是一個自學習系統。我們可以使用現有資料來訓練演算法以查詢解決相應問題的模式,然後使用這種模式來對新資料進行預測。例如,我們可以訓練深度學習演算法來識別照片上的貓。具體步驟是:1、讓計算機看數以百萬計的包含貓或不包含貓的影象。2、讓程式透過對影象資料進行分類和聚類(例如,邊緣,形狀,顏色,形狀之間的距離等)來建立模式,足夠多的的模式可以得到最終的預測模型。3、讓程式透過預測模型來檢視新的影象集,透過與預測模型的比對來確定影象中是否有貓。

    深度學習演算法透過模擬我們大腦神經元網路的人工神經網路來實現類似人類大腦的功能。演算法在執行中會執行各種迴圈,透過縮小模式與實際的差距來改進每個迴圈的預測,最終建立一個最優預測模型。

    蘋果的Face ID(人臉識別)就是一個很好的關於深度學習的工業應用案例。Face ID可以透過掃描臉部來訓練演算法。每次使用Face ID登入時,TrueDepth攝像頭會捕獲數千個數據點,這些資料點被用於建立使用者臉部的深度圖,而手機的內建神經引擎將執行預測模型以判斷您是否是您。

    什麼是強化學習?

    強化學習也是一種自學習系統,但它主要是透過反覆試驗來學習的。透過有限次地執行行動以得到最大化獎勵從而確定最佳答案,換句話說,它是透過實踐來學習,從實踐中找到最佳結果。這就好比我們小時候學騎腳踏車。剛開始學的時候我們經常會摔倒,但隨著摔得次數多了,我們慢慢就掌握竅門了。這個學習的過程就是強化學習。當計算機使用強化學習時,它們會嘗試不同的行為,從反饋中學習該行為是否能夠得到更好的結果,然後將能得到好結果的行為記住,規範點說就是計算機在多次迭代中自主地重新修正演算法,直到能做出正確的判斷為止。

    使用強化學習的一個很好的例子是讓機器人學習如何走路。機器人首先向前邁出一大步然後跌倒。這一大步和摔倒是強化學習系統關注的響應點。由於反饋是負面的,所以繼續調整,系統會根據多個負反饋的比對最終確定機器人應該把步子邁的小一點,不停地小,直到機器人走路不會摔倒為止。

    近幾年,我看到的最強大的強化學習實驗之一就是谷歌的Deep Mind。谷歌的研究人員把這個工具應用到了經典的電腦遊戲Atari Breakout(一個最經典的打磚塊遊戲)上。他們把最佳目標(結果)設定成了最多的得分,Deep Mind需要做的就是不斷地透過移動底下的擋板來擊打小球以破環螢幕頂部的磚塊。這個實驗的影片大家可以去百度一下,在實驗的開始,Deep Mind犯了很多低階錯誤,但很快,它就可以擊敗這個世界上最好的擊磚塊選手了。到現在,Deep Mind已經會玩近60種遊戲了。

    深度學習與強化學習的區別

    深度學習和強化學習首先都是自主學習系統。它們之間的區別在於,深度學習是從訓練集中學習,然後將學習到的知識應用於新資料集,是一種靜態學習,而強化學習是透過連續的反饋來調整自身的動作以獲得最優結果,是一種不斷試錯的過程,這是動態學習。

    有一點需要注意,深度學習和強化學習並不是相互排斥的概念。事實上,您可以在強化學習系統中使用深度學習,這就是深度強化學習。關於深度強化學習的更多內容我會在以後的文章裡詳細給大家講解的。

  • 3 # 孫梓堯國學教育

    當一個學生已經把基礎知識學會了,這個時候他必須進行深度學習才能使自己這某一個領域達到一個新的臺階。深度學習就是細化每一個有價值的知識點,不斷研究,總結的過程。比如一個學生知道了物理學中牛頓第一定律,在能熟練運用後,這個時候要進入深度學習,來探究牛頓第一定律的來由。

    強化學習往往是在學習強度上加大力度。比如做數學驗算題,如果不經過強度化的練習,是很難在考試中得到質的飛躍的。

  • 4 # 小草在路上

    深化學習突出的是質,而強化學習突出的是量。對於學習,要區分不同的物件,採用不同的方法。理解能力強,成績優異的學生,要深挖;理解能力差,成績一般的學生,要強化。深化強化正好是因材施教的表現。

  • 5 # 興科管家

    將兩者聯絡起來,也就是所謂的深度強化學習,此時兩者可以分別為對方定義中的一部分。

    從深度學習的角度看強化學習:強化學習一方面基於獎勵為深度學習提供了評估方式,作為學習的偏好,例如為神經網路提供了損失函式。另一方面由於是在解決序列決策的問題,所以也為深度學習提供了資料獲取的方式。

    從強化學習的角度看深度學習:強化學習的目的是透過與環境的互動修正行為,最大化期望獎勵。在這裡深度學習是作為一個工具,提供了從狀態到行動的對映,用於決策。

  • 中秋節和大豐收的關聯?
  • 兩個月的寶寶,7、8天不大便,但每次用了開塞露,都能拉出好多,這樣正常嗎?