一種人工智慧學習技術被用來在理解人類大腦的一些以前無法解釋的特徵方面取得突破
谷歌旗下DeepMind的研究人員發現,計算機科學關於強化學習的最新進展可以應用於大腦多巴胺系統的工作方式。
這項研究發表在科學雜誌《自然》上,對更好地理解心理健康以及學習和動機障礙有著重要意義。
研究發現,人工智慧演算法中使用的“分散式強化學習”實際上模擬了大腦中的多巴胺獎賞系統。
這項技術使大腦能夠利用它來分配未來回報的可能性,而不是集中精力於那些能帶來即時回報的行動。
研究人員在一篇描述他們發現的部落格文章中解釋說:“我們發現大腦中的多巴胺神經元分別被調節到不同程度的悲觀或樂觀情緒。”。
“如果他們是一個合唱團,他們就不會唱同一個音符,而是和聲——每個人都有一個一致的聲域,就像低音和女高音歌手一樣。
“在人工強化學習系統中,這種不同的調整產生了更豐富的訓練訊號,大大加快了神經網路的學習速度,我們推測大腦可能出於同樣的原因使用它。”
通常,人工智慧研究借鑑了神經科學,以創造出能夠複製人腦的演算法和機器。
DeepMind之前從生物學中獲得靈感,創造出能夠將Atari電腦遊戲掌握到超人水平的神經網路。
然而,該公司表示,最新的發現證明了神經科學也可以從人工智慧研究中受益,從而推動科學發現——這一過程被稱為“良性迴圈”。
研究人員總結說:“大腦中分佈強化學習的存在對人工智慧和神經科學都有著有趣的意義。”。
“我們希望,提出和回答這些問題將刺激神經科學的進步,這些進步將反饋給有益於人工智慧研究,完成良性迴圈。”
最新評論