首頁>科技>

DeepMind 提出新的研究方向,在沒有明確智慧體概念的情況下,用環境促進智慧生物體的出現。

近日,DeepMind 的研究者提出了一種人工生命框架,旨在促進智慧生物體的出現。該框架中沒有明確的智慧體概念,而是由原子元素構成的環境。這些元素包含神經操作,透過資訊交換和環境中包含的類物理規則進行互動。研究者討論了進化過程如何導致由許多此類原子元素構成的不同生物體的出現,這些原子元素可以在環境中共存和繁榮。此外,研究者還探討了這如何構成通用 AI 生成演算法的基礎,並提供了這種系統的簡化版實現,討論了需要做哪些改進才能進一步擴大規模。

論文地址:https://arxiv.org/pdf/2101.07627.pdf

DeepMind 提出新系統

現實世界是由相互作用並組成更大實體的基本粒子構成的。DeepMind 研究提出的環境(AI 生成演算法)是由元素構成的,但尺度較大。每個元素包含一個神經操作,比如矩陣乘法、外積,或者是包含這些運算元的序列。這些元素透過某種形式的基本規則——一種物理型別,以及神經狀態的直接通訊進行彼此互動。

該系統有多種實現。這篇論文提供了網格世界(grid-world)實現,其中的基本元素位於網格上,透過傳播訊號或注意力機制進行通訊,並與實現能量和類化學交換的底層物理進行通訊。另一個例子是在三維空間中形成剛性零件的元素,這些零件可以透過連線點(joint)進行連線,連線點包含神經操作,透過與附近連線的零件交換訊號來進行互動,並在連線點上設定扭矩。系統中可能存在多種型別的元素,並非所有元素內部都需要有神經網路。

研究者在論文中提供了一種網格實現,突出顯示了許多重要屬性,並探討了要讓該系統變得強大需要進行哪些改進。

但是,該系統的潛力是無限的,它支援如下功能:

由多個元素組成的較大單元可以透過物理連線(如機器人)來形成,也可以簡單地作為一組決定進行通訊並形成整體的單元。這些單元的潛在大小沒有限制。它們可以透過多種方式傳播——透過接管環境中的其他元素來生長(殖民地),也可以透過組裝新的副本進行復制,將適當的收集元素移動位置(例如機器人透過組裝碎片來複制自己)或自我組裝,或者它們可以生成完全不同的單元,這些單元可以實現專用的功能(一種有用的機器),或者比其前代產品更好的單元。而後者可能需要智慧(intelligence)。

智慧的能力

為什麼說該研究提出的計算系統具有表示通用智慧的能力,研究者提供了兩個論點:

首先,機器學習中已有的任何神經演算法,或者未來可能建立的演算法,都可以寫作一串操作序列,例如加法、矩陣乘法、外積和非線性運算,並在張量狀態下進行操作,例如由神經網路的前向、後向和最佳化器操作產生的序列。AutoML-Zero 意識到了這一點,它直接搜尋此類運算元的序列以及與其所執行狀態的連通性,並且能夠學習基本的神經演算法。由於這些運算元是環境的基本構建元素,且能與任意連通性進行通訊,因此所有的神經演算法都可以在該系統中實現。

智慧體假設

在該系統中,沒有智慧體和環境之分,只有環境。元素本身可能形成也可能不形成進化單元,進化單元的繁殖會顯示出遺傳性但遺傳的區域並不確切。在前一種情況下,它們可以自主移動,收集能量並進行復制,形成更大的聚集體或複製生物體,因為這樣做具有優勢。而該研究則是針對後者,它需要最小數量的更簡單協作單元進行自我傳播。

SIM 的網格版本和通用屬性

如上文所述,這裡沒有內建的智慧體概念,實際上只有一個環境。通常情況下,在兩個不同平臺上實現該系統是很不自然的:一個用於物理部分,例如物理模擬器;一個用於神經部分,如 TensorFlow、PyTorch 或 Jax 等神經網路框架。該研究建議在單個平臺上製作這樣的系統。要產生智慧行為,需要高效地執行神經網路,因此該系統需要在後一種平臺上實現。出於靈活性的考慮,該研究選擇了 Jax。

Jax 在張量上執行,該研究用張量來儲存元素。這些元素需要互動,並具有形成任意大小靈活聚合體的能力。

實驗

該研究運行了上述系統,在一系列執行之間觀察到了令人興奮的多樣性,如圖 2 所示。

圖 2:執行結果。上面一行中,研究者用不同顏色代表 3 種不同的隨機權重。

如圖 2 上面一行中我們可以看到,在多個區域中,兩種元素都能夠穩定共存,即相同空間區域中存在不同顏色的點。並且這能持續很長時間,說明它們發現了一種共存的方式。

6
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 曾賤賣給微軟的諾基亞,靠這3萬個東西,如今躺賺蘋果、三星的錢