首頁>科技>

全文共2809字,預計學習時長8分鐘

微軟、谷歌、Facebook、亞馬遜、Uber等科技巨擘的研究部門為人工智慧(AI)領域的開源框架做出了眾多貢獻,這些貢獻結合了他們內部解決方案中已大規模測試過的堆疊以及其研究實驗室內一些非常先進的思想。

雖然世界最大的科技公司們能積極為開源深度學習貢獻一己之力,這無疑讓人興奮,但這也讓資料科學家們很難跟上該領域的新進展。

今天要介紹的是Facebook人工智慧研究(FAIR)團隊上個月開源的三個新版本。這對快速增長的趨勢會有何影響呢?

FAIR團隊總會時不時為深度學習領域研究和開源框架做貢獻。從Pythorch到ONNX,FAIR團隊為簡化深度學習應用程式工具做了巨大貢獻。在過去的幾周裡,FAIR團隊新添加了三個開源框架。

Polygames

Polygames是一個開源的研究框架,其透過自演的方式來訓練策略遊戲中的深度學習代理。Polygames基於眾所周知的零學習概念,使代理透過與環境的互動來控制環境,且無需預設任何訓練。

乍一看,Polygames似乎類似於Alpha Zero或ELF OpenGo等其他遊戲學習框架,但FAIR堆疊在這個領域出了自己的一份力。對於初學者,Polygames支援更多樣的策略遊戲,如Hex、Havannah、minihogi、Connect6、minesweaver等等,這為研究人員測試深度學習代理提供了更廣闊的空間。

此外,Polygames擴充套件了傳統的零學習概念,它採用了一種結合深層神經網路和Monte Carlo Tree搜尋方法的巧妙架構,該架構使代理推廣到更多的任務環境下。

Polygames有一個意想不到的好處——由代理產生的神經可塑性。Polygames的模型是遞增的——此框架附帶了一個用於新增新的層和通道或增加核心寬度的指令碼——它們能夠進行啟動熱身訓練,允許神經網路在訓練過程中不斷增長。

從程式設計模型的角度來看,Polygames提供了一個包含遊戲的庫,以及一個實施使用者個人遊戲的單一檔案API。開發人員的經驗基於PyTorch,其結果相對容易上手。

FAIR團隊憑藉Polygames實現了多個里程碑,包括在Hex19的比賽中擊敗了頂尖真人玩家。由詩人和數學家皮埃特·海因(Piet Hein)和經濟學家兼數學家約翰·納什(John Nash)於20世紀40年代創造的六連棋遊戲挑戰了人類傳統的遊戲思考過程。

該遊戲規則很簡單,即黑白棋依次填充空白格。如果黑棋連線了南北則黑棋獲勝;而如果白棋連線了東西,則白棋勝。公平起見,遊戲加設了一個規則:在第二步,第二個玩家可以決定是否交換顏色。

該遊戲的難點在於作為一個連線遊戲,是否能贏需要的是大局觀,而非依靠區域性來判斷。

經過一系列實驗,Polygames能夠在此遊戲中擊敗人類的頂尖玩家,結果如下圖所示(真人玩家使用的是白棋)。第一個影象表示六連棋開始。在遊戲第二階段,真人(白棋)似乎要贏了,因為東西方分別有兩組堅挺的白棋,並且看起來彼此接近。然而,Polygames在中間製造一個相當複雜的區域,扭轉了局勢。

Polygames打開了局面,並找到了使用兩個可能的路徑之一的組合來獲勝。

PyTorch3D

PyTorch3D是一個用於在3D環境中訓練深度學習代理的框架。儘管在現實世界中需要大量的視覺智慧系統,但在三維環境中訓練這類智慧體的工具和框架仍然受到很大限制。PyTorch3D是一個高度模組化並最佳化過的庫,具有能簡化3D深度學習的獨特功能。

PyTorch3D為快速可辨的3D資料提供了一組常用的3D運算子和丟失函式,同時其也提供了一個模組化、可辨的渲染API,使研究人員能夠立即將這些函式匯入到當前最先進的深度學習系統中。

PyTorch3D借鑑了3D深度學習最新的幾個里程碑,例如FAIR的MeshR-CNN實現了從複雜內部空間影象中完整重建3D物件。該框架還借鑑了高度最佳化二維識別庫後將物體理解成功推廣到三維的Detectron2。

PyTorch3D用於處理旋轉和3D變換的函式也是建立C3DPO的核心。C3DPO是一種使用較少註釋訓練資料就能學習影象和3D形狀間關聯的新方法。

PyTorch3D一些主要貢獻有:

· 用於儲存和操作三角形網格的資料結構:PyTorch3D將三維表示儲存在稱為Meshes的資料結構中。這種資料結構使研究人員能夠輕易將底層網格資料快速轉換為不同的檢視,用最有效的資料表示來匹配運算子。

· 三角網格上的高效操作:PyTorch3D包括最佳化幾種常用運算子和3D資料丟失函式的工具、支援異構批次輸入等一系列操作。這意味著研究人員和工程師可以在PyTorch3D中匯入運算子以更快實驗,而無需在每個新專案開始時重新建立這些運算子。

· 一個可辨的網格渲染器:PyTorch3D包括一個模組化可辨渲染器。我們的工具由可組裝單元格構成,使使用者輕鬆擴充套件渲染器以自定義照明或著色效果。

HiPlot

探索高維資料是深度學習程式的挑戰之一。HiPlot是一個互動式視覺化工具,幫助人工智慧研究人員探索在高維資料中使用平行圖和其他圖形來表示資訊的關聯和模式。HiPlot運用了一種並行圖技術,該技術能夠使視覺化和過濾高維資料更便捷。

從功能角度來看,HiPlot與其他視覺化工具一樣有幾個優點:

· 簡單:使用HiPlot只需要幾行程式碼。透過一個帶有“hiplot”命令的伺服器,使用者即可透過一個給定的URL訪問,並使用它來視覺化、管理和共享使用者的實驗。

· 基於群體訓練的視覺化:HiPlot提供了一種簡單的方法來將基於群體訓練的實驗視覺化,以不同資料點之間的邊構成XY圖。這種視覺化在深度學習實驗中極其常見。

Facebook的FAIR團隊在深度學習領域繼續創新,併為開源社群做出積極貢獻。PyTorch3B、Polygames和HiPlot都是FAIR的最新貢獻,旨在簡化深度學習應用程式的工具。

我們一起分享AI學習與發展的乾貨

19
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 偽裝成區塊鏈的傳銷盤《騙局》