首頁>科技>

去年穀歌釋出了自己的AI整合化產品-AIHub,旨在解決當下資料科學從架構到落地的各種問題,包括各類分散式的算力資源(CPU, GPU, TPU,尤其在跨環境的情況,如將雲端負載轉移到本地那將是噩夢),資料科學團隊的協同(工具、模型和解決方案等的複用)以及跨團隊的協作--資料科學家不懂雲,雲架構師不懂特徵工程,DBA不懂資料科學,而AIHub是谷歌推動企業資料科學協同的重要板塊以及唯一的平臺級工具。

畢竟企業AI不光是資料科學家的事,還需要業務分析團隊從現有的資料中獲取洞見;應用開發團隊在程式中嵌入定製化機器學習模型的API;機器學習工程師構建CI/CD管道推動模型落地。當然還包括資料科學團隊來建設和部署機器學習模型。

既然建立企業AI能力涉及到這麼多角色和分工,勢必不同團隊需要功能不同但又互相互動的工具來協同工作。谷歌的AI技術棧自底向上包含了其雲平臺的物理資源,包括儲存、計算與處理器,當然如果使用者有自己的資料中心,也可以與GCP整合或以docker形式構建上層谷歌的AI技術棧。

基於GCP的雲架構,官方會推薦使用託管的容器雲服務,包括深度學習的專用虛擬機器、AI平臺的訓練環境、自動機器學習的IDE等。如果底層是本地資料中心可以透過谷歌的K8S引擎或開源版的K8S自行搭建工具層(Kubeflow)的核心服務。

工具層包括了資料科學家最首席的notebook工具,面向敏捷開發的CI/CD管道(Kubeflow Pipeline)以及面向架構團隊可以按需分佈AI負載的Kubeflow Fairing。

這次釋出的AIHub相當於是所有AI工具的中心,面向各協作團隊提供了一站式搜尋、快速部署以及內外部共享的產品體驗。其中搜索功能包括了面向即插即用的AI管道和Google合作伙伴和使用者建立的內容的快速搜尋;快速部署包括了在GCP上透過Kubeflow對AI管道的一鍵式部署;共享體驗包括了AI管道和製品的複用以及內容端的開放共享。

下面我們聊聊針對不同的協作方,AIHub提供的使用者旅程。包括應用開發人員透過API部署智慧應用;資料科學家透過AIHub發現、自定義、訓練並共享機器學習模型;機器學習工程師整合端到端的機器學習路徑形成AI產品。

首先對於開發人員來說,AIHub提供了各種開箱即用的認知服務介面,就像一個API超市一樣,可以在左邊欄選擇輸入的類別,例如影象、文字、語音或影片等,也可以根據介面類別來搜尋。

我們拿之前微軟認知服務識別不出來的兩張圖片來給谷歌做個測試,分別是恆隆廣場和易烊千璽,結果發現谷歌的計算機視覺可以識別出來!而在微軟的影象識別裡僅能識別為一個建築和一個男孩......可見谷歌對中國大陸人物的影象資源庫要比微軟更完備,哪怕它被中國大陸所封禁。

針對資料科學團隊,AIHub頁面裡集成了Tensorflow的編譯器,可以直接對訓練模型進行校正(Kubeflow Fairing內含各種通用的卷積演算法和歸類演算法),也可以將notebook分享給團隊其他科學家以供校驗。

對於機器學習工程師,他們並沒有數學科學家的建模水平,他們更關注資料的輸入和模型的輸出及產品化,他們可以設計模組間的邏輯,前序輸入、後續輸出等等。透過Kubeflow Pipeline可以很方便地以拖拉拽的形式完成運算邏輯。

目前為止,埃森哲、英特爾、英偉達、思科等的雲服務都是基於谷歌的AIHub和認知服務開發的自己的人工智慧能力。

原文:

https://developer.aliyun.com/article/780370?spm=5176.8068049.0.0.55746d19mJMnZT&groupCode=ai

10
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • TensorFlow Quantum量子架構上的機器學習模型