機器學習、深度學習、遷移學習、TensorFlow、PyTorch……一個個神乎其神的專業詞彙,讓AI似乎有點“高處不勝寒”,跟各種企業總有種“距離感”。因此,消除“距離感”,讓AI普惠化,真正進入千行百業之中,就成為近年來各大廠商實現AI平民化的核心目標。
所謂普惠AI,其本質核心就是從“用上”到“用好”的過程,即如何讓更多不同型別的人員在更多業務場景中更好地使用AI。這是一個極為艱難的歷程,需要透過產品層面的不斷完善,來充分考慮不同型別人員使用AI的習慣,以降低其在業務場景中使用AI的難度,然後不斷迴圈迭代,實現AI在各種業務場景中的深入應用。
在眾多廠商中,雲計算巨頭亞馬遜雲服務(AWS)是推動AI走向普惠化的重要代表。從2016年開始在機器學習領域釋出三個服務開始,逐年增加每年新增的服務和功能;最近三年,每年都新增超過200個服務;迄今為止有超過10萬用戶在AWS上使用機器學習服務,極大推動了機器學習技術在千行百業中的落地。
今年AWS re:Invent大會上,跟機器學習相關的產品釋出依然是大會的重頭戲,隨著AWS一系列跟機器學習相關新產品和新服務,筆者愈發感受到AWS加速掃除機器學習應用的幾個攔路虎,在普惠AI這件事情上走在了業界最前沿。
AI百寶箱:為使用者更多選擇在數字化時代,人工智慧是使用者智慧化升級的重要技術手段。但人工智慧並不是一個孤立存在技術,涉及到從底層晶片、機器學習框架、AI服務等一系列環節。要想真正讓使用者把AI用好,這要求AI產品和服務在產品的深度與廣度上為使用者提供足夠多的選擇權。
“為AI每一項工作都提供一個趁手的工具,並給予使用者更多選擇權,這是AWS在機器學習的宗旨。”AWS大中華區雲服務產品管理總經理顧凡如是說。所以,我們看到今年AWS又推出了超過250項新服務或新功能,進一步豐富了AI工具箱。
具體來看,在底層AI晶片和機器學習框架方面,AWS可以提供基於英偉達、英特爾、AMD、賽靈思等晶片廠商的最新處理器的強大算力,並透過自主設計的處理器,極大地降低機器學習的算力成本。顧凡直言:“不同機器學習應用對於算力的顆粒度和需求是不一樣的。在計算領域重塑的創新點就是量體裁衣,將細分需求坐待極致。”據悉,AWS此次推出了兩款訓練新產品:基於intel Habana Gaudi、AWS Trainium,其中Trainium專門針對訓練提供極致價效比。
在中間層的SegaMaker全託管機器學習整合開發環境上,AWS此次一口氣推出了九款重量級的新功能,包括更易用的資料預處理、專用的特徵儲存、自動化工作流、更多的訓練資料可見性以減少資料傾斜和更好的預測解釋、大型模型的分散式訓練速度可最多提升兩倍,以及監控邊緣裝置上的模型。
比如,機器學習的資料準備是一個極為耗時、複雜過程。因為機器學習用於訓練的資料特徵通常都是多源異構的,很多資料科學家往往耗費大量精力在資料提取和規範上。這種基礎工作耗時、耗力,的確是當前很多使用者在使用AI過程中的典型挑戰。
為此,AWS推出了為機器學習將將資料轉化為特徵的工作稱為特徵工程的快速簡便工具--Amazon SageMaker Data Wrangler。透過 Amazon SageMaker Data Wrangler,客戶可以從各種資料儲存中快速資料,並一鍵匯入,成為模型的特徵資料。據悉,Amazon SageMaker Data Wrangler支援與其他產品進行廣泛對接,包括一鍵直接對接Amazon Athena、Amazon Readshift、Amazon S3、AWS CloudFormation ,Snowflake、MongoDB、Databricks等。
“Data Wrangler解決了從原始資料到特徵資料轉換的易用性問題。但特徵資料大量出現之後,其儲存和管理也會遇到挑戰,這也是當前很多使用者向我們反饋的一點。”顧凡介紹道。
之前,很多開發人員和資料科學家試圖使用電子表格、筆記和電子郵件來解決這個問題。他們甚至要嘗試開發一個應用程式來跟蹤管理特徵,工作量大且容易出錯。為解決特徵資料的儲存與管理,AWS推出了Amazon SageMaker Feature Store,提供了一個專門構建的特徵庫,供開發人員訪問和共享特徵,使開發人員和資料科學家團隊可以輕鬆地儲存、更新、檢索和共享用於訓練和推理的機器學習特徵。
毫無疑問,隨著Amazon SageMaker功能越來越全面,其正在解決的是從資料準備、到模型訓練、引數調優與模型迭代、到模型部署、模型質量監控等整個機器學習過程中的產品易用性和提升機器學習效率,從而真正實現降低AI門檻的目的。
在面向技術能力相對薄弱的使用者群,AWS為他們提供開箱即用的人工智慧服務,目前已經涵蓋機器視覺、語音文字轉換、機器對話、文字處理、電商業務、客服、企業內資訊搜尋、開發與運維、工業AI等方面。
“Amazon Sagemaker成為AWS史上增長最快的服務之一。現在,AWS希望將機器學習每一個工作流越做越細。”顧凡總結道。
讓更多人用上和用好AI眾所周知,資料科學家或者AI技術人員屬於極少一部分人群,這部分人群的專業度和技術能力不可比擬。企業中大部分人員都不具備相關的知識和技能,但這部分人又渴望在自身的業務場景中能夠用到機器學習等跟技術。
進入到智慧化時代,AI並不應該是資料科學家或者AI技術人員的專屬。從讓AI更加普惠的角度來看,企業有更多人員使用和用好AI,那無疑會極大提升AI應用效率,並且會加速AI場景的落地。
為此,AWS做了一項重要的創新,就是將機器學習能力跟資料庫進行嫁接,讓資料庫開發者、資料分析師沿用資料庫查詢的方式,讓他們的機器學習想法落地到業務應用中。此次re:Invent大會上,AWS一口氣介紹了Amazon Aurora ML、Amazon Athena ML、Amazon Redshif ML、Amazon Neptune ML以及Amazon QuickSight 等多項功能,給資料庫、資料倉庫、圖資料庫、BI等服務都集成了機器學習功能,讓資料庫開發者和資料分析師可以將機器學習用起來。
“舉一個例子,電商領域經常會哪些客戶有可能流失,這時你可能並沒有一個模型來判斷什麼樣特徵的客戶有可能會流失。透過Redshift ML,資料分析師只管SQL查詢,Redshift ML可以把資料匯入S3,然後SageMaker的Autopilot功能結合。Autopilot是一個自動建模的功能。這樣的Redshift ML可以自動進行資料清洗、模型訓練,選擇最優的模型進行預測。”顧凡補充道。
毫無疑問,AWS此舉將極大提升人工智慧的使用人群,讓更多人更加簡單地把AI用起來。
目前,AWS是將機器學習能力與自身的資料庫產品進行嫁接與整合,未來是否會擴充套件到AWS其他資料庫品牌服務商。對此,顧凡表示:“Amazon Data Wrangler就是使用者喜歡型別,可以對接不同品牌的資料來源產品。AWS的原則是客戶至尚,未來一定會朝著這個方向迭代。”
將AI深入行業進行到底曾幾何時,AI常被人揶揄為:有技術、沒場景,一堆高薪的AI人才卻不知如何發揮。這其實從側面反映出人工智慧在行業業務場景中所遇到的挑戰,即如何將場景與AI進行更好地融合。機器學習等技術最早在網際網路的各個業務場景中得到落地與重用,但在其他行業之中依然任重道遠。所以,場景化一直都是近年來各行各業使用者採用AI的主旋律話題。
那麼,如何真正的將AI融入到行業的業務場景之中?這其中絕對不僅僅是幾個資料科學家、幾套演算法就能夠搞定的。很多行業使用者往往需要是開箱即用的解決方案,在一套解決方案中融入了包括硬體、演算法、軟體等一系列產品,並且還需要具備企業級的特徵,保障各種產品可以持續高效穩定執行。
因此,普惠AI的另一大重要的任務就是在行業場景中提供開箱即用的產品與解決方案。比如,AWS釋出了Amazon Monitron、Amazon Lookout for Equipment、AWS Panorama Appliance、AWS Panorama SDK和Amazon Lookout for Vision。這五項全新的機器學習服務共同幫助工業和製造業客戶在其生產過程中嵌入智慧能力,以提高運營效率,改善質量控制、資訊保安和工作場所安全。
Amazon Monitron提供包含感測器、閘道器和機器學習服務的端到端機器監控解決方案,以檢測可能需要維護的異常裝置狀況。 Amazon Lookout for Equipment為擁有裝置感測器的客戶提供了使用AWS機器學習模型來檢測異常裝置行為並進行預測性維護的能力。 AWS Panorama Appliance幫助已在工業設施中裝配攝像機的客戶使用計算機視覺來改善質量控制和工作場所安全。 AWS Panorama軟體開發套件(SDK)使得工業相機制造商可以在新相機中嵌入計算機視覺功能。 Amazon Lookout for Vision在影象和影片流上使用AWS訓練的計算機視覺模型,以發現產品或生產流程中的異常和缺陷。“針對具體行業的業務問題,例如,在具體行業之中到底要解決什麼問題,在什麼情況下使用什麼工具?AWS的思路是提供端到端的解決方案,非常有針對性的定製相關的服務於產品。”顧凡表示。
結語顧凡認為:“AI並不應該僅僅是大型公司所擁有。”
誠然AI雖好,但手頭沒有趁手工具是萬萬不行的。為機器學習每一個工作流、每一個環節打造最合適、最易用的功能與產品,是當下AWS在機器學習領域的目標,也的確是當下所有使用者所亟需的。面向未來,隨著AWS在機器學習領域產品與服務的不斷完善,有望幫助更多行業使用者加速AI落地與應用的步伐。