首頁>科技>

把應用從膝上型電腦搬到生產環境的過程相當漫長。在膝上型電腦上用樣本資料構造出原型後,需在叢集上利用歷史資料去執行模型試驗,然後再在生產環境中將這個演算法部署上線。

在此過程中,很多時候資料科學家不得不重寫程式碼、進行模型轉換、資料傳輸與拷貝等工作,工作量非常大。

那麼能不能構建一個端到端的流水線,幾乎無需修改任何程式碼,就可以無縫、自動化地將AI應用從膝上型電腦搬到分散式環境中呢?

這是英特爾大資料分析和人工智慧創新院正著力實現的願景。自去年6月在中國成立以來,該創新院一直致力於通過優化的庫、軟體與工具組合,真正提高資料分析和AI落地在實際生產環境中的效率。

近日,通過對話英特爾大資料技術全球CTO、大資料分析和人工智慧創新院院長戴金權,我們試圖看清英特爾在人工智慧軟體佈局上,究竟在下怎樣一盤棋?

▲英特爾大資料技術全球CTO、大資料分析和人工智慧創新院院長戴金權

一、創新院應用研究的“三駕馬車”

英特爾希望構建一個統一大資料分析和AI的端到端流水線,可以直接訪問生產資料,當用戶需要將AI應用從膝上型電腦遷移到大型叢集進行分散式訓練或推理時,幾乎不需要修改任何程式碼。

為了實現這一願景,英特爾大資料分析與人工智慧創新院的方法是應用研究,具體而言有“三駕馬車”:前沿技術研究、開源軟體平臺、實際應用落地。

前沿技術研究可分為兩個階段,早期研究如何在大資料平臺上高效構建深度學習應用,下一步研究則側重於在大資料環境下更好地將AI進行自動化和無縫擴充套件。

據戴金權透露,在今年6月的CVPR學術會議上,英特爾大資料分析和人工智慧創新院將對其最新工作進行一個階段性報告,主要工作即是如何在分散式大資料環境中,將機器學習工作流自動化地構建出來。

開源軟體平臺包括基於Apache Spark的分散式高效能深度學習框架BigDL和統一的大資料分析+人工智慧平臺Analytics Zoo。

BigDL與TensorFlow、Caffe等框架的功能類似,能在現有的Hadoop和Spark叢集上構建各種資料分析和深度學習應用。Analytics Zoo則被定位為一個框架之上的軟體平臺,主要特點是支援各種不同的深度學習框架和大資料框架、庫和工具。

這些平臺在利用硬體計算能力的同時,也通過構建開源生態系統能實現更加自動化、無縫的感知,更好地幫助使用者解決問題。

很多英特爾的使用者、客戶和合作夥伴已採用此類開源軟體平臺,戴金權舉了一些最新的國內外實際應用落地案例。

在國內,Analytics Zoo已集成於阿里雲E-MapReduce服務上,該服務可直接執行深度學習應用。在去年的阿里雲天池大賽上,英特爾還曾利用Flink加上Analytics Zoo來提供實時的垃圾分類檢測的工作。

Analytics Zoo也整合在騰訊雲智慧鈦機器學習TI-ONE平臺當中,提供各種基於大資料的深度學習的資料處理和分析。

東軟將基於AutoML時間序列分析的功能整合在其應用效能管理產品RealSight APM中,為他們的使用者提供應用效能的管理和分析。

金風慧能基於Analytics Zoo構建AI應用,將部分地區功率預測準確率從60%提升到80%以上,從而達到節能的效果。

在國外,Analytics Zoo已集成於美國IBM Cloud Pak for Data中,美國萬事達(Mastercard)基於Analytics Zoo和BigDL構建了深度學習推薦服務,歐洲原子研究機構CERN基於Analytics Zoo 和 BigDL 構建了大型強子對撞機的實時事件過濾器;南韓最大的電信公司SK Telecom基於Analytics Zoo構建了智慧通訊網路管理。

二、Analytics Zoo的三層功能

Analytics Zoo構建在英特爾oneAPI底層的軟體層上,以此為基礎提供三層功能。

第一層是統一的資料分析和AI流水線,可提供相對水平的流水線,幫使用者將AI、深度學習可以擴充套件到大規模分散式的大資料環境當中。

在這一層中,Analytics Zoo將TensorFlow、Keras、PyTorch、BigDL、Spark、Flink等框架有機整合在一起,當用戶想針對其應用需求採用適合的處理方式時,能更加靈活地構建端到端的工作流。

例如SK Telecom、Mastercard等使用Analytics Zoo在Spark上執行大規模分散式TensorFlow來處理他們的資料。

第二層是一個自動化的機器學習工作流,能夠通過AutoML等自動化方法幫助使用者構建下層的流水線。東軟、騰訊雲等客戶均與英特爾合作使用這樣的功能。

最上層針對不同應用場景,提供相應的模型和演算法,使用者也可以在Analytics Zoo平臺上使用任何標準的深度學習框架,包括TensorFlow、PyTorch等。

三、從整體軟體佈局看英特爾的AI底氣

在人們的印象中,英特爾是一家硬體技術實力雄厚的晶片公司,但它在人工智慧軟體領域的嚴密佈局同樣不容小覷。

第一,從研究角度來看,國內外的英特爾研究院進行均做了很多相對中長期的AI演算法等研究。例如英特爾中國研究院在計算機視覺領域開展了許多前沿研究。戴金權介紹說,英特爾在AI演算法研究方面有非常大的投入。

第二,除了研究之外,英特爾很多工作針對中期到近期的軟體棧,包括將AI軟體棧很好執行在CPU、GPU、FPGA、ASIC等不同硬體架構上的統一程式設計模型oneAPI、各種針對深度學習的計算庫、對TensorFlow、PyTorch、MXNet等開源框架的各種優化以及OpenVINO等推理引擎方面的工作。

第三,在此基礎之上,英特爾試圖為使用者構建一個方便高效的端到端平臺,能夠擴充套件到大資料、大規模叢集上,並且可以非常透明的擴充套件到不同硬體架構上,將特徵工程、超引數調整、模型選擇和分散式推理等許多原來需要人工完成的工作,通過機器學習的方式將其自動化,從而大幅提升生產效率和模型準確率,更好提升應用級別的服務。

接下來,英特爾將繼續探索基於一些較重要的應用場景,構建更貼近使用者最終應用的解決方案。

結語:軟硬體協同加速AI高效落地

“在我們看來,軟硬體協同才可以真正能夠將硬體或晶片的計算能力發揮到極致。”戴金權說。

很多使用者面臨的核心問題,不是跑什麼硬體、用什麼深度學習框架,而更多是應用層面的問題。

英特爾以底層的硬體創新為基石,經過基礎軟體和平臺軟體的中間層次,最後在應用軟體層次幫助企業使用者解決核心問題。

現在越來越多企業正將大資料分析和AI應用於生產、運營等多個環節,而像英特爾這樣軟硬體協同創新的解決方案,不僅有助於降低企業數字化轉型的門檻,也為提升AI應用落地效率按下了加速鍵。

最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 網貸借了16個平臺,負債52萬全部逾期了,面對暴力催收我該咋辦?