首頁>教育>

為加快推進大資料、人工智慧專業人才的培養,教育部陸續在高校增設大資料和人工智慧專業,鼓勵和指導國內各高校開設大資料、人工智慧專業課程。作為新興的交叉學科,大資料、人工智慧相關專業涉及計算機、數學、統計等多學科知識,高校在開設該領域專業/課程時普遍遇到師資、實訓環境、教學資源三方面的難題。

本期,E企研究院“人工智慧教育加速季”鎖定寶德面向國內各高校提供的大資料人工智慧專業自籌建到教學實施的一站式服務,集專業建設諮詢、實驗室建設、教學資源研發、師資培訓、聯合教學、人才認證於一體,助力高效解決人工智慧實訓環境缺失等問題。

搭建實訓環境:專業教學工作的基礎

寶德大資料人工智慧實驗室由寶德大資料一體機TxData,大資料平臺TDH和人工智慧平臺Sophon,教學實訓平臺TUO組成,實驗環境透過虛擬化容器雲技術實現,線上一鍵調取大資料、人工智慧實驗環境;具備完善的教務管理功能,設有管理員、教務、班主任、教師、學生角色;平臺整合有支撐教學使用的理論課程、實訓案例、資料集、教材講義等資源。

以上配置可完美支撐60人 併發大資料人工智慧實踐教學使用

1、 教學實訓平臺 TUO

該平臺是一款針對高校大資料、人工智慧專業教學使用的一站式綜合教學實訓平臺,依託寶德企業級大資料、人工智慧平臺的技術支撐,為高校的大資料人工智慧教學提供實訓實驗環境,並配套提供支撐教學使用的理論課程、實訓案例、資料集、教材講義等資源,方便高校學生在課堂及實驗室外學習並應用大資料人工智慧技術,透過線上的自主學習及實戰演練,理解大資料科學原理,掌握資料科學體系,並體驗真實場景下的大資料建模分析操作與演練過程。

2、大資料平臺TDH

大資料實驗底層環境使用寶德企業級大資料平臺(簡稱TDH),為整個實驗系統提供大資料處理及分析能力的強力支撐,透過虛擬化容器雲技術將伺服器叢集的多種資源(CPU、記憶體、儲存、網路等)池化,保證伺服器叢集資源的充分和有效利用。

3、人工智慧平臺 Sophon

人工智慧實驗底層環境使用寶德企業級人工智慧平臺Sophon,該平臺打通了大資料平臺和人工智慧平臺,提供資料清洗、資料分析挖掘、機器學習、深度學習、模型管理、API部署、工作流排程等功能,高校師生可以透過自動建模以及內建 的行業模板輕鬆構建對應AI模型,從而提升教學和科研的效率與價值。

4、寶德大資料一體機TxData

Powerleder TxData Appliance(簡稱TxData)是透過軟硬體一體化裝置實現計算、儲存、網路、虛擬化和應用融合的緊密整合的大資料平臺。TxData支援容器技術,可在物理機叢集中以極小的系統開銷建立多個TDH大資料叢集,提供大資料叢集的動態伸縮和故障恢復能力。

TxData可將企業所有的資料處理負載效能最大化,包括聯機事務處理(OLTP)、資料倉庫(DW)和混合工作負載,是海量大資料倉庫應用的最佳平臺。TxData實施簡便,可即時處理最大型關鍵業務應用,批處理速度是開源Hadoop的10-100倍, 是MPP的5-10倍,可對從GB到PB級的資料量實現複雜的查詢和分析。

寶德大資料一體機TxData還支援Intel Analytics Zoo平臺,可直接透過CPU進行分散式訓練或推理(不用GPU卡)。

通用雙路伺服器TxData-2/2G適用於資料量大、深度學習和大資料處理混合負載的雙路伺服器;TxData-4/4G用於流處理節點以及資料量不太大的資料處理節點, 適用於深度學習和大資料處理混合負載的四子星伺服器。

產品規格引數

大資料一體機:為人工智慧教育加速

TxData透過軟硬體一體化裝置實現計算、儲存、網路、虛擬化和應用融合的緊密整合的大資料平臺。大資料平臺的關鍵元件Nameno- de、分散式一致性服務框架、HMaster伺服器以及網路環境已經預配置、預最佳化、預測試,免去了通常規劃、設計、部署大資料平臺系統時的複雜性。所有元件無縫整合地工作,不存在影響整個系統的效能瓶頸或單點故障。

TxData在四個方面進行了獨特的工程最佳化,使得TxData效能得到飛速提升。

第一,SSD快閃記憶體加速。TxData允許使用者將頻繁訪問的表資料儲存在Intel PCIe SSD快取中,TxData還採用獨有專利技術Holodesk,在SSD快閃記憶體中實現列式儲存,更進一步提高了SSD快閃記憶體加速效果,在資料分析和挖掘場景下整體效能提升10倍以上。

第二,網路最佳化。TxData採用支援Intel的萬兆和更高速網絡卡,針對RDMA進行網路傳輸最佳化,使得TxData效能在不同叢集規模下提升20%~80%以上,叢集規模越大,提升效果越好。

第三,FPGA和協處理器加速,將排序、分類、挖掘演算法、深度學習等工作負載優大大提高了大資料平臺的效能。

第四,系統最佳化,透過中斷最佳化、核心最佳化、BIOS引數最佳化、NUMA架構最佳化,使系統執行狀態處於最最佳化狀態。

自動分散式可擴充套件推理平臺:提升深度學習的部署速度

隨著深度學習演算法的不斷創新,越來越多的應用需要對深度學習模型進行大規模和實時的分散式推理服務。為了便於構建和生成面向大資料的深度學習應用程式,英特爾Analytics Zoo 平臺提供了統一的資料分析+ AI平臺,可將TensorFlow,Keras,Pytorch, BigDL Spark, FlinkRay 和 Ray 程式無縫整合到一個統一的資料分析流水線中,用於分散式訓練或預測,方便使用者構建深度學習應用。整個流水線可以透明地擴充套件到執行在由搭載英特爾®至強®可擴充套件處理器的伺服器組成的Hadoop/Spark 叢集上,以進行分散式訓練或推理。

AnalyticsZoo Cluster Serving 解決方案總體框架

透過部署基於寶德 TxData-2/4 AI 推理伺服器的自動分散式可擴充套件推理平臺,使用者能實現如下價值:

✈ 提升深度學習的部署速度

得益於 Analytics Zoo Cluster Serving +寶德 TxData-2/4 AI 推理伺服器的全棧推理解決方案,使用者可以節省在平臺搭建、軟硬體最佳化與驗證等方面的大量時間,快速部署深度學習應用。

✈ 提高系統整體算力

第二代英特爾®至強®可擴充套件處理器具備強大 AI 效能,為該解決方案的算力奠定了堅實基礎,在組建分散式叢集之後,可以應對大型深度學習負載。

✈ 確保面向未來的擴充套件性

該解決方案不僅在軟體層面實現了自動擴充套件規模,還透過伺服器的分散式部署提供了敏捷擴充套件能力,能夠敏捷應對近未來的深度學習對於基礎設施的要求。

總結來看,寶德大資料一體機TxData-2/4 AI 推理伺服器搭載第二代英特爾®至強®可擴充套件處理器,全面支援Analytics Zoo Cluster Serving分散式推理技術方案;專為高效能計算、高階人工智慧分析任務而設計,作為軟硬一體的分散式全棧推理解決方案,具有出色的效能功耗比,而在此基礎上寶德搭建的人工智慧一體化服務,協助高校從根本上解決師資匱乏、實訓環境缺失、教學資源不足等關鍵問題,助力高校大資料人工智慧專業教學工作的順利開展。

6
最新評論
  • 「完整」2022年中級註冊安全工程師《化工安全實務》真題解析
  • 教師取消“帶薪寒暑假”,老師們舉雙手贊成,真沒大家想象中的好