首頁>政治>

簡介: 總結了一下過去5年在各個高校進行大資料人才培養的經驗

1.1 大資料相關政策背景

2015年中央政府工作報告提出制定“網際網路+”行動計劃,大資料作為“網際網路+”行動計劃的重要組成部分,已成為新一代資訊科技變革的核心。在工作報告中提出要全面鼓勵技術創新,保護髮明創造,同時還提出企業是技術創新的主體,鼓勵和支援企業主導的產學研協同創新,大力發展眾創空間,增設國家自主創新示範區,辦好國家高新區,發揮集聚創新要素的領頭羊作用。

同時,國務院還對外發布了《促進大資料發展行動綱要》,明確指出,資訊科技與經濟社會的交匯融合引發了資料迅猛增長,資料已成為國家基礎性戰略資源,大資料正日益對全球生產、流通、分配、消費活動以及經濟執行機制、社會生活方式和國家治理能力產生重要影響。目前,中國在大資料發展和應用方面已具備一定基礎,擁有市場優勢和發展潛力,但也存在創新應用領域不廣等問題,亟待解決。

為推動中國大資料產業持續健康發展,實施國家大資料戰略,落實國務院《促進大資料發展行動綱要》,按照《中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》總體部署,2017年1月,工業和資訊化部正式釋出了《大資料產業發展規劃(2016-2020年)》(工信部規〔2016〕412號,以下簡稱《規劃》)。

2016年2月,教育部公佈新增的“資料科學與大資料技術”專業(程式碼080910T),北京大學、對外經濟貿易大學、中南大學成為首家獲批高校。時隔一年,2017年3月,教育部公佈第二批“資料科學與大資料技術”專業獲批的32所高校。2018年3月,教育部公佈第三批“資料科學與大資料技術”專業獲批的250所高校。2019年3月,教育部公佈第四批“資料科學與大資料技術”專業獲批的203所高校。截止到2019年3月,中國已有488所高校獲批該專業。該專業強調培養具有多學科交叉能力的大資料人才,重點培養具有以下三方面素質的人才:一是理論性的,主要是對資料科學中模型的理解和運用;二是實踐性的,主要是處理資料的能力。三是應用性的,主要是利用大資料的方法解決具體行業應用問題的能力。

2016年9月,教育部公佈新增“大資料技術與應用”專科專業(程式碼610215)),截止到2019年1月,全國已經有409所高職院獲批該專業。 該專業強調培養具有大資料實踐能力的大資料人才,重點培養具有以下兩方面素質的人才:一是工具的掌握,掌握資料採集和資料分析的基本工具;二是資料分析能力,掌握實用資料分析和初步資料建模能力。

在交叉學科方面,2018年教育部批准了首批5所高校建設“大資料管理與應用”專業, 2019年3月該專業新增25所高校。

1.2 人工智慧相關政策背景

2017年7月8日,國務院釋出了《國務院關於印發新一代人工智慧發展規劃的通知》(國發〔2017〕35號),戰略目標分成三步走:

第一步,到2020年人工智慧總體技術和應用與世界先進水平同步,人工智慧產業成為新的重要經濟增長點,人工智慧技術應用成為改善民生的新途徑,有力支撐進入創新型國家行列和實現全面建成小康社會的奮鬥目標。新一代人工智慧理論和技術取得重要進展。大資料智慧、跨媒體智慧、群體智慧、混合增強智慧、自主智慧系統等基礎理論和核心技術實現重要進展,人工智慧模型方法、核心器件、高階裝置和基礎軟體等方面取得標誌性成果。人工智慧產業競爭力進入國際第一方陣。初步建成人工智慧技術標準、服務體系和產業生態鏈,培育若干全球領先的人工智慧骨幹企業,人工智慧核心產業規模超過1500億元,帶動相關產業規模超過1萬億元。人工智慧發展環境進一步優化,在重點領域全面展開創新應用,聚集起一批高水平的人才隊伍和創新團隊,部分領域的人工智慧倫理規範和政策法規初步建立。

第二步,到2025年人工智慧基礎理論實現重大突破,部分技術與應用達到世界領先水平,人工智慧成為帶動中國產業升級和經濟轉型的主要動力,智慧社會建設取得積極進展,新一代人工智慧理論與技術體系初步建立,具有自主學習能力的人工智慧取得突破,在多領域取得引領性研究成果。人工智慧產業進入全球價值鏈高階。新一代人工智慧在智慧製造、智慧醫療、智慧城市、智慧農業、國防建設等領域得到廣泛應用,人工智慧核心產業規模超過4000億元,帶動相關產業規模超過5萬億元。初步建立人工智慧法律法規、倫理規範和政策體系,形成人工智慧安全評估和管控能力。

第三步,到2030年人工智慧理論、技術與應用總體達到世界領先水平,成為世界主要人工智慧創新中心,智慧經濟、智慧社會取得明顯成效,為躋身創新型國家前列和經濟強國奠定重要基礎,形成較為成熟的新一代人工智慧理論與技術體系。在類腦智慧、自主智慧、混合智慧和群體智慧等領域取得重大突破,在國際人工智慧研究領域具有重要影響,佔據人工智慧科技制高點。人工智慧產業競爭力達到國際領先水平。人工智慧在生產生活、社會治理、國防建設各方面應用的廣度深度極大拓展,形成涵蓋核心技術、關鍵系統、支撐平臺和智慧應用的完備產業鏈和高階產業群,人工智慧核心產業規模超過1萬億元,帶動相關產業規模超過10萬億元。形成一批全球領先的人工智慧科技創新和人才培養基地,建成更加完善的人工智慧法律法規、倫理規範和政策體系。

2003年,北京大學(分數線,專業設定)創辦了國內第一個“智慧科學與技術”本科專業,人工智慧方向的本科教育受到越來越多關注。教育部公開資訊顯示,截至2017年12月,全國共有71所高校圍繞人工智慧領域設定了86個二級學科或交叉學科。

繼2017年中國科學院大學、西安電子科技大學等高校設立人工智慧學院之後,2018年,清華大學(分數線,專業設定)、哈爾濱工業大學、上海交通大學、南京大學、重慶郵電大學等一批高校也紛紛設立人工智慧學院、人工智慧研究院。截至2018年7月,中國進行人工智慧相關研究、開設人工智慧相關專業的院校共有89所。

2019年3月,教育部批准了35所高校建設“人工智慧”新專業資格, 同時還有96所高校獲批“智慧科學與技術”專業,101所高校獲批“機器人工程”專業。

1.3 大資料產業需求

根據IDC報告,2019年全球大資料市場規模將達到1250億美金,中國在全球大資料市場佔比將超過8%(超過650億人民幣)。考慮到和大資料相關的行業軟體、解決方案、服務和硬體,整個大資料市場規模在2019年將達到幾千億的規模,每年都在以非常快的速度遞增。

根據麥肯錫全球研究院的報告,中國未來3-5年內需要有180萬人從事大資料相關的崗位,目前大約有150萬人才缺口。各個行業都急需大資料人才,特別是熟悉大資料採集加工處理和深度學習建模的大資料工程人才:大資料工程師;熟悉行業知識和大資料的交叉複合型人才:大資料分析師;以及熟悉分散式、多執行緒和海量資料的大資料JAVA全棧工程師。

1.4 人工智慧產業需求

根據Gartner最新發布的預測報告,2018年全球人工智慧市場規模將高達1.2萬億美元,較2017年增長70%之多。2022年人工智慧驅動的商業價值將高達3.9萬億美元,其中決策支援/增強(例如DNN深度神經網路)2018年佔據市場總規模的39%,2022年佔據44%,虛擬助理(2018年46%,2022年26%),智慧產品(2018年18%,2022年14%),決策自動化系統(2018年2%,2022年16%)。

根據來自Linkin的資料,截至2017年第一季度全球人工智慧領域專業技術人才數量超過190萬,其中美國人工智慧領域專業技術人才總數超過85萬,高居榜首。中國人工智慧領域專業技術人才總數超過5萬人,排在全球第7位。印度、英國、加拿大、澳洲和法國分列2-6位。截至到2018年10月,全球擁有深度學習技能的人才超過9.5萬,其中中國擁有超過5000人,同樣排在全球第7位。

根據產業界的資訊,未來3到5年中國人工智慧人才缺口超過500萬人。

2.1 大資料主要人才需求

1)演算法工程師:實現具體商業過程中演算法的落地和優化(依賴演算法軟體工具,圖形化或API),比如精準營銷演算法工程師、商業分析演算法工程師、音/視訊演算法工程師、影象處理演算法工程師、計算機視覺演算法工程師、通訊基帶演算法工程師、訊號演算法工程師、射頻/通訊演算法工程師、自然語言演算法工程師、搜尋演算法工程師

2)大資料工程師: 主要負責大資料採集、加工、處理、海量資料儲存、資料視覺化、BI報表、機器學習/深度學習(依賴演算法軟體工具,圖形化或調取API)等。

3)大資料分析師:主要負責運營或資料分析工作,以圖形化託托拉拽為主(本身對技術了解不深入,主要依賴工具),涉及到資料處理、統計分析和機器學習等。

2.2 大資料核心領域關鍵詞

1) 機器學習/深度學習/統計分析/資料探勘

2) 離線分散式計算/實時計算/流計算/複雜事件處理

3) 資料視覺化/網際網路資料爬取/離線分散式開發……

4) 資料採集/資料加工/資料處理/資料同步/海量資料儲存/BI報表……

5) 資料統一儲存/資料統一管理/資料安全統一管理

6) 安全沙箱/資源隔離/資源排程/遠端方法呼叫/分散式儲存……

7) TensorFlow

8) Aliyun MaxCompute/ODPS……

9) Apache Hadoop/HDFS/YARN/MapReduce/Ambari/Avro/Cassandra/Chukwa/HBase/Hive/Mahout/Pig/Tez/ZooKeeper/Solr……

10) Spark/Spark RDD/DataFrame/Spark SQL/Spark Streaming/Spark MLlib/Spark GraphX……

11) IBM BigInsights/Cloudera CDH/Impala/Hue/Hortonworks HDP/FusionInsight……

12) Apache Flink/Spark Streaming/ Apache Storm/ Apache Trident Storm / Apache Samza ……

13) Alibaba Cloud StreamCompute/IBM InfoSphere Streams……

14) Cloudera Impala/Pivotal HAWQ/IBM Big SQL/Drill/Hive/MaxCompute SQL/Google Dremel/Google Tenzing/BigQuery……

15) Analytic DB/HANA……

16) Echarts/JavaScript/QuickBI/DataV……

2.3 大資料工程師培養目標

學生具有大資料工程師工作滿一年的水平,能夠獨立負責一些小的專案,同時具有大資料相關認證證書。能夠運用大資料技術與應用專業思想與方法、知識與技術,依據大資料工程相關的標準與規範,設計針對特定領域的複雜大資料工程問題的解決方案,包括滿足需求設計、部件選擇、工程實施流程或方案設計,並能夠在設計環節中體現創新意識,考慮社會、健康、安全、法律、文化以及環境等因素。

1) 針對特定使用者或系統需求,給出大資料應用系統的規劃與設計、部署與實施、管理與運維方案;

2) 針對特定使用者或系統需求,給出大資料應用系統的開發、測試與智慧分析方案;

3) 針對特定的場景,給出應用大資料系統的設計方案;

4) 能夠在領域大資料應用系統的規劃與設計、部署與開發、管理與安全保障過程中,並在相關的法律與規範框架下,在設計或實施方案中予以必要的考慮到資訊與公共安全、經濟與社會、文化與倫理、環境保護等因素的可能影響。

2.4 大資料分析師培養目標

學生具有大資料分析師工作滿一年的水平,能夠獨立負責一些小專案的分析和運營,同時具有大資料相關認證證書。學生可以依託大資料、資料視覺化、BI報表以及機器學習等工具,通過圖形化的托拉拽(程式設計能力不要求)等方式完成對商品、客戶行為日誌/購買日誌/物流記錄、網際網路爬取資料、第三方資料等進行資料分析、挖掘和展現等,從而找出特定規律/規則/方法等,從而進一步支援業務決策。

2.5 演算法工程師培養目標

1)具有演算法工程師工作滿1年水平,可以獨立完成多種資料來源的預處理、資料特徵工程提取、多種演算法如邏輯迴歸、GBDT、隨機森林、神經網路、線性支援向量機、PS-SMART二分類和樸素貝葉斯等模型的建模過程和優化方式,以及針對這些建模效果的評估等

2)理解專案管理基本知識,能夠協調團隊一起完成一個大資料小型專案,能否預估各個階段的風險並有合理應對方案。

3)理解大資料和人工智慧演進歷程,掌握開源大資料/人工智慧產品、企業級開源大資料/人工智慧產品以及阿里雲大資料/人工智慧產品的優劣勢。

4)具有真實專案構建經驗,熟悉人工智慧應用創新,能夠領導一個team從0到1落地一個人工智慧專案。

最新評論
  • 天翼雲躋身前三,移動雲仍委身others,二者終有一戰?
  • 印度終於接收第一架陣風戰機 印度網友評論又多了一個玩具