機器學習（ML）技術多維度分析

首頁>技術>啟迪雲Tuscloud2021-01-25 15:49

機器學習（ML）技術多維度分析

機器學習指專門研究計算機怎樣模擬或實現人類的學習行為以獲取新的知識或技能的學科，使計算機重新組織已有的知識結構並不斷改善自身的效能。機器學習以資料為基礎，透過研究樣本資料尋找規律，並根據所得規律對未來資料進行預測。機器學習是人工智慧的核心，廣泛應用於資料探勘、計算機視覺、自然語言處理、生物特徵識別等人工智慧領域。

(1)按學習模式的不同，機器學習可分為監督學習、無監督學習、強化學習：

①監督學習的訓練資料具有分類標籤，分類標籤精確度越高，學習模型準確度越高。監督學習根據給定的訓練資料建立函式模型，可實現對新資料的標記對映。監督學習的演算法包括迴歸和分類，應用領域包括自然語言處理、資訊檢索、文字挖掘、手寫體辨識、垃圾郵件偵測等。

②無監督學習利用無標記的有限資料描述隱藏於資料中的結構或規律，其典型演算法為聚類。無監督學習無需以人工標註資料為訓練樣本，可避免正、負樣本偏移引起的分類錯誤問題。無監督學習的應用領域包括經濟預測、異常檢測、資料探勘、影象處理、模式識別等。

(2)按演算法網路深度的不同，機器學習可分為淺層學習和深度學習：

①淺層學習演算法網路的隱藏層數量少，演算法框架簡單，無需提取多層次抽象特徵。典型的淺層學習包括支援向量機、邏輯迴歸等。

②深度學習是一種基於多層神經網路並以海量資料為輸入規則的自學習方法，依靠提供給它的大量實際行為資料，即訓練資料集，進行規則中的引數和規則調整。深度學習演算法網路的隱藏層數量多，演算法複雜，相比淺層學習，深度學習更注重特徵學習的重要性。

典型的深度學習演算法包括卷積神經網路、迴圈神經網路等。

機器學習產業鏈包括上游的人工智慧晶片供應商、雲計算平臺服務商、大資料服務商，中游的機器學習技術服務商以及下游的機器學習應用服務商。機器學習產業鏈上游為支援基礎層，上游的人工智慧晶片供應商主要負責提供GPU、ASIC、FPGA等人工智慧專用晶片，大資料服務商提供的服務包括資料採集、資料處理、資料儲存、資料交易等，雲計算平臺服務商提供的服務包括IaaS、PaaS、SaaS等。

產業鏈中游為技術層，中游的機器學習技術服務商為下游的機器學習應用服務商提供機器學習基礎開源框架、機器學習技術開放平臺等機器學習技術服務。

產業鏈下游為應用層，下游的應用服務商為終端使用者提供基於機器學習的垂直領域應用服務，機器學習的垂直應用領域包括金融、教育、醫療、零售、工業等。

(1)人工智慧晶片供應商

人工智慧晶片是機器學習產業鏈的核心底層硬體，為機器學習應用提供算力基礎。按技術架構的不同，人工智慧晶片可分為GPU、ASIC、FPGA。

GPU具有軟體生態齊全、平行計算能力強的特點，是現階段深度學習訓練的首選晶片。

GPU是一種具有大規模平行計算架構，專為同時處理多重任務而設計的晶片，其發展時間長，產品成熟，支援 CUDA統一架構、OpenCL架構等程式設計環境，程式語言成熟易用，便於開發者開發應用。此外，GPU的峰值計算能力強，處理速度可達CPU的10 至100倍，適用於平行計算大規模資料，可顯著加快深度學習計算速度。

ASIC是全定製化的人工智慧晶片，具有體積小、功耗低、通訊效率高、計算速度快等特點。ASIC是為符合特定使用者需求而定製的專用人工智慧晶片，其計算能力和通訊效率均可透過演算法進行定製，專用化、定製化的設計將資料傳輸時間和資料等待時間壓制到最低，顯著提升晶片效能與執行速率。ASIC的主要型別包括TPU、BPU和NPU，其中，TPU為谷歌於2016年研發的專用於機器學習的ASIC晶片。

FPGA可靈活編譯，處理效率高，適用於深度學習預測。FPGA指現場可程式設計門陣列，是在可程式設計器件的基礎上進一步發展的半定製電路，其處理重複計算指令能力強，相比GPU,“CPU+FPGA”混合異構的功耗更低，運用於深度學習預測的效率更高，效能優勢更突出。

現階段，人工智慧晶片市場由海外廠商主導，中國廠商的發展步伐逐步加快，但和海外頭部廠商相比仍有明顯差距。

海外頭部廠商包括英偉達、英特爾、IBM、谷歌、微軟、高通等，英偉達於2018年推出新一代GPU產品NVIDIATeslaV100，英特爾透過收購Altera、Nervana、eASIC、NetSpeedSystems等晶片組廠商佈局人工智慧晶片產品線，谷歌於2018年釋出其第三代人工智慧專用處理器TPU3.0，蘋果於2018年釋出的新款iphone手機均搭載了A12仿生晶片，IBM的人工智慧團隊於2018年利用大規模模擬儲存器陣列訓練深度神經網路，達到與GPU相當的精度。

中國人工智慧晶片廠商著重佈局邊緣端晶片產品，針對安防、自動駕駛、智慧家居、物聯網等領域的終端裝置開發專用的人工智慧晶片，代表廠商包括中星微、華為海思、瑞芯微、寒武紀、地平線、深鑑科技、雲之聲、曠視科技等，中國人工智慧晶片市場以初創型廠商居多。

(2)雲計算平臺服務商

雲計算是一種可迅速提供併發佈網絡、伺服器、儲存、應用等計算資源的模型，使用者可透過網路按需訪問計算資源共享池，實現管理成本或服務供應商干預最小化。按部署方式的不同，雲計算可分為公有云、私有云、混合雲，公有云指利用公共網路向客戶提供具有彈性的計算資源和服務，現階段的雲計算服務市場以公有云服務為主。按服務模式的不同，雲計算可分為IaaS、PaaS、SaaS。

①IaaS（InfrastructureasaService，基礎設施即服務）是將通用計算、儲存、網

絡以及其他基礎硬體資源虛擬化後，以出租的方式提供給客戶的服務模式。典型的

IaaS服務有亞馬遜的AWS，阿里雲的彈性主機服務等。

②PaaS（PlatformasaService，平臺即服務）指為開發者提供應用服務執行和開

發環境的服務模式。典型的PaaS服務有Google的GoogleAppEngine平臺服

務、阿里雲的量子計算雲平臺等。

務的商業模式。典型的SaaS服務有Salesforce的CRM，Workday的HRM，用

友的雲ERP等。

(3)大資料服務商

大資料服務商提供的服務包括資料採集、資料處理、資料儲存、資料交易等，其型別包括學術機構、資料外包服務公司、人工智慧應用服務公司。

學術機構透過自行採集、標註大量資料來建立學術研究資料庫，以用於演算法的創新性驗證、學術競賽等，該類資料庫迭代速度慢，商業應用場景有限，典型代表有ImageNet。

資料外包服務公司是最常見的大資料服務商型別，其業務型別包括出售現成資料訓練集的使用授權以及根據使用者特定需求提供資料採集、資料標註、資料轉寫等服務。

人工智慧應用服務公司同是大資料服務的需求方和供給方，除購買資料外包服務公司的相關服務外，人工智慧應用服務公司還透過自建資料服務團隊來構建自用資料庫，部分人工智慧應用服務公司將自建資料庫包裝成產品出售，大資料服務成為其業務板塊之一。

機器學習基礎開源框架是構建機器學習模型的重要根基，市場中的機器學習基礎開源框架產品繁多，市場競爭激烈，谷歌、亞馬遜、Facebook等網際網路巨頭在機器學習基礎開源框架領域具有領先優勢。

谷歌於2016年推出機器學習系統開源工具TensorFlow，適用於智慧手機、大型資料中心伺服器等各類硬體裝置，市場關注度不斷提升。MXNet是亞馬遜的機器學習基礎開源框架產品，其適用於Python，R，Julia，Scala，Javascript等語言，可在多個CPU、GPU裝置上進行分散式訓練，運算效率優勢突出。Facebook於2018年推出機器學習基礎開源框架產品Pytorch，該產品通用性強，語言簡單，使用者數量逐漸增多。

其他機器學習基礎開源框架典型代表產品有Theano、Caffe、Keras等。

機器學習技術開放平臺為開發者提供基於機器學習的應用開發環境，可簡化開發者對演算法的介面呼叫、視覺化、引數調優等自動化任務的管理。典型的機器學習技術開放平臺包括亞馬遜的Amazon Machine Learning、微軟的Azure機器學習工作臺、騰訊的DI-X機器學習平臺、阿里雲機器學習 PAI等。

作為機器學習領域的主流演算法之一，深度學習憑藉其適應性強、準確率高等特點獲得市場高度關注，應用領域不斷拓寬，其在影象識別、語音識別、人臉識別等領域的應用逐步加深，發展步伐顯著加快，深度學習的迅速發展是推動機器學習行業升級發展的重要因素。

在機器學習市場中，基礎層核心晶片被英偉達、英特爾、IBM、谷歌、微軟、高通等海外傳統晶片大廠商掌控，雲計算由谷歌、亞馬遜、阿里雲等網際網路巨頭引領，大資料服務商數量多，分佈零散，市場競爭激烈。

技術層機器學習基礎開源框架以谷歌的TensorFlow、亞馬遜的MXNet、Facebook的Pytorch、Theano、Caffe、Keras等為主，機器學習技術開放平臺主流產品包括亞馬遜的AmazonMachineLearning、微軟的Azure機器學習工作臺、騰訊的DI-X機器學習平臺、阿里雲機器學習 PAI等。應用層以初創型廠商居多，市場競爭最為激烈，典型代表廠商包括商湯科技、依圖科技、雲從科技、第四正規化、寒武紀、深鑑科技等。

∨ 最簡單方法！！用python生成動態條形圖

熱門排行

劇多

機器學習（ML）技術多維度分析