在終端和邊緣側的微處理器上,實現的機器學習過程,被稱為微型機器學習,即TinyML。更準確的說,TinyML是指工程師們在mW功率範圍以下的設備上,實現機器學習的方法、工具和技術。這篇文章,我們來一起探索TinyML的潛在價值和機會。
全文字數:2900字,寫作用時:300分鐘,閱讀時間:10分鐘
物女皇:TinyML,很小卻很大
這是我在【物女心經】專欄寫的第268篇文章。
一根手指代表“播放”,兩根手指代表“暫停”,三根手指代表“停止”…這種遙控“神功”逐步變成現實,並且這項技術正在賦能越來越多的傳感器。
TinyML,微型機器學習,我曾在之前的文章《一文讀懂即將引爆的TinyML:在邊緣側實現超低功耗機器學習》中做過重點介紹。在終端和邊緣側的微處理器上,實現的機器學習過程,被稱為微型機器學習,即TinyML。更準確的說,TinyML是指工程師們在mW功率範圍以下的設備上,實現機器學習的方法、工具和技術。
在智能時代,我們常說萬物皆智,但是如何賦予數以億計、超小體積、極低功耗的設備以智能,這是不得不解決的挑戰。
好在疫情期間,很多傳感器企業並沒有減緩研發的腳步。索尼、三星和博世等企業都正嘗試在不增加部件、提升成本和功耗的前提下,為傳感器嵌入更多的智能。TinyML與傳感器的結合,讓這些探索開花結果。
根據研究機構ABI Research的判斷,一旦開啟億萬量級的微型設備智能化之旅,市場空間將是巨大的。ABI由此預測到2022年底TinyML即服務的收入將超過2.2億美元,並從2025年起,TinyML將成為智能時代的重要組成部分之一。
躺平不可取,手握如此機遇,怎能坐失良機?10月20日,參與創造TinyML一詞、創建TinyML峰會、編寫了TinyML教科書的谷歌TensorFlow Micro團隊前技術負責人皮特(Pete Warden),發文認為市場時機已經成熟,宣佈二次創業,作為創始人投身於TinyML賦能的智能傳感公司。
這篇文章,我們來一起探索TinyML的潛在價值和機會。
用TinyML做爆款智能硬件
一個售價為10美元(約合人民幣72.5元)的硬件模塊,可以嵌入電視、風扇、遙控器、無人機、攝像頭等設備中,輕鬆實現智能功能。電視可以根據主人的手勢實現遙控、風扇可以判斷主人的位置對準送風、攝像頭可以自動識別房間裡的人員數量…這就是皮特的新創公司Useful Sensors正在做的事情。
此前皮特在谷歌帶領機器學習基礎架構團隊長達7年,並且創建了TensorFlow Lite Micro,一個用於嵌入式系統的機器學習框架。
過去幾年他一直在思考,“聯網”能力是否是物聯網設備的必選項?如果將“Internet”從Internet of Things中拿掉將會怎樣?如何賦予沒有接入網絡的設備以智能?
從2022年開始,他率隊秘密研發這款名為Person Sensor的智能模塊,尺寸為20 x 20毫米,正面有一個攝像頭,背面是微控制器。這個只有硬幣大小的模塊可以檢測附近的人臉信息,反饋人數、相對位置,並進行面部辨識。
皮特認為有智慧的傳感器才是真正有用的傳感器,智能分析與傳感器的距離越近,就越能降低功耗,而且這種功耗的節約是指數量級的,輕鬆實現10倍改善。
過去,我們可能會遇到對著檯燈說“關上”,但檯燈毫無響應的情況,但是這種日子即將一去不復返了,一些家電企業開始著手在電燈、音箱和電腦中嵌入這種智能模組。
TinyML:不用聯網卻“始終在線”的ML
在文章《專為物聯網而生的TinyML,正在開啟音頻分析的新藍海》中,我曾經提到TinyML微型機器學習是機器學習和物聯網設備的交集,它是一門新興的工程學科,有可能在許多行業引發革命。
目前全球有千億量級的微控制器在各地運行,而且每年仍在以數百億的量級遞增,根據IC Insights預測,到2023年微控制器的年出貨量將超過380億個,而且這些微控制器對應的設備,都有變得越來越智能的需求。
換句話說,未來分佈在煙霧傳感器、心臟起搏器、車載終端中的2500億個微控制器,有可能可以執行以前只有計算機和智能手機才能處理的任務。因此面對位於網絡邊緣的海量物聯網設備,TinyML的未來發展具有極大的想象空間。
這些內嵌於物聯網終端設備中的“TinyML即服務”,“主動”參與智能決策與執行,並且允許在終端設備資源非常有限、聯網受限的情況下,仍舊持續提升終端設備的分析能力,以便其能更好的處理實時物聯網數據。
由此,TinyML在物聯網終端打造的飛輪不斷提速:
更低成本、更佳反饋的TinyML→更多數據反哺模型訓練和調參→更好的使用體驗,吸引更多企業參與其中。
TinyML的市場規模比邊緣ML和雲端ML都要大。除了文初提到的ABI Research,多家分析機構均給出TinyML的樂觀預測。根據Silent Intelligence的預測,在未來5年,TinyML將觸發超過700億美元的經濟價值,並且保持超過27.3%的複合年均增長率(CAGR)。
由TinyML改寫的遊戲規則
從某種程度上說,TinyML改寫了機器學習的“遊戲規則”。
TinyML和我們常常提到的機器學習,也就是基於雲端的ML,處於兩個截然不同的世界。
當CPU、內存與操作系統之間的差異達到一定程度之後,量變引發質變。與TinyML可以調用的資源相比,雲端ML簡直是“富豪”。為了順利推進,TinyML必須採用與雲端ML不同的思維模式。
因禍得福,雲端ML常常被詬病的四大痛點問題:功耗大、延遲長、需聯網、少隱私等問題,在TinyML這裡統統不存在,反而成為使用TinyML的4個主要優點:
-
保護隱私:由於聯網並不是TinyML工作的前提條件,數據可以被保存在沒有連接網絡的設備中,因此數據被洩露的風險非常低。這剛好滿足了大量用戶的需求,很多最終用戶非常在意數據隱私,在數據開放與共享方面保持謹慎態度。他們不願意將自己的數據交由第三方雲平臺和邊緣服務提供商,進行存儲和管理。面對這項需求,TinyML很好的保護了數據隱私。
-
超低功耗:分佈最廣的物聯網設備往往體積很小、電量有限。它們被作為終端硬件,通過嵌入式傳感器採集各種數據;計算能力有限,對功耗極為敏感。許多物聯網設備都是電池供電,對於功耗的要求很高。通過極低功耗TinyML的數據分析,減少網絡傳輸的數據量,可以在一定程度上,節約物聯網終端中的電量消耗。
-
無需連接:設備不需要Internet連接即可讓TinyML模型工作。在偏遠地區、海上平臺、空間站、極端環境的應用中,網絡通信有可能無法保證始終覆蓋,另外還有很多物聯網設備通過窄帶物聯網NB-IoT或者其他低功耗廣域物聯網通信協議與網絡通信,帶寬和數據傳輸能力極為有限,這些設備有強烈的在本地處理數據的需求,以減少數據的傳輸,降低網絡帶寬和傳輸功耗的壓力,避免在終端和邊緣設備之間形成帶寬瓶頸,影響整套物聯網解決方案的性能。
極低延遲:TinyML可以以極低延遲處理數據。TinyML通過將某些機器學習任務轉移到設備本身,來進一步減少網絡延遲的可能性。TinyML允許在不連接任何服務器的情況下進行分析,物聯網設備可以實時處理數據並及時輸出。
很多公司開始嘗試將TinyML應用於各種場景,最普遍的應用是設備上的喚醒詞檢測、人數統計和人員檢測。還有一些公司嘗試將TinyML用於機器聽覺。
和視覺信息一樣,聲音無處不在。語音啟動的設備,在智能家居的應用中非常常見,最典型的比如智能音箱。還有很多聲音,比如機床震動的聲音、車輛拋錨的聲音、報警器鳴響的聲音…這些聲音不同於語音,沒有語言模型。
過去我們極大的發展了機器視覺,現在我們正在賦予機器聽覺。隨著越來越多的物聯網企業正在將分析的重點從視頻轉移到音頻,TinyML正在開啟一片新的藍海。
寫在最後
TinyML賦予千億終端設備以智能,是我們值得關注的確定性機會之一,但它並不是全部,還有很多商機有待我們一起挖掘。