-
1 # 陳三十七
-
2 # 智慧新視界
現在AI智慧音箱都是集成了語音增強版晶片和增強版的MIC系統,從本質而言和普通的手機、平板等智慧裝置並沒有太大差別。從核心技術而言,在底層主要是由晶片廠商來提供,而在具體的產品生產和配套軟體、AI智慧服務等技術都是音箱廠商自己來做。科大訊飛主要是提供語音識別技術軟體,並不是所有AI智慧音箱廠商會採用訊飛的方案,畢竟能夠做語音識別技術的公司還有很多。
一、AI智慧音箱核心的智慧晶片和底層軟體都是由晶片廠商提供的。現在主流AI音箱晶片主要有:
1、聯發科MT8516
聯發科手機晶片在高通的打壓之下處境艱難,但在AI音箱晶片市場,聯發科卻揚眉吐氣了一番,據悉2016年AI音箱市場近80%的晶片都是由他們供應的。聯發科是亞馬遜AI音箱Echo的主力晶片商之一,佔據了過半的份額。另外,聯發科還是Essential Hom(Android之父Andy Rubin新公司推出的“智慧助手”)、阿里的天貓精靈X1的晶片供應商。
MT8516支援四核心64位ARM Cortex-A35,主頻達1.3GHz。該晶片還內建WiFi 802.11 b/g/n 和藍芽 4.0,不僅確保晶片更小的佔板面積,更有助於終端廠商簡化設計、加快上市時間,併為開發更多的創意性產品提供了更多可能。MT8516支援高達8通道的TDM麥克風陣列介面和2通道的PDM數字麥克風介面,非常適用於遠場(Far-field)麥克風語音控制和智慧音響裝置。
2、高通Smart Audio Platform
高通在智慧音箱晶片領域不甘示弱,推出旗下的“智慧音效平臺Smart Audio Platform”。在這個平臺上,高通提供了兩款新的系統級晶片(SoC),基於驍龍 425(APQ8017)晶片和驍龍 212 晶片(APQ8009)做的,針對音訊處理最佳化過。。兩款新晶片將提供對兩個語音助理的支援,Google 助理和亞馬遜的 Alexa;也能支援語音識別、網路電話(VoIP)。
3、英特爾Smart Home Hub
在亞馬遜開發者大會上,英特爾表示將會開發基於亞馬遜Alexa的“Smart Home Hub”(中文意思為“智慧家庭中樞”)的智慧音箱。英特爾推出的原型參考設計將會幫助外部的硬體廠商加速開發各種基於Alexa的語音裝置,並且採用英特爾的晶片平臺。據介紹,這款智慧音箱將會支援豐富的網路連線方式,包括Wi-Fi、Z-Wave、Zigbee、藍芽等。
4、全志科技R16晶片
早在2015年,京東推出的整合科大訊飛的語音助手的智慧音箱叮咚就採用的是中國產晶片廠商全志科技的R16晶片(Cortex-A7四核架構)。科大訊飛推出了4+1環形五麥克風陣列,也是採用的全志R16平臺。
全志R16採用了四核ARM Cortex-A7架構處理器,具有強大的運算效能和豐富的介面;支援基於Linux的開源系統Tina,(Tina是全志科技全力打造的專門用於全志智慧硬體平臺的系統軟體品牌);支援AirPlay、DLNA、Qplay、Airkiss、Smart Link等多種網路應用協議;提供獨特的演算法、IP包,使開發者可以專注於其自有應用和產品市場運營,降低產品開發成本,並縮短開發週期。
5、瑞芯微RK3036、RK3229
2017年4月,瑞芯微電子在香港電子展上公佈了旗下兩款“AI語音助手”晶片級解決方案:RK3036與RK3229兩顆晶片,分別針對入門級與中高階產品的語音智慧音箱方案。並且在今年一季度已經開始出貨。5月17日,谷歌I/O開發者大會上,瑞芯微電子(Rockchip)率先向全球釋出基於Android 系統平臺的RK3229谷歌語音助手(Google Assistant)解決方案。
RK3036基於Cortex-A7雙核,支援1/2/4Mic; RK3229基於Cortex-A7四核,支援4-8Mic。在語音演算法上,支援聲源定位、聲源增強、回聲消除、噪音抑制技術。RK3229還是率先支援8路數字I2S數字矽麥直連的晶片方案,不僅大大節約成本,而且相容不同麥克風陣列演算法及平臺。
6、紫光展銳——RDA5981
紫光展銳的市場腳步也很快,目前搭載該公司晶片的智慧音箱產品已經大規模出貨,開始大力收割300元以下的低端智慧音箱市場。在媒體的一次報道中,展銳的發言人表示:“目前我們的音箱客戶大概有幾十家,主要是300元以內的智慧和藍芽音箱,芯片價格成本很有競爭力。
銳迪科的RDA 5981,採用40奈米制程、內建ARM Cortex-M4處理器,是一款為智慧家居、智慧家庭、智慧語音互動等物聯網打造的全整合低功耗的WiFi晶片。.
7、蘋果A8
蘋果釋出了整合Siri的智慧音箱HomePod,它將作為一箇中心串聯起整個蘋果智慧家居。蘋果的產品就是任性,HomePod內建強大的A8處理器,它的運算速度實際上就和iPhone 6一樣,因而能夠出色地完成聲場設定、降噪和語音識別工作。HomePod的底部配置了7個陣列式精密波束音腔,並採用SIRI進行語音互動。
從效能而言蘋果的AI音箱晶片是最強大的,但只是提供蘋果自己使用。
從AI智慧音箱的晶片來看,很多晶片廠商提供了完整的軟、硬體技術平臺,一般即使是比較小的音箱廠商都可以快速生產出AI智慧音箱產品,大大降低了智慧AI音箱的進入門檻。
二、AI智慧音箱廠商主要負責產品的製造和技術支援
從智慧AI音箱的供應鏈可以看出,語音服務、晶片、麥克風陣列方案等底層技術全面有專業公司在做,技術實力較弱的廠商可以直接採用晶片廠商提供的完整的軟硬體解決方案進行生產,而技術實力較強的廠商,在內容和智慧AI服務方面都加入了自己的核心技術。現在的AI音箱市場魚龍混雜,即使現在主流的產品都難言是真正的AI音箱,更像是語音助手。隨著技術的進步,未來AI音箱也將迎來更迅猛的發展。
回覆列表
1、首先糾正一下:你說所的不叫語音助手,而是叫做“智慧音箱”。
2、問題的答案是:是的。
3、智慧音箱由 作為硬體的音箱本身+作為軟體的智慧語音助手(時刻保持在聯網狀態下) 構成。
硬體部分就如同一部手機,有各類配件組成,可能會在設計方案上有所區別,但基本上這個不是太有必要去做比較,因為所有的重點和難點其實都在軟體的智慧語音助手上面。
4、智慧語音助手(軟體)=大資料+演算法+運算力/資金實力
這個公式決定了智慧語音助手只是小部分公司能玩的遊戲。
首先大資料是第一個門檻,小米、騰訊、阿里(還有百度、獵豹)等公司都有自己的app生態,他們基於這些生態收集了極其充分和完整的,同時又是各家公司獨有的360度使用者資料。
其次演算法(含自然語義)是第二大門檻:智慧語音助手需要識別的是國內幾十個不同民族的語言中所有可能的場景下的所有語言中含有的資訊,方言的識別、自然語義的分析是最難的部分,因此沒有大資料提供的關於人的生活、使用手機、語音或文字聊天的行為等所有的充分資料的支援,自然語義的演算法開發是做不到的。(我在2014年和北京的一位提出“國家智慧”的學者請教和探討過這個問題)
再次是運算力或者不如說是資金實力的支援,這些智慧語音助手的公司基本上都具有自己的資料中心,而且尤其像阿里騰訊百度對自有的資料中心每年都在拓展、增加和持續保持更新及最佳化,這裡就涉及到了巨量的資金的投入,直接把絕大部分人擋在了這個行業之外。
綜合以上:別看這智慧音箱小小的,而且價格高低都有,它背後代表著的說白了是一家網際網路公司的“實力”,同時也意味著智慧生活的時代的到來。