首頁>科技>

每每提到“AI開發者”,大多數人想到的可能是來自網際網路大廠的“程式猿”們,他們身居演算法工程師、資料工程師等高光崗位,有著名校博士乃至博士後的傲人學歷,並且拿著動輒百萬的年薪。

正如大家所看到的,人工智慧的第三次浪潮已經持續了一段時間,逐漸從象牙塔走進了社會的角角落落。可在大多數人的認知裡,AI仍然有著相當遠的距離,仍然是部分高知分子研究的產物,仍然是一本普通人觸碰不到的“天書”。

但現實中正在發生的一些事情,儼然超出了我們的預想。

埃隆·馬斯克為特斯拉招聘AI人才時曾直言:“博士學位絕對不是必需的,我不在乎你是否高中畢業。”不同於許多人對學歷和經歷的痴迷,馬斯克正在尋找那些對人工智慧有“深刻理解”的人。

不只是特斯拉的不拘一格,在遊離於大多數人視線外的賽場上,一群20歲上下的少年剛剛經歷了一場在AI世界的“奇幻漂流”,詮釋著他們對人工智慧的理解。

01 像看地圖一樣看新聞

正在讀大四的羅運是武漢大學地理資訊科學專業的本科生,他與AI的機緣開始於年初的新冠疫情。

寒假回到家鄉的羅運,剛剛過了幾天可以賴床的生活,就被班級群裡的討論繃緊了神經。原來在他們離校幾天後,武漢就因為新冠疫情封了城。羅運想要了解那座熟悉的城市到底發生了什麼,努力在社交媒體和資訊平臺上搜索一切和武漢相關的新聞,卻發現網上充斥著太多的謠言和假訊息,想要進一步查詢學校周邊的情況,只能在社交媒體上找到寥寥幾條無法確證的內容。

由於地理資訊科學屬於計算機和地理的交叉學科,除了和地理有關的課程,羅運還自學了計算機程式設計,並且經常在國外的慕課平臺上看一些人工智慧的課程和案例。苦於查詢武漢當地新聞的羅運萌生了一個大膽的想法:能不能將地圖和新聞資訊進行結合,像看地圖一樣檢視當地的新聞?

羅運將自己的想法和參加大學生創新創業比賽時的兩個小夥伴進行了溝通,三人一拍即合,決定打造一款以地圖為導向的時空新聞互動網頁應用。

團隊首先確認了他們想要抓取的比較權威且有公信度的新聞源網站,然後使用Scrapy非同步爬蟲框架對新聞進行智慧提取,在百度飛槳提供的深度學習框架的支援下,基於文心ERNIE進行命名實體識別,再聯合百度地圖等的地理編碼服務,利用PostGIS計算空間資料的尺度、跨度,進行分詞和詞性提取後,運用TF-IDF、LDA等演算法進行文字的向量化、詞頻分析、主題分析、相似度分析,最後採用飛槳的GRU4Rec模型根據使用者行為序列與興趣區域推薦新聞。

經過四個多月的開發測試後,將地圖和新聞結合的網頁應用正式上線。當羅運將滑鼠點向武昌火車站的時候,網頁上彈出了長江網的最新訊息,內容是武漢市解除離漢離鄂通道管控,涉及武昌站、武漢站、漢口站等火車站。看著自己的成果,羅運比任何一刻都更想念這熟悉的城市、熟悉的學校。

不善言談的他,很快和小夥伴定好了下一步的目標:目前他們正在為這款應用新增新的功能,逐步增加情感趨勢面分析、輿論導向分析等功能,方便普通使用者在地圖上找到不同時段新聞的同時,幫助有關部門從新聞和民眾的情緒中挖掘社會的熱點和痛點。

02 告別垃圾分類的煩惱

距離武漢700多公里的杭州市,杭州電子科技大學資訊工程學院計算機專業的揭金民也在進行一場人工智慧之旅 。

家在杭州的揭金民看到媽媽每天都要花不少的時間對廚餘垃圾、可回收垃圾、有害垃圾等進行分類,可由於垃圾的種類繁多,常常出現分類錯誤的情況。社群只好派駐志願者在各個小區監督,基本就是居民剛剛扔完垃圾後,志願者需要重新在垃圾桶裡扒一遍。

有志願者守在垃圾桶旁邊檢查,大家反而有了“僥倖心理”——畢竟就算分錯了類也會有志願者重新分類。看著志願者每天在臭氣熏天的垃圾桶中滿頭大汗地分揀,揭金民心裡有些不是滋味。有沒有什麼辦法能讓媽媽不再為垃圾分類頭疼,又能幫助這些志願者?

作為一名計算機專業的本科生,揭金民想要用人工智慧來改變現狀:倘若可以用計算機視覺技術對垃圾進行分類識別,居民們就能更輕鬆地完成垃圾分類,準確性也會提升,志願者也不用再忍受惡臭翻垃圾桶。

揭金民拉上了兩位軟體工程專業的同學,以三人小分隊的形式踐行自己心中的想法。揭金民負責硬體設計,他要做一個三層結構的智慧垃圾桶,第一層進行垃圾的識別,第二層對垃圾進行處理,第三層儲存不同類別的垃圾。另外兩個小夥伴分別負責系統後臺和前端的開發工作。

敲定了分工後,必須解決的一個核心問題是打造垃圾分類的演算法模型。如果自己寫一套影象識別演算法,目前的水平和積累跟不上,會拖延產品成型的時間、錯過了最佳的市場。好在團隊找到了百度的EasyDL平臺,作為一個零門檻的AI開發平臺,EasyDL上有著豐富的演算法模型,包括影象分類、人臉識別等等,演算法模型終於有了“譜”。揭金民和小夥伴如釋重負,立刻把精力放在了硬體和系統開發上。

在長達一年的時間裡,揭金民團隊收集整理了近2萬張垃圾照片,其中包含大量袋裝垃圾,在EasyDL訓練後的識別準確率高達96%。硬體設計組裝完成後,揭金民將智慧垃圾桶放在自己家小區進行試點,目前已經協助使用者完成了近1000kg垃圾的分類,異常識別率控制在5%以內。

“這只是第一步。我們想推出家庭版的智慧分類垃圾桶,還想嘗試推出一種‘代扔垃圾’的服務……”細心的揭金民已經想好了未來的種種可能。

03 解放高空中的補漆工

在國內風能資源最為豐富的西北地區,一座座風車如森林般矗立,源源不斷地將風能轉化為電能。

然而風機的維護卻成了一項讓人頭疼的難題,西安電子科技大學的黃耀輝瞭解到風機的維護需要工人們綁著繩索爬到高空中,提著漆桶進行補漆維護作業。

小時候她覺得那是一件有冒險精神的事情,長大後才知道冒險的背後是可怕的風險:高空補漆通常處於二級、三級乃至特級高處作業,二級高處作業墜落死亡率就高達40% ;同時《工業衛生與職業病》中指出,油漆工人中7.2%出現了白細胞數減少, 18.3%患有沙眼,22.8%心電圖異常,17.8%視力下降……

與深度學習結緣之時,黃耀輝也認識了一個同校的好夥伴:左誼。那時左誼正在團隊中做一個無人機的專案,他和黃耀輝溝通後,大家迅速萌生了一個新的主意:既然飛槳上有那麼多成熟的演算法模型,或許可以將人工智慧和無人機做一個結合,讓無人機替代工人完成高空中的補漆工作。

團隊呼叫了飛槳裡的計算機視覺模型,採用了空地聯動的形式進行作業,即無人機將第一時間的影象傳送到地面站,地面站搭建高效識別裝置並將資料再次傳送給無人機。由於採用了視覺SLAM技術,靠無人機上的攝像頭就能完成環境的感知工作,不僅降低了硬體上的成本,也提升了實地作業的可行性。

目前這一專案已經在校園內完成了測試:無人機緩緩飛到路燈杆上的電箱附近,準確識別出了電箱上的鏽斑,然後打磨、塗刷一氣呵成,距離他們解放高空補漆工人的想法已經越來越近。

作為團隊的一員,黃耀輝這位大西北土生土長的女孩看到無人機飛起時眼眶竟然有些溼潤:“雖然現在還只是一個比賽,但我相信透過我們的努力,那些工人們終歸有一天不用再冒著生命危險爬到高空進行作業。”

04 讓瀕危語言不再消失

遙遠的英國南約克郡,正在謝菲爾德大學Lincedo組讀博的Xutan Peng(彭煦潭),同樣有一個“科技向善”的公益構想。

2020年初的“國際母語日”期間,Xutan Peng在謝菲爾德大學人文學院聽了一場演講,瞭解到全球現存7000餘種有記錄的語言中,已經有超過400種瀕臨滅絕,超過200種處於接近瀕危的狀態。“語言是文明的DNA”,當一些語言不再被傳遞給下一代的時候,意味著一個文明正在被人們所忘卻。

科班出身的Xutan Peng,發現當下瀕危語言的保護手段還是一項“勞動密集性”工作,需要大量專家進行田野調查採集語料。由於還在說瀕危語言的人群以老人為主,他們中極少有人能同時使用漢語和本民族語言,導致對語料進行人工轉寫時存在很大難度。巧合的是,將自然語言處理作為研究方向的Xutan Peng正在關注低資源語言的詞典生成,就萌生了以自身一技之長來減輕瀕危語言保護工作量的念頭。

Xutan Peng戲稱自己是個話癆,所以對語言相關的工作有著天生的興趣。然而現實問題的複雜度遠超Xutan Peng的料想,儘管國內已經在少數民族語言保護上做了很多卓有成效的工作 ,可很多瀕危語言的文字已經失傳,只有語音留存,研究者甚至無法獲知其背後所傳達的語義。

不過Xutan Peng發現,少數民族的語料主要圍繞神話傳說、民間故事、民歌和日常會話,或許可以構建現代漢語同領域的語料庫,當各自的語料領域相對近似時,可以透過對齊演算法建立瀕危語言和現代漢語之間的聯絡。

Xutan Peng先是拿到了相關資料的授權,藉助PaddleOCR將相關紙質語料轉化成文字,建立了業界首個大規模漢語故事資料集。然後從國際開源語料資料庫找到了爾蘇、嘉絨、獨龍、撒拉四種語言,並將母語者的錄音進行國際音標轉寫。

最終Xutan Peng將少數民族語言詞彙嵌入到一個高維語義空間,漢語詞彙被嵌入到另一個空間,基於雙語詞向量結構近似性,利用正交對映對齊兩個空間,生成了高質量大規模的雙語詞典。

目前Xutan Peng已經將匯出的詞典提供給中國社科院的研究者進行內測,在多數詞和名詞方面的翻譯準確率非常理想,有效提升了對少數民族語言進行轉錄和瀕危語言典藏工作的速度。這位特別能說的大男生不忘強調:“你們看吧,語言就是這麼有趣。”

05 AI人才培養需要閉環

看完這些故事,你是否發現這些年輕人們並非都是科班出身,有些甚至在開始這些專案前對程式設計都知之甚少。但他們也有共性:心思縝密,擅長髮現生活中遇到的痛點,並且希望透過人工智慧技術去解決。

好在百度飛槳、EasyDL降低了這群少年走進AI世界的門檻,讓他們略顯稚嫩卻充滿朝氣的想法有了新的可能。

從好創意變成好應用,AI人才培養機制在其中起著關鍵的作用。雖然越來越多的高校開設了人工智慧專業或課程,越來越多的政府和企業為AI人才開出了優渥的條件,動輒百萬的年薪也切實激勵著當下的年輕人,只是選出“千里馬”所需要的不僅僅是伯樂,還要給他們一片可以自由馳騁的寬闊草原。

做一個歸納的話:“聞鼙鼓而思良將,謀大業而召英才”固然有道理,但AI人才培養還需要有人才培養的閉環思維,需要政府、高校和企業一道打通激勵、培養、實訓、競賽、就業的產業鏈條。

至少在剛剛結束的中國高校計算機大賽-人工智慧創意賽賽場上,免費的算力資源已經幫他們把想法變成了現實,半年的實操經歷也讓他們對想要解決的問題有了更深刻的理解。

所幸百度代表的AI頭雁們已經開始行動。

前面講述的四個故事,不過是百度承辦的第三屆“中國高校計算機大賽-人工智慧創意賽”的一隅,同樣懷揣夢想的還有2200多支學生團隊,他們正在各自關注的領域續寫屬於自己的故事。就像上一屆比賽中獲獎的中南大學“AI 知膚寶”團隊已經拿到數千萬的孵化基金,他們的專案已經聯網國內618家醫院,幫助10000多名醫生進行初步的病情診斷。

其實“以賽促學”是高校AI人才培養中的重要一環,百度打造的一整套AI人才培養體系已經成型:

面向高校,百度為AI人才培養提供了全套教學和資料資源,學習與實訓社群AI Studio以及算力等全面支援,聯合共建專業課程體系,舉辦師資培訓班,已累計培訓了1600多名來自近500所高校的教師;

面向企業,百度打造了黃埔學院、AI快車道、AI私享會等面向不同技術層級的培訓方案,構建深度學習專業加實踐應用的課程體系。此外,百度還透過開展能力評估認證、舉辦競賽等為人才培養保駕護航。

百度已經培養了超過100萬AI人才,未來5年,還將培養500萬AI人才,為中國智慧經濟和智慧社會的發展提供人才保障。

有理由相信,在百度等企業身體力行的推動下,將有越來越多的“少年”在AI世界裡進行一場場“奇幻漂流”,用一個個可以觸控的專案演繹他們心中世界的樣子。

28
最新評論
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 小米11首曝!這配置絕了!