“行善”二字,可以有無數下手處,比如扶助弱者也是行善。若能幫一個無力無助的弱者改變命運,其能力何其大?其意義何其大?
弱者之所以弱,是因為他們無力發出自己的聲音,聲音不被聽到,就被遺忘。中國有8500萬殘疾人,但在生活中,我們很少感知到他們的存在,就像很少見到盲道上有盲人行走。而強者之所以強,就是要主動關注到弱者,傳播出那些沒有被髮出來的“聲音”。
聾啞群體,就是很難自己發出聲音的一個人群。
在2019年定下“科技向善”為願景的騰訊,也確實在做實事,2020年“天籟行動”發起,面向公益開發者、裝置廠商、相關機構,免費開放騰訊多年積累的天籟AI音訊技術,給人工耳蝸消除噪音,幫助聾人從“聽得見”到“聽得清”。
今天3月3號是全球愛耳日,騰訊天籟聯合新華社·聲在中國、中國聽力語言康復研究中心、中國聽力醫學發展基金會等,推出了線上聽力篩查工具。
世衛組織的最新資料,目前全球1/5的人聽力受損,超過15億人,到2050年,預計1/4的人將會聽力受損,超過25億人。在聽力損失剛發生時,一般生活只會受到輕微影響,老年人通常對聽力變化並不在意。但聽力衰退初期,是干預的最佳時機,而此階段往往被99%的人忽視。
所以大面積的免費的聽力篩查,就可以讓很多人及時的發現自己的聽力問題,及時的扭轉。
而不管15億還是25億,都只是冰冷的數字,必須講出來一個真實的故事,切身的走入一個鮮活的生活。
恰好,這裡有一個已經把我打動的故事,可以講出來給大家聽聽。
時間回到17年前,一個佛山普通家庭的小女孩出生,她叫宋曉婷。
宋曉婷一出生就聽不清楚聲音,但沒人發現。她喜歡跳舞,一歲多就會跟著音箱上的燈光閃爍舞動。
直到兩歲,她還不會說話。去醫院檢查才發現,她是先天失聰。
鼓聲成為她和舞蹈世界的連線方式。她聽不清楚音樂,只能透過腳尖感覺音樂鼓點的震動,努力記憶動作。有時候,連音樂的震動聲都感覺不到,她就在心裡默默數拍子,跟上節奏。
儘管如此,卻又很快得知一個更艱難的事實:隨著曉婷長大,聽力將繼續衰減,這僅有的鼓聲,也將從她的聽覺裡消失。
2018年,轉機出現了。
廣東把人工耳蝸納入社保,曉婷拿到其中一個免費名額。手術一個月後,曉婷的人工耳蝸開機了。她第一次從媽媽翕動的嘴唇裡,聽到了自己的名字,“你叫宋曉婷”。
戴上耳蝸後的曉婷,第一次自己下樓去超市、過馬路、坐公交……一個有聲的世界,在她面前徐徐展開。
那一年,曉婷登上了中央電視臺少兒春節聯歡晚會的舞臺。曉婷穿著碧綠長裙,在舞臺中央露出了燦爛笑容。
戴上人工耳蝸,聽見聲音,似乎已經改變了這個女孩的命運。她變得自信,未來開始充滿無限可能。但事實並非如此。
“我能聽到,但我聽不懂。”
就像曉婷跟媽媽說的,“聽得見”不意味著“聽得清”。她聽到的聲音,仍然與正常人有著很大差距。人工耳蝸傳到她耳朵裡的聲音,大部分都是噪音,沒有細節。
你可以想想一個霧氣朦朧的澡堂裡,一切都是煙霧繚繞的,你看不清、摸不透。這種像被一層布阻隔、無法確定的聲音,就是聽障人群聽到的世界。
2020年,曉婷離開佛山,前往廣州念高中。同一年,這個小女孩的命運和一群工程師發生了交匯。
“對我們健全人來說,一直在霧氣瀰漫的場景裡看東西,可以想象多麼痛苦。對於聽障人士而言,他們一輩子,每天24小時,都被困在了這樣的環境裡。如果我們的技術能夠為他們提供一些幫助,讓他們聽的更清楚,那真是一件非常有意義的事情。”
因為工作需要,常年和噪聲打交道的商世東接觸到“聽障人群”後,萌生了這個想法。商世東和曉婷,兩個陌生人的命運從此聯絡到一起。
商世東曾是騰訊多媒體實驗室音訊技術中心高階總監,2020年12月擔任騰訊天籟實驗室負責人。加入騰訊前,商世東在2010年組建了杜比北京工程團隊,任職杜比北京和悉尼工程團隊高階總監9年。加入騰訊後,帶領音訊團隊,負責音訊的框架設計和開發工作,支援騰訊內多個實時音影片產品,比如騰訊會議。
商世東的職業生涯目睹了音訊技術迭代的歷史。“科技可以改善生活 ,也可以彌補缺陷”,這一次,他將目光投向了聽障人士。
“公開資料顯示中國有8500多萬殘疾人,但在生活中,你很少感知到他們的存在,就像你很少見到盲道上有盲人行走”,商世東認為,“這是因為我們的‘無障礙建設’做得還不夠好”。
萌生了這個想法後,商世東和團隊針對聽障人群做了大量調研,也分析了國內外很多關於降噪技術在聽障方面的應用的研究,發現“噪聲”確實是困擾聽障人群的一大障礙。
商世東找到了國內人工耳蝸廠商諾爾康,所謂人工耳蝸,就是一個電子裝置,把聲音訊號變成電訊號,電訊號經過計算機程式設計,告訴它怎麼刺激神經,人就可以產生聽覺。
雙方一拍即合,決定研發由AI降噪技術加持的新一代的人工耳蝸,也就是把噪音自動過濾掉,讓人直接聽見清晰的有意義的聲音。
曉婷,成為了新一代人工耳蝸的早期試用者。
“她非常興奮,整個人的狀態非常好,她本就是一個活潑的小姑娘。”商世東回憶起看到曉婷戴上新一代人工耳蝸之後的場景。
用上AI降噪技術之後,曉婷不僅能夠聽清鳥叫、風聲、甚至能透過嘈雜的環境聲聽到媽媽的聲音。這時她的眼睛就發亮了,從一個世界到了另外一個世界。
過去,曉婷只能粗略地分辨男女聲,聽到媽媽的聲音像是“老人家說話的沙啞的聲音”;剛戴上新耳蝸,她對媽媽說:你的聲音原來更尖細,和爸爸不一樣。
一次,媽媽騎著摩托車送曉婷上課,風聲吹過,女兒拍了拍她的後背,“媽媽,你的手機響了”。媽媽當時差點哭出來,這幾乎是這些年來最幸福的時刻。
AI降噪技術,喚醒了曉婷沉睡的耳朵,細膩鮮活的聲音細節湧入了她的世界。她說,“好像施展了魔法,我耳中的噪音被獵人帶走了。”
當然,施展魔法的噪音獵人,其研發並不順利。
消除噪音一直是一個難題。電話早在一百多年前就發明了,但是人類卻一直沒有解決通話噪音的問題。放眼人類一百多年的語音通話史,也是一段對抗噪音的歷史。
比如在嘈雜的菜市場,之所以我們能清晰地聽到對面菜販子的說話,是因為耳朵選擇性遮蔽了比如剁肉、吆喝等等的嘈雜聲。而商世東團隊要做的,就是讓機器裝置也能像人一樣。
想要消除噪音,就需要識別噪音,再主動干預。這個看似簡單的方法困擾了技術人員上百年,因為其難點在於識別哪些是噪音。聲音處理是最難的,聲音資料是一維、影象是二維、影片是三維,維度越少難度越高。
幸運的是,有了AI的加持。商世東團隊在菜市場、在辦公室、在馬路上,在一切存在噪音的地方採集了海量的聲音資料,做裁剪和清洗、提取特徵,再加入模型訓練,如果模型準確率達不到99%,就持續收集,一直做到標準為止。
目前,基於機器學習的AI降噪模型,商世東團隊將識別率提升到了96.2%,超過了大多數開源模型。
跟諾爾康的技術團隊的合作,從想法提出到演算法驗證,及產品落地,用了近一年,經歷無數次版本迭代。
人工耳蝸晶片體積有限,相容差、計算能力弱,不足以承載大量的運算。經歷了反覆探討和驗證,他們找到了解決方案:手機伴侶+人工耳蝸。
簡而言之,就是將計算處理過程轉移到手機上,由手機對訊號進行處理、過濾,再透過藍芽裝置,將訊號傳送到人工耳蝸。
而手機伴侶的解決方案,對延遲要求極高,一旦超過200毫秒人將會感到不適。就像看電影一樣,聲音如果延遲影片畫面,觀眾就能明顯感到不舒服。
面對挑戰,商世東帶領團隊連續熬夜攻堅,試圖找到一種更快速的AI演算法。最終,結合騰訊會議上的經驗和配置資料,將延遲控制到150毫秒以內。
2020年9月27日,國際聾人日,新一代人工耳蝸的試戴者曉婷和媽媽一起來到了深圳,終於見到了捉走她耳朵中噪聲的“獵人”,商世東和他的團隊。
當天,騰訊天籟實驗室宣佈聯合深圳市無障礙資訊研究會、騰訊公益基金會等機構,面向行業開放天籟音訊AI降噪技術,發起“天籟行動”,希望更多像諾爾康這樣的廠商和開發者加入到關注聽障人群的行列。
“過去我們的工作更聚焦在演算法突破和產品研發,沒想到我們的技術還可以給聽障人群的生活帶來一些改變,這讓我和團隊受到非常大的鼓舞。”商世東從曉婷身上看到了技術的無限可能性。
“接下來我們希望把演算法做得更好,在幫助更多聽障人士聽得更清楚的同時,也可以探索AI降噪技術的更多應用場景,比如五六十歲的老年人,他們的聽力退化之後,也可以透過我們的技術提升。”
今天愛耳日上線的聽力篩查工具,就是一個大過濾器的入口,要讓大量的有聽力障礙的人群自動浮出水面。
想要解決這一問題的這群噪音獵人,也是騰訊“不務正業”產業人的一個縮影,他們在街巷之間捕獲噪音,也狙擊噪音,喚醒沉睡的耳朵。
他們正在用技術不斷改善這個世界,讓世界對於每一個弱者都更加清晰,充滿希望,改變命運。
現實中,很多聽障孩子的家長會早早放棄孩子,“認命了”,等孩子長大成人隨便安排進工廠作勞力。但曉婷和她的媽媽不這樣想。
考上當地最好的特殊高中後,曉婷決心學計算機,她想,自己完全能成為一名文職工作者。戴上人工耳蝸後,她又有了更明確的目標:要考上北京一所大學的特殊教育學院,那裡被譽為聽障人群的清北。她為此每天在宿舍用手電學習到午夜,凌晨5點半起床再學習;課間休息的10分鐘,她趴在桌上寫作業,顧不上喝水。
此情此景,善莫大焉。