首頁>技術>

對於人機交互來說,如何讓機器具備良好的聽覺,一直是近些年來 AI 領域不懈追求的目標。2009 年前後,深度學習模型用於開始走出學術界,而以語音喚醒、識別、增強和合成為代表的智能語音技術,也逐漸走向成熟。

一個早期典型的例子是,2011 年 siri 的誕生。智能語音成了人與機器之間的溝通交互方式的新躍遷。而後經過十餘年的發展,"嘿,siri"式的人機問答已經不再侷限於移動終端設備,走進千家萬戶,廣泛應用於各個場景:家居陪伴智能音箱,方便網購的天貓精靈,會議上的同聲翻譯,出行時的車載語音導航助手等等。

隨著越來越多的互聯網企業及上游廠商在智能語音賽道的積極佈局,智能語音客服、對話式 AI 應用、AI 虛擬助手等產品的取得了進一步質量提升,響應語音更自然,理解問題更準確,並且有了自己的"小情緒"。

身處數字化浪潮的時代,萬物互聯的趨勢不可阻擋。而智能語音作為當下人機交互的關鍵接口,正處於與實體經濟深度融合碰撞的時期。隨著應用場景的進一步下沉和拓展,我們也看到不少挑戰性的問題,比如:如何識別說話人身份、如何識別方言、如何消除歧義等等都是最新的研究熱點。

一項技術走向成熟的背後,往往蘊含著一些潛質,這其中包括它在實際應用中的創新能力,以及它更有潛力的演進方向。展望下一個階段,智能語音技術也必會出現新的演進趨勢,例如:深度集成的AI語音芯片能否取代雲端運行模型的模式?多模態融合、無監督學習、腦學科交叉融合的創新研究能否取得突破性成果?我們拭目以待。

那麼,智能語音技術在各大企業中實踐探索中都遇到了哪些真實的生產問題?又是如何解決的?取得了哪些進展?行業出現了哪些新變化?下一步的發展趨勢又會有哪些?"AISummit全球人工智能技術大會"智能語音技術專場帶給你深度思考!

專場有哪些你感興趣的專題內容?

專題一:作業幫語音技術實踐

1.語音識別技術探索:分享端到端、高效利用數據等大規模實際應用場景下的語音識別技術,並提出了基於前綴自動機的熱詞技術方案。

2.語音評測技術實踐:語音發音糾錯技術方面結合作業幫的高併發場景,提出了多任務知識遷移、多模態特徵融融合方案,很大程度上提升提升模型的因素區分能力和噪聲環境下的檢錯能力。並針對語音評測落地難的痛點,提出了高性能的雲端一體化測評技術。

3.語音合成技術框架:分享作業幫基於現有的小數據量語音技術框架進一步改進的思考與實踐。

專題二:字節語音識別技術在飛書中的應用

1.語音識別技術在辦公場景中的應用進程:辦公郵件、即時通訊中的語音輸入辦公語音助手、實時字幕&會後轉寫。

2.解決思考:會議智能化、效率提升。

3.挑戰與機遇:語音識別任務的挑戰、下游任務帶來的挑戰、會議提供額外的信息。

4.重點算法工作介紹(端到端語音識別系統):Transducer & CIF、動態+靜態熱詞、Context-aware。

專題三:構建高水平的語音合成系統實踐

1.高水平語音合成系統背景介紹及問題分析。

2.高水平語音合成系統設計思考與實現。

3.實驗評估。

4.未來工作展望。

專題四:SOUL社交場景下的智能語音技術實踐之路

1.SOUL社交元宇宙場景下的端到端語音識別

2.多模態語音合成技術的構建路線

3.在語音安全和語音交互等業務場景下的應用

專題五:端到端語音識別技術在58同城的探索實踐

1.語音識別在58同城的應用場景:AI智能語音應用、語音識別鏈路介紹、挑戰與技術路線

2.基於WeNet的模型優化工作:半監督訓練、Efficient Conformer、模型壓縮

3.端到端語音識別的部署方案:自研引擎架構、Wenet解碼服務部署、流式/非流式解碼性能測試

都有哪些重量級嘉賓?

一、宋暘,作業幫首席算法專家、智能中臺負責人、專場出品人

宋暘在百度工作7年,從事算法研發工作。2015年加入作業幫,為智能中臺部負責人,為公司各業務輸出包括數據挖掘、NLP、語音在內的中臺技術能力,先後負責搜索答疑、個性化推薦、智能質檢、語音評測、服務智能化調度等方向。

二、王強強,作業幫語音技術團隊負責人

在加入作業幫之前,王強強曾任職於清華大學電子工程系語音處理與機器智能實驗室,負責語音識別算法落地,搭建工業級解決方案。2018 年加入作業幫,負責語音相關算法研究和落地,主導了語音識別、評測、合成等算法在作業幫的落地實踐, 為公司提供整套語音技術解決方案。

三、張駿,字節跳動AI Lab語音識別算法研究員

張駿長期從事語音識別、語音喚醒等語音算法研究與應用,經驗豐富。2018 年加入字節跳動AI Lab智能語音團隊,目前主要負責智能辦公、智能硬件、智能客服等方向的語音技術方案建設。

四、譚旭,微軟亞洲研究院主管研究員

譚旭,研究領域包括深度學習、自然語言/語音/音樂、AI內容生成等。研發的機器翻譯和語音合成系統獲得多項比賽冠軍並在學術評測集上達到人類水平,研究工作如預訓練語言模型MASS、語音合成模型FastSpeech/NaturalSpeech、AI音樂項目Muzic受到業界廣泛關注。

五、劉忠亮,SOUL語音算法負責人

劉忠亮碩士畢業於中科院研究生院,目前在SOUL擔任語音算法負責人,曾任職於搜狗AI交互部和陌陌大數據部。近10年主要從事語音喚醒、語音識別、語音合成、音頻音樂理解等語音技術體系的研發工作,主要應用於輸入法、手機助手、智能硬件、語音安全等語音交互和語音理解業務場景,致力於打造最好的可落地的語音技術。

六、周維,58同城 AI Lab語音算法部負責人、算法架構師

周維,58同城AI Lab語音算法部負責人、算法架構師,負責語音識別、語音合成算法研發。2016年碩士畢業於中國科學院大學,畢業後參與對話式AI產品方向創業,2018年5月加入58同城,曾先後參與智能客服、智能外呼、智能寫稿等AI項目的NLP算法研發,2019年開始主攻語音算法方向,帶領團隊從0到1自主研發58同城語音處理引擎中的語音算法。

還有哪些精彩活動?

除了精彩的AI技術大咖的精彩的實踐創新幹貨分享外,AISummit全球人工智能技術大會還為與會的朋友們準備了豐富的場前、場中互動福利。加入這場盛會,在拓展技術能力和人脈資源的同時,順便驚喜禮品帶回家!

活動包括"當人不讓"、"工享幸運"、"智同道合"等四大妙趣橫生的互動遊戲,總有一款精美禮品驚豔到你!那麼,傳說中神秘的終極大獎會是什麼呢?等待熱愛技術的你來現場揭秘!(PS:聽說越早預約報名,中大獎幾率越高哦!)

6
最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • GB/T 16422.2塑料 實驗室光源暴露試驗方法 第2部分氙弧燈