在過去的幾十年裡,許多經典的 TVB 影視片都離不開配音,如果你認為周星馳也可以講一口流利的普通話,那就太幼稚了。
另外,如動漫等影視中最逼真的聲音合成,也大多透過配音演員的聲音錄製來實現的,然後將他們的聲音剪下成不同的片段,像做拼圖一樣,將這些聲音“拼接”在一起,形成一整段聲音。
近年來,隨著黑科技產品不斷迭代升級,更多有趣的應用逐漸被髮掘並實現。在語音合成領域,由於人工智慧克隆技術的出現,昔日繁瑣且枯燥的配音工作有望被取代。
配音將不再是專業人士的標配,任何人都可以自主且簡單地克隆自己的聲音,而克隆出來的聲音近乎逼真。
現在,神經網路可以對目標聲音的未排序資料進行訓練,最終以簡單快速、容易的方式,生成一段完整的音訊。當人們將克隆的音訊從裝置中匯出時,音色和音質幾乎不會受到壓縮和影響。儘管有部分環節還需要手動調整,但不久的將來將會更加完善。
這標誌著,全民聲音“克隆時代”的到來。
30 分鐘克隆出的聲音,家人和朋友都無法分辨真假
這種聲音克隆技術使用起來並不複雜,人們只需要拿著事先準備好的臺詞,對著麥克風仔細錄製 30 分鐘左右,即可完成第一步克隆工序。錄製的過程中難免會讀錯字,或者有發音沒有很清晰等情況,這不用太擔心,只要停下來重新錄製這部分即可。
全部錄製完之後,將生成的音訊檔案匯出並做一定的處理,幾個小時以後你克隆的聲音就做好了。此刻,你可以互動介面中輸入各種你想表達話語,人工智慧克隆技術就可以在較短的時間內生成專屬你自己的“逼真聲音”。
當你將這段語音發給家人或朋友時,他們在短時間內根本無法分辨真假,這個克隆技術令許多人感到興奮。
聲音克隆技術可讓經典再現
2014 年,電影《永遠的蝙蝠俠》中知名演員瓦爾·基爾默(Val Kilmer),因患喉癌被迫做氣管切開手術,導致聲音受損。至此,瓦爾·基爾默與許多優秀影片擦肩而過,演藝生涯近乎跌入谷底。
今年 8 月,一家名為奏鳴曲(Sonantic)的初創公司聲稱,他們已經透過人工智慧語音克隆技術創造出了瓦爾·基爾默的“原聲”。Sonantic 公司的這一舉動得到了市場普遍稱讚,因為它為演員提供了其他解決方案無法提供的技術。
然而,社會中也有一些質疑的聲音,有人認為:“這項技術有違社會道德。”另外一位藝人的經歷,就是最好的反例。
在前幾年,對於社會大眾來說,人工智慧聲音克隆技術既陌生又遙遠,在一些藝術品中被用於生產贗品。
今年 7 月,一部關於安東尼·波登(Anthony Bourdain)的紀錄片引發了爭議,據製片人向有關人士透露,他們使用人工智慧聲音克隆技術,為安東尼·波登製作了一段臺詞音訊,但是當時並沒有多少人注意。
該“聲音門”被曝光後,許多人譴責安東尼·波登這一做法。
網紅、演員和名人等聲音商業化熱潮將來臨
毫無疑問,人工智慧聲音克隆技術具有很好的商業化前景。
今年年初,維睿通(Veritone)公司就推出了類似的聲音克隆服務,該公司將網紅、運動員和演員的在錄音棚裡錄製好的聲音,透過人工智慧克隆技術獲得其“逼真聲音”,然後再獲得網紅等人的聲音授權,就可以從事代言、廣播節目等活動。之後網紅、運動員和演員無需真人出鏡即可實現同樣的效果。
Veritone 公司執行副總裁肖恩·金(Sean King)表示:“將一個人的聲音克隆得形象逼真,以及如何對其應用場景進行擴充套件只是時間的問題,我們對很多不同行業帶來的新機會,感到非常興奮。”
網紅、演員和明星等角色的聲音克隆技術,可能是未來幾年最為明顯的商業化應用。隨著這些克隆技術的成熟,加之克隆出聲音的技術壁壘較低,將會有許多初創公司可以提供類似服務。