回覆列表
  • 1 # 崑崙還東國

    題主說的這項技術是由美國加州大學舊金山分校的科學家組成的團隊創造了一種計算機解碼器,可以將控制人發聲方式的大腦訊號轉化為合成語音,這種合成語音幾乎與真人語音一樣清晰自然,是一種腦機介面(BCI)技術。這項技術首先讓我想到是霍金老爺子,他患有嚴重疾病,使得說話極具有障礙性,如果這項技術能應用到他身上,他的思想將更容易向我們傳達。沒錯,這項技術的初衷就是為這些有語言障礙的人士量身定製的,使得他們也能自然自由的發聲。

    這項技術運用人工智慧方面的神經網路技術,下圖中(a)是該技術初級版本,即分兩步走,一利用腦電圖裝置監測語音相關區域得到訊號,這屬於生物技術領域。二用遞迴神經網路(RNN)合成語音輸出,這屬於人工智慧領域,可見這項技術是跨學科和領域的。

    上圖(b)是本次公佈技術創新之處,RNN被用於兩階段解碼。第一個階段考慮了涉及語音生成的嘴唇、舌頭、喉部和下頜等解剖結構(紅色部分),神經訊號轉換成聲道發聲器官的預估運動。第二階段才是合成語音輸出。從這個角度看,更符合人的語音發聲的生物特徵。

    既然是人工智慧,就缺少不了樣本資料學習。這項技術的研究人員招募了五名志願者

    這些志願者的大腦中植入了256個電極組,以跟蹤講話中使用的訊號。研究人員使用一種稱為高密度腦電圖的技術來跟蹤控制言語和發音運動的大腦區域的活動,志願者被要求說了數百句話,至少包含460個單詞,這些句子之前被選為英語中所有聲音的代表,這樣研究人員就得到樣本資料研究了。

    這項技術的負責人是Edward Chang博士,是一名華裔,研究重點是言語、運動和人類情感的大腦機制。如果這項技術能夠成功應用,人工智慧將在生物醫學方面大展身手,例如今天語音合成,明天會不會是假肢控制呢?為殘疾人士帶來福音。

    當然我不希望這項技術應用騷擾電話上,因為目前人工智慧騷擾電話已經很智慧了,再來一個能夠知道我所想的AI,豈不更煩人。

  • 中秋節和大豐收的關聯?
  • 乒乓球不能受到廣泛關注的原因是什麼?