首頁>科技>

亞馬遜正在使用神經網路和自然語言模型來改善Alexa的說話風格,為其賦予新的聲音,甚至注意到使用者對此不滿意。

亞馬遜在週三宣佈了一大批新產品,這再次表明,它希望將其Alexa數字助理擴充套件到儘可能多的消費技術類別,不僅是智慧揚聲器,還包括從耳塞,眼鏡到戒指的一切商品。但是在西雅圖的公告中還融入了另一個故事情節。越來越多的人工智慧,特別是自然語言AI正在以更多方式進入Alexa。

首先,亞馬遜表示,在將文字(例如您的簡訊)轉換為語音時,一直在使用神經網路使Alexa的聲音聽起來更人性化。負責Alexa機器學習和人工智慧的負責人Rohit Prasad告訴我,這項技術使亞馬遜採取了完全不同的方法來生成語音。

過去,Alexa的演算法將語言分解為單詞部分或人聲,然後嘗試儘可能平滑地將它們串在一起。但是,這聽起來總是有些動盪和機器人化。Prasad說,現在,亞馬遜正在使用可以實時生成整個文字句子的神經網路。這樣會產生聲音更流暢,更人性化的聲音。(Apple的Siri和Google的Assistant最近也通過類似的方式發出了更自然的聲音。)

正是這種自然語言建模很快將為Alexa帶來完全不同的聲音。亞馬遜表示,它將從名人開始,薩瑪莉·傑克遜(Samual L. Jackson)是第一位。亞馬遜將從今年晚些時候開始銷售傑克遜·亞歷山大(Jackson-as-Alexa)的附加服務。

亞馬遜的傑克遜語音至少部分是由自然語言模型驅動的。該模型從傑克遜的聲音中學習(他在錄音室錄製了許多樣本),以模仿他獨特的語氣,同時提供助手通常會提供的答案和資訊。但是亞馬遜還“整理”了一套完整的傑克遜講話供助手在適當的時候使用。

傑克遜可能只是亞馬遜提供的許多名人聲音中的第一個,以替代標準Alexa聲音。(與此同時,由於使用AI合成聲音方面的進展,Google 於今年初讓John Assistant 像John Legend一樣進行了交談。)

會說話的門鈴

亞馬遜還在其Ring Doorbell cams中添加了一些機器學習技巧。亞馬遜在一項名為“ Doorbell Concierge”的新服務中,這些裝置將很快能夠檢測到各種未經事先通知就出現在前門的人。我看到的演示針對三種訪客:一個提供包裹的傢伙,一個賣餅乾的女童軍和一個身份不明的男子。魔戒讓他們所有人進行了簡短的對話,以找出他們想要的東西,而後臺的神經網路使用他們所說的話來確定他們是什麼樣的呼叫者。它僅根據他們說的內容執行此操作,而不是根據相機影象執行此操作。然後,分類通知Ring裝置對每個裝置說些什麼。例如,在詢問送貨員是否需要簽名後,它告訴送貨員將包裹放在何處。

環視訊門鈴。[照片:由Ring提供)新的“禮賓服務”功能尚未完全投放市場。釋出後,它可能會識別出一小部分型別的呼叫者。但是那一套可能會增長。

ALEXA在聽

去年,亞馬遜擴大了Alexa的聽證會,以發現的不僅是人工命令。作為其Guard家庭安全模式的一部分,Echo揚聲器中使用的靈敏麥克風陣列開始監聽玻璃破碎的聲音,並且當沒有人在家時會發出煙霧警報。現在,當Guard設定為“離開”模式時,亞馬遜增加了在家中收聽與人類相關的聲音的功能。這些聲音包括腳步聲,咳嗽聲和本來應該沒有人在家時關門的聲音。如果Alexa檢測到這些聲音之一,則可以向用戶傳送警報。

在所有這些情況下,深度學習模型都是從麥克風獲取音訊輸入並標記潛在的危險聲音。亞馬遜可以訓練助手聽許多其他型別的聲音。例如,Alexa裝置可以開始聆聽老年人居住的地方的跌倒聲或呼吸困難的聲音。亞馬遜是否朝這個方向發展是每個人的猜測,但是該公司正在穩步增加Alexa可以聽的東西這一事實可以說明。

亞馬遜的新Echo Dot也是一個時鐘。[照片:Amazon.com,Inc.]

聽力沮喪

自然語言研究中的一個相對較新的領域是使用神經網路通過單詞和語調檢測情感。亞馬遜一直在關注與Alexa交談的人們的沮喪之聲。當檢測到沮喪時,Alexa可能會得出結論,即給出了使用者不喜歡的答案,然後尋找另一種答案。普拉薩德說,亞馬遜有一套自己的聽起來沮喪的人的錄音記錄,用來訓練神經網路。

但這是一個難題。助手必須在檢測到沮喪的人後知道如何應對。而且,如果在提供答案時又花了點時間,則助手最好確定第二個答案是有用的。有時候助手不得不說“對不起,我沒有答案。”

Prasad說:“我們開始嘗試這些不同的響應方式,一旦啟動,您將看到許多不同的口味。”

這種情緒意識很可能會開始出現在許多助手中。任何助手都應該能夠知道什麼時候做錯了什麼,並能夠開啟反饋迴圈以便變得更好。

沮喪檢測功能可能會在明年的Alexa中出現。

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 微軟重新迴歸智慧手機市場?兩款Surface小尺寸摺疊產品釋出