很長時間以來,是否具備情感,是區分人與機器的重要標準之一。換言之,機器是否具有情感也是機器人性化程度高低的關鍵因素之一。
當前,人工智慧已呈現高速增長和全面擴張的態勢。一方面,人工智慧不斷朝更深層的智慧方向發展,包括數學運算、邏輯推理、專家系統、深度學習等;另一方面,人工智慧不斷向社會的各個領域進行擴充套件,從智慧手機到智慧家居,從智慧交通到智慧城市等。
“感知智慧”逐漸向具有理解和表達能力的“認知智慧”轉變,為機器賦予感情成為必然趨勢。人工智慧之父馬文·明斯基就曾提到,“如果機器不能夠很好地模擬情感,那麼人們可能永遠也不會覺得機器具有智慧”。
想要人工智慧理解人類感情,則需要從人工智慧的情感計算開始。
人工智慧正在理解人類情緒
試圖讓人工智慧理解人類情感並不是新近的研究。
早在1997年,麻省理工學院媒體實驗室Picard 教授就提出了情感計算的概念。Picard 教授指出,情感計算與情感相關,源於情感或能夠對情感施加影響的計算。簡單來說,情感計算旨在透過賦予計算機識別、理解和表達人的情感的能力,使得計算機具有更高的智慧。
自此,情感計算這一新興科學領域,開始進入眾多資訊科學和心理學研究者的視野,從而在世界範圍內拉開了人工智慧走向人工情感的序幕。
情感計算作為一門綜合性技術,是人工智慧情感化的關鍵一步,包括情感的“識別”、“表達”和“決策”。“識別”是讓機器準確識人類的情感,並消除不確定性和歧義性;“表達”則是人工智慧把情感以合適的資訊載體表示出來,如語言、聲音、姿態和表情等;“決策”則主要研究如何利用情感機制來進行更好地決策。
識別和表達是情感計算中關鍵的兩個技術環節。情感識別透過對情感訊號的特徵提取,得到能最大限度地表徵人類情感的情感特徵資料。據此進行建模,找出情感的外在表象資料與內在情感狀態的對映關係,從而將人類當前的內在情感型別識別出來,包括語音情感識別、人臉表情識別和生理訊號情感識別等。
人臉表情識別顯然是情感識別中關鍵的一部分。在人類交流過程中,有55%是透過面部表情來完成情感傳遞的。20 世紀70 年代,美國心理學家Ekman 和Friesen 對現代人臉表情識別做了開創性的工作。
Ekman 定義了人類的6 種基本表情:高興、生氣、吃驚、恐懼、厭惡和悲傷,確定了識別物件的類別;建立了面部動作編碼系統(facial action coding system,FACS),使研究者能夠按照系統劃分的一系列人臉動作單元來描述人臉面部動作,根據人臉運動與表情的關係,檢測人臉面部細微表情。
情感識別是目前最有可能的應用。比如,商業公司利用情感識別演算法觀察消費者在觀看廣告時的表情,這可以幫助商家預測產品銷量的上升、下降或者是保持原狀,從而為下一步產品的開發做好準備。
機器除了識別、理解人的情感之外,還需要進行情感的反饋,即機器的情感合成與表達。與人類的情感表達方式類似,機器的情感表達可以透過語音、面部表情和手勢等多模態資訊進行傳遞,因此機器的情感合成可分為情感語音合成、面部表情合成和肢體語言合成。
其中,語音是表達情感的主要方式之一。人類總是能夠透過他人的語音輕易地判斷他人的情感狀態。語音的情感主包括語音中所包含的語言內容,聲音本身所具有的特徵。顯然,機器帶有情感的語音將使消費者在使用的時候感覺更人性化、更溫暖。
從情感計算的決策來看,大量的研究表明,人類在解決某些問題的時候,純理性的決策過程往往並非最優解。在決策的過程中,情感的加入反而有可能幫助人們找到更優解。因此,在人工智慧決策過程中,輸入情感變數,或將幫助機器做出更人性化的決策。
微軟的研究人員曾在這個問題上給出過答案,他們提出了一種基於周圍血管搏動測量(Peripheral Pulse Measurements)的內在獎勵的強化學習新方法,這種內在獎勵是與人類神經系統的響應相關的。研究人員假設這種獎勵函式可以幫助強化學習解決稀疏性(sparse)和傾斜性(skewed),以此提高取樣效率。
“情感”鴻溝的跨越和未跨越
情感智慧是讓機器更加智慧的關鍵,具有情感的機器不僅更通用、更強大、更有效,而且將更趨近於人類的價值觀。在人類科學家長期的努力下,橫亙在人腦與電腦之間的“情感”鴻溝正在被跨越。
微軟小冰的開發團隊負責人李笛曾表示,小冰作為一個人工智慧平臺,已經在技術、產品、資料三者之間形成了一個正迴圈。換言之,小冰積累的大資料已經足夠多到能夠讓小冰實現自我進化。
2017年5月,“微軟小冰”出版了第一部由人工智慧創作的詩集《陽光失了玻璃窗》,其中部分詩作在《青年文學》等刊物發表或在網際網路釋出,並被宣佈享有作品的著作權和智慧財產權。正如小冰在詩歌中作出的自我陳述:“在這世界,我有美的意義。”
如今,小冰已經積累了百億輪與人類的對話資訊,從中提取了海量歷史資料,這些海量資料已經足夠多到讓小冰對未來對話的判斷準確程度超過50%。某種程度上,小冰已經形成了初步的記憶、認知與意識能力。
如今,隨著大量統計技術模型的湧現和資料資源的累積,情感計算在應用領域的落地日臻成熟。當然,任何一門技術都有其技術曲線,情感計算的發展也不是一帆風順的。
一方面,情感計算必然面臨群體情感和個體情感的矛盾。由於對情感的感知和理解存在具體的個體差異,在應用過程中情感個性化是非常重要的考量。然而,個性化和泛化能力是相互矛盾的,這也成為了情感計算的一個技術難點。
事實上,過去情感研究的預設前提和假設都是情感的群體共性,即群體在表達同樣的外顯資料時,內心情感狀態是一致的。這令關注個體獨特性時,面臨著資料和方法的問題:如何把控所需的個人資料量?在實際應用場景中,又是否能真正獲取到每個人所謂的獨特資料?
另一方面,則是對於個體的情緒計算。雖然透過控制情緒波動的幅度,能夠模擬性格活潑誇張和安靜內斂的人不同的情感起伏,但目前即使是利用共通的情感模擬出一個普通的人,也十分困難。機器在每輪情緒切換中比較跳躍,很難像人那樣保持自然、連貫的變化。
此外,個人情感分析問題在互動領域不斷衍生著新的應用方式。比如,在智慧客服領域有效檢測使用者情感;日趨成熟的測謊技術,也能夠在話術引導下透過生理引數,甚至僅僅是音訊和影片訊號等反應心理細微波動的引數來進行情感分析。
但是,個性化服務卻也面對隱私保障的挑戰。個性化的情感計算必然讓渡使用者的更多資料,在這樣的情況下,隱私能否受到有效保護還未可知。
可以預見,情感計算在未來將改變傳統的人機互動模式,實現人與機器的情感互動。從感知智慧到認知智慧的正規化轉變,從資料科學到知識科學的正規化轉變,人工智慧也將在未來給我們交出一個更好的回答。