-
1 # IT一零言
-
2 # DeepTech深科技
入選理由:兩個 AI 系統通過玩“貓捉老鼠”遊戲來獲得想象力
重大意義:這給機器帶來一種類似想象力的能力,因此可能讓它們變得不再那麼依賴人類,但也把它們變成了一種能力驚人的數字造假工具
主要研究者:Google Brain、DeepMind、英偉達、中科院自動化所、百度、阿里巴巴、騰訊、商湯科技、依圖科技、雲從科技、曠視科技等
成熟期:現在
人與機器的區別和界限在AI技術日漸昌盛的當下變得愈發模糊,而“對抗性神經網絡”的出現又毫無疑問地使這一困局雪上加霜。因為在大眾的認知當中,目前的人工智能技術還只是應用於物體的識別,而且在這方面的能力越來越強。例如,給AI看一百萬張圖片,它就可以用驚人的準確度來告訴你究竟哪張裡面有個行人在過馬路。
那麼AI能否憑借自己的“想象力”從無到有生成一張圖片呢?直到 2014 年,科學家們給出了肯定的答案。當時還是蒙特利爾大學博士生的 Ian Goodfellow 在酒吧裡與友人進行學術辯論時,他突然想到了這個問題的答案,提出了名為“對抗式生成網絡”(GAN)的技術。
該技術會使用兩個神經網絡(一種簡化人腦數學模型,是現代機器學習基石),然後讓這兩者在數字版的“貓捉老鼠”遊戲中相互拼殺。這兩個網絡會使用同一個數據集進行訓練。其中一個神經網絡叫生成網絡,它的任務就是依照所見過的圖片來生成新的圖片,比如一個多長一條手臂的行人。而另外那個神經網絡叫判別網絡,它的任務則是判斷它所見得圖片是否與訓練時的圖片相似,還是由生成模型創造出來的“假貨”,比如,判斷那個長著三個手臂的人有沒有可能是真的?
慢慢的,生成網絡創造圖片的能力會強到無法被判別網絡識破的程度。基本上,經過訓練之後,生成網絡學會了識別並創造看起來十分真實的行人圖片。
這項技術已經成為了在過去十年最具潛力的人工智能突破,幫助機器產生甚至可以欺騙人類的成果。
目前,GAN 已被用於創造聽起來十分真實的語音,以及非常逼真的假圖片。就拿一個很有名的例子來說,來自芯片公司英偉達的研究人員們用明星照片訓練出了一個 GAN 系統,而這個系統則生成了數百張根本不存在、但看起來十分真實的人臉照片。另外一個研究團隊則生成了看起來十分逼真的梵高油畫。在進一步訓練後,GAN 可以對圖片進行各種修改,比如在乾淨的馬路上蓋上一層雪,或者把馬變成斑馬。
但是 GAN 的成果並非完美:它們可能生成有兩套把手的自行車,或者眉毛錯位的臉。但由於有些圖片與聲音實在太逼真了,一些專家相信,GAN 在某種程度上已經開始理解它們所見到,所聽到的世界的底層結構。而這意味著,隨著人工智能開始獲得想象力,它們也可能開始理解它在這世界上所看到的東西。
Ian Goodfellow發明出GAN後,獲得Facebook首席科學家Yann LeCun、NVIDIA創辦人黃仁勳、Landing.ai創辦人吳恩達等大牛的讚賞,吸引了諸多的機構及企業開始研究。在中國部分,學術機構致力於研究GAN理論的近一步改良及優化,像是中科院自動化所研究人員受人類視覺識別過程啟發,提出了雙路徑GAN(TP-GAN),用於正面人臉圖像合成,而商湯-香港中大聯合實驗室在國際學術大會上發表多項GAN相關研究成果。
中國企業界則是更傾向於把技術應用在服務中,相關案例不勝枚舉,比如,百度使用GAN構建語音識別框架,科大訊飛通過GAN與傳統深度學習框架的結合在語音合成領域獲得了很大的進展。而阿里巴巴的城市大腦項目團隊在ACM MM2017會議上,其中發表的一篇論文便是使用GAN來生成用以進行車牌識別的訓練數據集。
對於GAN,商湯—香港中文大學聯合實驗室教授李鴻升評價道:未來可能對計算機圖形學產生沖擊,發展三年多的 GAN,在已經發展了 60 年的人工智能領域中,雖然還是很新的技術,不過已經有各種變體或進階版出現,而且在諸多研究人員及企業的投入下未來仍有許多的可能性。例如有機會從二維的圖片進展到三維的視頻等等,在更遠的將來,有可能會對圖形學產生沖擊或挑戰。
-
3 # 傅渥成
對抗神經網絡最早的想法最早由 Ian Goodfellow 在 2014 年提出。其中,最常見的一種就是「生成對抗模型(GAN)」了。GAN 用對抗的方法,同時訓練了一個「生成模型(G)」與一個「判別模型(D)」,用對抗的方法,最終生成與原始數據完全相同的概率分布。
在學習的過程中,這生成器和判別器通過相互競爭和博弈,逐漸提高模型整體的生成能力和判別能力。生成模型和判別模型可以都是神經網絡。生成模型的優化目標是盡可能地去生成偽造的數據,從而獲得真實數據的統計分布規律;而判別模型則用於判別給出的一個輸入數據到底來源於真實數據還是生成模型。最終,當一個判別模型無法準確分辨生成模型所生成的數據是否為偽造時,則訓練結束,此時我們認為判別模型與生成模型都已經提高到了較高的水平,生成模型所生成的數據足以模仿真實世界中的數據。
直觀理解一下,假設一個城市治安混亂,很快,這個城市裡就會出現無數的小偷。在這些小偷中,有的可能是盜竊高手,有的可能毫無技術可言。假如這個城市開始整飭其治安,警察們開始恢復城市中的巡邏,很快,一批「學藝不精」的小偷就被捉住了。在捉住一批低端小偷後,城市的治安水平變得怎樣倒還不好說,但很明顯,城市裡小偷們的平均水平已經大大提高了。警察們開始繼續訓練自己的破案技術,開始抓住那些越來越狡猾的小偷。隨著這些職業慣犯們的落網,警察們也練就了特別的本事,他們能很快能從一群人中發現可疑人員,于是上前盤查,並最終逮捕嫌犯;小偷們的日子也不好過了,因為警察們的水平大大提高,如果還想以前那樣表現得鬼鬼祟祟,那麼很快就會被警察捉住。為了避免被捕,小偷們努力表現得不那麼「可疑」,而魔高一尺、道高一丈,警察也在不斷提高自己的水平,爭取將小偷和無辜的普通群眾區分開……隨著警察和小偷之間的這種「交流」與「切磋」,最終,我們同時得到了最強的小偷和最強的警察。
回覆列表
我是萌新程序猿,科技圈的事情歡迎邀請我來回答!對抗性神經網絡又稱作生成對抗網絡,英文:Generative Adversarial Network,簡稱GAN。
對抗性神經網絡的誕生
人工智能善於識別物體,通過大量數據的訓練可以使他知道什麼是電腦等等。但是人工智能缺乏想象力,人可以通過想象創造新事物, 人工智能無法智能到自己創造一些新東西。不過這個問題的解決辦法有大佬想到了,2014年,蒙特利爾大學博士生伊安·古德費羅(Ian Goodfellow)在一家酒吧的學術辯論中首先想到了這個解決方案,這被稱作“生成對抗網絡”(GAN)。GAN讓兩個神經網絡在數字版的“貓鼠遊戲”中相互對抗。對抗性神經網絡工作原理
兩個網絡都使用相同的數據集去訓練。其中一個名為“生成模型”,任務是利用所看到的圖像去創建新的圖片。而另一個名為“鑑別模型”,任務是識別所看到的圖像是否是生成模型制作的假圖像。
通過這樣的過程,生成模型將非常善於產生圖像,導致鑑別模型無法判斷哪些是真實圖像,哪些是假的。這個場景直至生成模型與鑑別模型無法提高自己——即判別模型無法判斷一張圖片是生成出來的還是真實的而結束,此時生成模型就會成為一個完美的模型。從本質上來看,生成模型被訓練去識別並制作看起來真實的圖像。上述這種博弈式的訓練過程,如果採用神經網絡作為模型類型,則被稱為生成式對抗網絡(GAN)。
對抗性神經網絡的未來
現在已經有人將對抗性神經網絡應用與制作一些逼真的圖像和語音等,我覺到後面可以實現一絲不差模仿一個人說話。
對抗性神經網絡可以應用於歷史檔案圖像檢索、文本翻譯成圖像、藥物匹配、腫瘤分子生物學的應用等,有種想法採用對抗性神經網絡經過訓練後,可以使用生成器獲得一種以前不可治愈的疾病的藥方,並使用判別器確定生成的藥方是否治愈了特定疾病,如果可行,相信很多不可治愈的疾病說不定可以找到治愈的方法。
對抗性神經網絡可以讓人工智能具有比較基礎的想象力,相信 GAN在未來會有更進一步發展,人工智能會更加智能, 有助於建立一個更好的人工智能的未來。