圖靈TOPIA
編譯:安然
最近,南韓首爾一家資訊科技企業Hyper connect的研究人員開發了一種名為“MarioNETte”的工具,訓練AI將一個人的面部動作對映到目標頭像上。
“MarioNETte”可以實現只通過網路攝像頭或圖片就能逼真地處理歷史人物或政治家的面部特徵。
這一目標的實現一定程度上歸功於尖端的機器學習技術。研究人員稱,即使被操縱的臉和被操縱的人之間存在“明顯”的不匹配,它的效能也優於其他所有基線。
從技術上講,MarioNETte是一種面部重現工具,其目的是通過人的運動來合成一張模擬的臉,同時保持臉的外形不變。
這並不是一個新想法,但以前的方法要麼需要幾分鐘的時間訓練資料,且需要重新設定目標,要麼在處理大的姿勢時會扭曲目標的特徵。
MarioNETte通過整合三個新要素來提高技術水平: image attention block、目標特徵對齊和landmark transformer。MarioNETte不需要標記資料的目標,與需要人工註釋示例的方法相反。
研究人員使用VoxCeleb1和CelebV對MarioNETte進行了訓練和測試。
使用來自VoxCeleb1的1,251名不同的名人對模型和基線進行了訓練,並通過從100個隨機選擇的VoxCeleb1視訊中抽取2,083個影象集(加上CelebV中的2,000個影象集)取樣,對一組模型進行了測試。
結果:在多達八張目標影象上,除了PSNR ,MarioNETte超越了所有其他模型。
在一項使用者研究中,其中100名志願者被要求根據品質和真實性從不同模型生成的兩幅影象中選擇其中一幅,MarioNETte的輸出排名高於其他所有基準。
研究人員將繼續對landmark transformer進行改進,使其更具說服力。“我們提出的方法不需要額外的微調來進行身份適配,這大大增加了模型在野外部署時的實用性,”合著者寫道:“該論文詳細描述MarioNETte架構和驗證,我們的實驗也證明了該方法的優越性。”
這項工作可能使攝像師能夠在沒有運動跟蹤裝置的情況下,以低廉的成本製作動畫人物。但它也可能被濫用於創作高度逼真的贗品,也就是用現有的影象或視訊中的一個人替換成另一個人的影象。
在不到一年的時間內,線上欺詐視訊的數量增長了84%,促使Pew Center進行了調查。受訪者表示,他們預計社交媒體上分享的新聞中有57%的訊息“很大程度上不準確”。
美國有四分之三的人贊成採取措施來限制經過更改的視訊和影象,Google和Facebook等公司已經發布了旨在檢測深造假的資料集和AI模型。
原文連結:
https://venturebeat.com/2019/11/27/researchers-train-ai-to-map-a-persons-facial-movements-to-any-target-headshot/
3萬元獎金、證書、實習、就業機會已準備就位,快叫上小夥伴一起來組隊參賽吧。
賽題:希望參賽者通過已有的使用者資訊、視訊資訊以及他們是否觀看過某些視訊,來預測我們推薦給這些使用者的視訊對方是否會觀看。
個人、高等院校、科研單位、網際網路企業、創業團隊、學生社團等人員均可報名。
報名及組隊時間:即日起至2020年2月1日
報名入口:
http://www.turingtopia.com/competitionnew/detail/e4880352b6ef4f9f8f28e8f98498dbc4/sketch