來自特拉維夫大學的一組研究人員開發了一種神經網路,能夠讀取食譜並生成烹飪完成後的熟食產品的影象。嗯,好像可以更換人頭拍色情片的DeepFakes還不夠糟糕,現在我們無法確定我們在網上看到的美味食物都是否是真實的了。由研究人員Ori Bar El,Ori Licht和Netanel Yosephian組成的特拉維夫團隊使用名為StackGAN V2的生成對抗網路(GAN)的修改版本和巨大的recipe1M資料集中的52K影象/配方組合建立了他們的AI。
該團隊開發了一種人工智慧,只需要列出任何配方和說明清單,就可以運算成品食品的樣子。
這一切都是一名研究人員在向祖母詢問她傳統的番茄醬炸魚排配方時開始的。由於她年事已高,她不記得確切的食譜,所以吃貨科學家就建立了一個能夠給出食物影象的系統,方便輸出食譜。由於人們很難從飯菜中獲得具有實際數量和“隱藏”成分的精確配方,如鹽,胡椒,黃油,麵粉等。因此基於配方生成食物影象就成了有用的做法,這項任務對於人類來說非常具有挑戰性,對於計算機更是如此。
由於目前大多數人工智慧系統都試圖在人類易於完成的任務中取代人類專家,解決一項甚至超出人類能力的任務會很有趣。
值得一提的是,與CUB和Oxford102資料集中的影象相比,recipe1M資料集中的影象質量較低。這反映在許多模糊的影象上,光照條件差,“粥狀影象”以及影象不是方形(這使得訓練模型變得困難)。這個事實可能會解釋這兩個模型成功生成“類似粥”的食物影象(例如麵食,米飯,湯,沙拉),但卻難以生成具有獨特形狀的食物影象(例如漢堡包,雞肉,飲料) )。
如果有足夠的配方,特拉維夫團隊的人工智慧現在可以將它變成一個看起來足夠好的影象,根據研究論文顯示,在盲測中,人類有時更喜歡計算機生成的圖片而不是真實照片。
該團隊打算繼續開發該系統,希望擴充套件到超越食物的領域。包括完善當前的資料集質量,還考慮構建一個包含兒童書籍文字和相應影象的資料集,這樣就可以讓計算機看文章畫插畫了。
來自特拉維夫大學的一組研究人員開發了一種神經網路,能夠讀取食譜並生成烹飪完成後的熟食產品的影象。嗯,好像可以更換人頭拍色情片的DeepFakes還不夠糟糕,現在我們無法確定我們在網上看到的美味食物都是否是真實的了。由研究人員Ori Bar El,Ori Licht和Netanel Yosephian組成的特拉維夫團隊使用名為StackGAN V2的生成對抗網路(GAN)的修改版本和巨大的recipe1M資料集中的52K影象/配方組合建立了他們的AI。
該團隊開發了一種人工智慧,只需要列出任何配方和說明清單,就可以運算成品食品的樣子。
這一切都是一名研究人員在向祖母詢問她傳統的番茄醬炸魚排配方時開始的。由於她年事已高,她不記得確切的食譜,所以吃貨科學家就建立了一個能夠給出食物影象的系統,方便輸出食譜。由於人們很難從飯菜中獲得具有實際數量和“隱藏”成分的精確配方,如鹽,胡椒,黃油,麵粉等。因此基於配方生成食物影象就成了有用的做法,這項任務對於人類來說非常具有挑戰性,對於計算機更是如此。
由於目前大多數人工智慧系統都試圖在人類易於完成的任務中取代人類專家,解決一項甚至超出人類能力的任務會很有趣。
值得一提的是,與CUB和Oxford102資料集中的影象相比,recipe1M資料集中的影象質量較低。這反映在許多模糊的影象上,光照條件差,“粥狀影象”以及影象不是方形(這使得訓練模型變得困難)。這個事實可能會解釋這兩個模型成功生成“類似粥”的食物影象(例如麵食,米飯,湯,沙拉),但卻難以生成具有獨特形狀的食物影象(例如漢堡包,雞肉,飲料) )。
如果有足夠的配方,特拉維夫團隊的人工智慧現在可以將它變成一個看起來足夠好的影象,根據研究論文顯示,在盲測中,人類有時更喜歡計算機生成的圖片而不是真實照片。
該團隊打算繼續開發該系統,希望擴充套件到超越食物的領域。包括完善當前的資料集質量,還考慮構建一個包含兒童書籍文字和相應影象的資料集,這樣就可以讓計算機看文章畫插畫了。