首頁>技術>

自從其在NIPS 2014上首次釋出以來,生成對抗網路(GAN)一直是深度學習中的熱門話題。

理由是:GAN可以僅基於少量內容來建立新內容。正是這種創造力使它們如此強大。

GAN已被證明能夠將這種創造力應用於多種多樣且有用的應用程式:

生成人們穿著某些服裝的影象。非常適合虛擬地檢視線上顯示的服裝在客戶身上的外觀。 建立藝術品 電影和視訊遊戲的重新制作和品質改善 加強對非常複雜的深層物理主題的研究,例如“暗物質”

僅舉幾個例子。

有了這些,大量的資源被投入到GAN研究中,以了解它們如何工作以及如何設計絕對最佳的GAN網路。最終,經過幾年的成熟,AutoML和神經體系結構搜尋(NAS)進入了GAN領域。

本文分為以下兩個部分:

第一部分說明GAN的工作方式以及當前如何手動設計它們。

第二個展示了全新的深度學習研究成果-AutoGAN,該研究應用了Neural Architecture Search來自動找到最佳的GAN架構。

GAN如何工作

生成對抗網路(GAN)歸入“生成”模型組。這意味著他們能夠產生,即產生全新的“有效”資料。有效資料是指網路的輸出應該是我們認為可以接受的目標。

為了說明,考慮一個示例,我們希望生成一些新影象來訓練影象分類網路。當然,對於這樣的應用程式,我們希望我們的訓練資料儘可能真實,在其他影象分類訓練資料集的樣式上可能非常相似。

下圖顯示了GAN生成的一組影象的示例。

他們看起來很真實!如果不告訴我們它們是計算機生成的,我們可能會相信有人收集了這些資訊!

漸進式GAN的示例輸出

為此,GAN建立了兩個獨立的相對網路:生成器和鑑別器。當僅將嘈雜的影象陣列作為輸入時,會對生成器進行訓練以建立逼真的影象。

鑑別器經過訓練可以對影象是否真實進行分類。

GAN中的真正力量來自於他們遵循的相反的訓練方式。

生成器網路的權重是根據鑑別器的損失來學習的。

因此,以某種方式推動生成器進行訓練,以使其生成的影象很難辨別它們是否真實。

在這些影象看起來越來越真實的同時,鑑別器在分辨哪些影象是真實影象方面也越來越好,無論它們在肉眼上看起來多麼相似。

因此,GAN建立了一種反饋迴路,其中生成器幫助訓練鑑別器,鑑別器幫助訓練生成器。他們倆在一起變得更好。

下圖有助於說明這一點:

注意,生成器只是一個以影象為輸出的CNN,而鑑別器只是一個以類概率為輸出的CNN分類網路,很簡單。由於這種簡單性,大多數GAN架構只是其他最新的深度網路的副本。生成器可以採用類似U-Net的形式,而鑑別器通常看起來像ResNet,DenseNet或類似的體系結構。

好訊息是,這可以簡化部分問題。研究科學家可以簡單地借用先前已證實的研究中的網路設計,而只需專注於GAN的演算法設計和訓練機制。

另一方面,這可能會有所限制。如果當前的網路設計不是最適合GAN怎麼辦?它們自己可以很好地工作,但是也許可以通過為他們量身定製的設計來改進網路結構,從而進一步提高GAN效能。

使用AutoGAN查詢最佳GAN

神經架構搜尋(NAS)一直是深度學習的另一個熱門話題。NAS是一種搜尋最佳神經網路架構的演算法。

大多數NAS演算法以以下方式工作。

首先定義一組可用於我們的網路的“構建塊”。 然後使用控制器遞迴神經網路(RNN)對這些構造塊進行取樣,將它們放在一起以建立某種端到端架構。 然後在特定的資料集上訓練和評估這個新建的網路。 基於評估,將調整RNN選擇的構建塊,即RNN將選擇一個新集合,保留有助於準確性的塊和配置,並替換或刪除那些沒有的構建塊。 步驟3到步驟4重複多次,直到找到最佳架構為止。

這種樣式的NAS已成功應用於影象分類和語義分割。

NAS 演算法

AutoGAN也遵循相同的學習方案,特別是專注於構建Generator網路,因為在尋找最佳分類網路(針對Discriminator)方面已進行了更多工作。

正如作者在論文中所指出的那樣,僅由於其設計,訓練GAN本身就不穩定。精心的網路構建對於使流程平穩執行至關重要。考慮到這一點,AutoGAN的搜尋空間比NAS的搜尋空間要受限制得多。不能從許多不同型別和大小的卷積塊中進行取樣並跳過連線,而是將AutoGAN的Generator搜尋空間設定為:

二進位制值跳過,它指示當前單元格是否採用了前一個單元格的附加跳過連線。 基本卷積塊,決定是否包括啟用前或啟用後。 標準化型別的選擇:批處理標準化,例項標準化和無標準化。 要使用的上取樣型別:雙線性上取樣,最近鄰居上取樣或跨度2反捲積。 是否使用單元內附加跳過連線

AutoGAN的Generator網路的搜尋空間

有了這個受更多控制的搜尋空間,由於NAS的搜尋範圍和複雜性大大降低,因此應用NAS查詢最佳的Generator架構變得更加簡單和穩定。

使培訓更有效的另一種技術是使用多層體系結構搜尋(MLAS),而不是常規的多層體系結構搜尋(SLAS)。對於常規的SLAS,將使用單個RNN控制器一次構建整個NAS網路。但是使用MLAS可以逐步建立網路。

MLAS以自下而上的方式執行搜尋,對每個單元分別執行架構搜尋。因此,每個小區將使用其自己的個人RNN控制器進行搜尋。從某種意義上說,這也簡化了搜尋,因為NAS一次只專注於網路的一個特定部分,而不是整個非常複雜的整體。

AutoGAN的RNN控制器

憑藉其巧妙的新培訓設定以及細化,集中的單元格搜尋空間,AutoGAN能夠獲得最先進的結果。

具體來說,它設定了一個新的標杆,用於根據人的判斷來生成高視覺品質的新影象。

AutoML正在逐步進入DeepLearning和AI的許多領域。

毫無疑問,這將是未來幾年AI研究的重點,人工智慧創造人工智慧。

  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • 微服務的架構技術選型和設計「解」