生成对抗网络 : LSGAN, WGAN, CGAN, infoGAN, EBGAN, BEGAN, VAE
訓練”穩定”,樣本的”多樣性”和”清晰度”似乎是GAN的 3大指標 — David 9
VAE與GAN
聊到隨機樣本生成, 不得不提VAE與GAN, VAE用KL-divergence和encoder-decoder的方式逼近真實分布. 但這些年GAN因其”端到端”靈活性和隱式的目標函數得到廣泛青睞. 而且, GAN更傾向于生成清晰的圖像:
VAE與GAN生成對比
GAN在10次Epoch后就可以生成較清晰的樣本, 而VAE的生成樣本依舊比較模糊. 所以GAN大盤點前, 我們先比較一下VAE與GAN的結構差別:
VAE與GAN結構比較
VAE訓練完全依靠一個假設的loss函數和KL-divergence逼近真實分布:
GAN則沒有假設單個loss函數, 而是讓判別器D和生成器G之間進行一種零和博弈,?一方面,?生成器G要以生成假樣本為目的(loss評估), 欺騙判別器D誤認為是真實樣本:
另一方面,?判別器D要以區分真實樣本x和假樣本G(z)為最終目的(loss評估):
一般,?判別器D在GAN訓練中是比生成器G更強的網絡, 畢竟, 網絡G要從D的判別過程中學到”以假亂真”的方法. 所以, 很大程度上, G是跟著D學習的.
當然, 生成對抗網絡也有一些問題, 比如經常很難訓練(DCGAN試圖解決), 有時候(特別是高像素圖像), GAN生成圖像不清晰, 還有時候, 生成圖片多樣性太差(只是對真實樣本的簡單改動).
這些問題, 催生出近年來各種有意思的GAN改進算法:
LSGAN(最小二乘GAN)
傳統GAN中, D網絡和G網絡都是用簡單的交叉熵loss做更新,?最小二乘GAN則用最小二乘(Least Squares) Loss 做更新:
選擇最小二乘Loss做更新有兩個好處, 1. 更嚴格地懲罰遠離數據集的離群Fake sample, 使得生成圖片更接近真實數據(同時圖像也更清晰) 2. 最小二乘保證離群sample懲罰更大, 解決了原本GAN訓練不充分(不穩定)的問題:
來自: https://arxiv.org/pdf/1611.04076.pdf
但缺點也是明顯的, LSGAN對離離群點的過度懲罰, 可能導致樣本生成的”多樣性”降低, 生成樣本很可能只是對真實樣本的簡單”模仿”和細微改動.
WGAN
DCGAN用經驗告訴我們什么是比較穩定的GAN網絡結構, 而WGAN告訴我們: 不用精巧的網絡設計和訓練過程, 也能訓練一個穩定的GAN.
WGAN?通過剪裁D網絡參數的方式, 對D網絡進行穩定更新(Facebook采用了一種名叫”Earth-Mover“的距離來度量分布相似度).
來自: https://arxiv.org/pdf/1701.07875.pdf
但是, 有時一味地通過裁剪weight參數的方式保證訓練穩定性, 可能導致生成低質量低清晰度的圖片.
WGAN-GP
為了解決WGAN有時生成低質量圖片的問題,?WGAN-GP舍棄裁剪D網絡weights參數的方式, 而是采用裁剪D網絡梯度的方式(依據輸入數據裁剪),?以下是WGAN-GP的判別器D的Value函數和生成器G的Value函數:
WGAN-GP在某些情況下是WGAN的改進, 但是如果你已經用了一些可靠的GAN方法, 其實差距并不大:
DRAGAN
DRAGAN本質上也是一種梯度裁剪(雖然文章自稱是新穎的正則化方式),其判別器和生成器的價值函數類似WGAN-GP:
作者的初衷是希望避開局部最優解,獲得更穩定的GAN訓練。該算法另一個特點是實現簡單, 作者提供的源碼如下:
https://github.com/kodalinaveen3/DRAGAN
EBGAN(基于能量函數的GAN)
EBGAN我們在之前一期討論過,EBGAN在邊緣的生成效果上更流暢, 而且加了特殊的正則項, 在生成的類別上, EBGAN更傾向于生成不同的臉型和人種,下圖是論文EBGAN和DCGAN的比較:
DCGAN個EBGAN生成人臉對比
EGGAN的判別器比較特殊用了encoder-decoder的結構:
BGAN(Boundary-Seeking GAN)
BGAN優勢在于生成離散樣本(當然像圖像這樣的連續樣本也可以支持)。
BGAN的生成器以不斷生成決策邊界上的樣本為目標:
SGAN(Stacked GAN)
SGAN是一種結構創新的GAN,通過堆疊多個GAN網絡,實現生成模型的信息“分層化”:
實驗表明SGAN可以生成比一般GAN更清晰的圖片 ,另外加入一些條件生成的功能也相當方便,github代碼:https://github.com/xunhuang1995/SGAN
條件生成的GAN
許多情況下,我們需要生成指定類的隨機樣本,這時就需要條件生成的GAN:
CGAN
CGAN是對條件生成GAN的最先嘗試,方法也比較簡單,直接在網絡輸入加入條件信息c,用來控制網絡的條件輸出模式:
公式也相對簡單:
這樣,使得生成指定label的樣本成為可能:
來自:https://arxiv.org/pdf/1411.1784.pdf
ACGAN(輔助類別的GAN)
ACGAN在Imagenet上的生成效果令人驚嘆,它特意學習了一個類別下的圖片結構:
來自:https://arxiv.org/pdf/1610.09585.pdf
與CGAN不同的是它在判別器D的真實數據x也加入了類別c的信息,這樣就進一步告訴G網絡該類的樣本結構如何,從而生成更好的類別模擬:
infoGAN
對于生成同類別的樣本,infoGAN另辟蹊徑,通過最大化互信息(c,c’)來生成同類別的樣本,其中c是隱信息:
因為隱信息c可以作為超參數控制生成圖像,我們可以得到一些有趣的結果:
來自: https://arxiv.org/pdf/1606.03657.pdf
如上圖,通過控制隱信息c從-2到2,我們可以控制生成圖片的旋轉方向或者字體寬度(從左到右的每列)。
?
轉自:David 9的博客
參考文獻:
總結
以上是生活随笔為你收集整理的生成对抗网络 : LSGAN, WGAN, CGAN, infoGAN, EBGAN, BEGAN, VAE的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WGAN-GP 学习笔记
- 下一篇: batch-size 深度学习笔记