PatchGAN
出自Image-to-Image Translation with Conditional Adversarial Networks
原文如下
3.2.2 Markovian discriminiator (PatchGAN)
L2和L1損失函數(shù)有可能在圖像生成中造成模糊結(jié)果。盡管這些對高頻清晰度而言效果較差,但在許多情況下仍能準確地捕獲低頻。對于這些問題,我們不需要一個全新的網(wǎng)絡在低頻部分進行糾正。L1已經(jīng)可以完成了。
這使得GAN的判別器僅模擬高頻結(jié)構(gòu),依靠L1來強制低頻部分的正確性。對于模擬高頻,只要將注意力限制在局部圖像塊中結(jié)構(gòu)就可以了。因此,我們設計了一個判別器結(jié)構(gòu)---我們叫它PatchGAN,只在補丁(patch)范圍內(nèi)對結(jié)構(gòu)進行懲罰。這個判別器嘗試在一幅圖的每個N×N大小的補丁上進行real or fake的判斷。我們在整個圖片上運行這個判別器,并對所有的結(jié)果取均值,以避免判別器的極端輸出。
在4.4部分,我們說明了N可以比image的尺寸小很多并且仍舊可以產(chǎn)生高質(zhì)量的結(jié)果。這是有利的,因為一個更小的PatchGAN有更少的參數(shù),運行更快,并且可以在任意大小的圖片上運行。
這種判別器將有效的將圖像建立為一個馬爾科夫隨機場,并假定像素間的獨立性大于補丁的直徑。[35]以前探討過這種聯(lián)系,也是紋理和風格模型的常見假設[15,19,14,23,20,34]。因此我們的PatchGAN也可以理解為一種風格/紋理損失。
總結(jié)
- 上一篇: Tensorflow图像通道合并,Ind
- 下一篇: Glow-流生成模型(一)