【星球知识卡片】图像生成都有哪些核心技术,如何对其进行长期深入学习
大家好,歡迎來到我們的星球知識小卡片專欄,本期給大家分圖像生成的核心技術點。
作者&編輯 | 言有三
1 基本圖像生成框架
一個基本的圖像生成框架包括判別器和生成器,其中生成器輸入噪聲向量,判別器判別真實圖像和生成的圖像,DCGAN是其中典型的代表,也是新手入門必須掌握的第一個框架。
2 條件GAN
DCGAN固然是可以生成滿足訓練數據集中數據分布的圖片,但是卻沒有辦法進行精確的控制,比如生成具體的某一類數字,或者某一類筆畫風格,因此我們需要條件可以控制的網絡,這就是條件GAN,這也是新手必須掌握的內容,是后續很多GAN變種的基礎。
3 級聯GAN
早期以DCGAN為代表的GAN網絡生成的圖片分辨率太低,質量不夠好,都不超過100×100,這是因為難以學習一次性生成高分辨率的樣本,收斂過程容易不穩定。基于此,金字塔GAN(LAPGAN),Progressive GAN等級連結構被提出并廣泛使用,它們參考圖像領域里面的金字塔結構由粗到精一步一步生成圖像,并學習殘差而不是完整的圖像。
4 多判別器與生成器
當面對復雜的圖像生成問題時,單個判別器和生成器的能力顯得就不夠了,因為多個判別器和生成器的結構被研究者廣泛研究。采用多個判別器的好處帶來了類似于模型集成的優勢,并且可以獨立完成不同的任務,而多個生成器的設計則可以實現生成器的分工合作,以提高模式豐富性。
5 GAN與VAE的結合
GAN和VAE是兩類最常見的生成模型,VAE的特點是可解釋性更強,不過生成結果比較模糊。GAN的特點是生成結果更加逼真,但是容易陷入模式崩塌等問題。有許多研究致力于融合兩者的性能,如ALI,它包含了編碼器,解碼器以及判別器。
6 其他
總的來說,圖像生成有非常多的研究方向,包括:
(1) 條件GAN的各類變種。
(2) 與VAE的結合。
(3) 多生成器多判別器改進。
(4) 遞歸與多尺度設計。
(5) 各類層歸一化機制的使用。
(6) 注意力機制的使用。
(7) 從2D數據到3D數據的生成。
(8) 多模態技術的使用。
(9) 數據生成在數據增強,無監督訓練等任務中應用。
(10) 其他等等。?
以上內容,如果你不想自己學習,可以去我們知識星球的網絡結構1000變板塊—GAN板塊閱讀。
有三AI知識星球
知識星球是有三AI的付費內容社區,里面包括各領域的模型學習,數據集下載,公眾號的付費圖文原稿,技術總結PPT和視頻,知識問答,書籍下載,項目推薦,線下活動等資源,了解詳細請閱讀以下文章:
【雜談】有三AI知識星球一周年了!為什么公眾號+星球才是完整的?
【雜談】萬萬沒想到,有三還有個保密的‘朋友圈’,那里面都在弄啥!
轉載文章請后臺聯系
侵權必究
往期精選
【雜談】2020年有三AI計算機視覺培養計劃詳解,該不該學&怎么學CV的簡單討論
【年終總結】2019年有三AI做了什么,2020年我們要做什么?
【總結】有三AI秋季劃模型優化組3月直播講了哪些內容,為什么每一個從事深度學習的同學都應該掌握模型優化的內容
【總結】有三AI秋季劃人臉算法組3月直播講了哪些內容,計算機視覺你不可能繞開人臉圖像
【總結】有三AI秋季劃圖像質量組3月直播講了哪些內容,為什么解決好底層圖像處理問題那么重要
【星球知識卡片】殘差網絡家族10多個變種學習卡片,請收下!
【星球知識卡片】移動端高效率的分組網絡都發展到什么程度了?
【星球知識卡片】注意力機制發展如何了,如何學習它在各類任務中的應用?
【星球知識卡片】模型剪枝有哪些關鍵技術,如何對其進行長期深入學習
【星球知識卡片】模型量化的核心技術點有哪些,如何對其進行長期深入學習
【星球知識卡片】模型蒸餾的核心技術點有哪些,如何對其進行長期深入學習
【星球知識卡片】視頻分類與行為識別有哪些核心技術,對其進行長期深入學習
總結
以上是生活随笔為你收集整理的【星球知识卡片】图像生成都有哪些核心技术,如何对其进行长期深入学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AutoML】进化算法如何用于自动模型
- 下一篇: 送书 | 经典框架Kaldi配套的语音识