头像秒变像素风,宅男大叔自学AI打造大师级水准,火爆推特
梅寧航發自凹非寺
量子位報道公眾號 QbitAI
最近,一位日本宅男大叔佐藤做了一個 AI 生成肖像畫的網站 AI Gahaku,10 天內用戶訪問量從 0 暴增到 100 萬,引爆推特。
簡單易操作,上傳一張人臉照片,就能生成一張大師級肖像畫。
而比技術更神奇的是佐藤自己,因為他是自學 AI 做出來的,不得不佩服的宅男創造力。
佐藤患有阿斯伯格癥——也被俗稱成“社交恐懼癥”,名副其實的天才病,一般來說,此類患者會在某個領域具有特殊潛能,但不適應普通人的生活。
當然,佐藤的技能點就點在了 AI 上。
pix2pix,TensorFlow 內置的 cGAN 模型
讓大叔此次聞名的 AI 技術,就是是大名鼎鼎的 GAN 的變種。
此次的人臉肖像畫生成技術,就是大叔在 TensorFlow 內置的 cGAN (條件生成對抗網絡)中的pix2pix模型上改造而來。
不同于 GAN 的技術通用性,cGAN 更強調特定場景下的發揮,比如 AI Gahaku,就只能針對人臉,如果用戶上傳的是貓臉,則是無法生成結果的。
GAN 的特點在于損失函數的自行計算和自動更新,這使得 GAN 本身具有和遷移學習結合的潛質,在近年來的發展路徑上看,更多是把 GAN 當做手段,去實現遷移學習提出的目標,遷移學習為應用 GAN 提供具體指向。
TensorFlow 的內置 pix2pix 的是基于 cGAN 的圖像對圖像翻譯的模型,模型本身已經成熟,直接調用便可運用到對黑白圖像著色、圖像風格變化等場景的使用上來。
具體到大叔的使用上,利用 pix2pix 模型,大叔其實是將模型限定在大師肖像畫的生成上,這也體現了模型本身強大的擴展性。
如何使用,都取決于你自身。
在佐藤的另一款作品 PixelMe 中,同樣使用 pix2pix 技術,但是生成的是 8bit 的像素風格頭像,一個模型,多種用途。
當然,實際效果因人而異,畢竟嚴格來說,大叔是在對既有模型進行二次開發,原有的算法和數據結構并未改變,因此性能和效果受到原有模型的限制。
宅男的 AI 進階之路
大叔人生經歷可以說復雜,從大學退學后,先后干過面包師,參加過護士學校培訓課程,但覺得都都不太適合自己,直到他決定運用自己的才智,投身到 AI 的事業當中去。
那說干就干,就從 TensorFlow 學起吧。
借助 Google Colab 的算力資源,大叔從頭按著 TensorFlow 教程學起,不過大叔也確實適合干 AI,而不是去蒸糕點。
在學習過程中,佐藤找到了適合自己的方向,遷移學習和 GAN,可以較好的實現圖像的再生成,使用不同的圖像訓練數據集,可以針對具體場景進行學習和生成。
GAN 屬于典型的非監督學習方法,核心原理是讓兩個神經網絡進行“對抗”,通過不斷優化參數來得到最優結果,自我博弈。
這種技術主要用在計算機視覺領域,這也是佐藤選擇 GAN 的主要原因。
得益于 Google 的慷慨,大叔使用的網站服務器和算力資源都較為便宜,大約為一天 20 美刀,大叔表示,在可接受的能力范圍之內,短期不會尋求商業化。
AI for Everyone!
在紅了之后,大叔也沒飄。
他認為這是在做自己感興趣的東西,而不是為了經濟利益。
出于對技術的熱愛,佐藤開始了自己的 AI 之路,并在兩年之后便能上線應用。
這份為夢想而不懈努力的奮斗精神,才是真正值得我們學習的。
畢竟,不是每個人有勇氣去自學 AI。
參考鏈接:
- https://cloud.google.com/blog/products/ai-machine-learning/using-google-cloud-platform-free-tier-to-scale-out-an-ai-service
- https://www.tensorflow.org/tutorials/generative/pix2pix
- https://ai-art.tokyo/en/#/https://pixel-me.tokyo/en/
總結
以上是生活随笔為你收集整理的头像秒变像素风,宅男大叔自学AI打造大师级水准,火爆推特的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 哇哇呀呀时空港(wwyy时空港)
- 下一篇: 米凉粉怎么做好吃呢?