「我去,这也能行!」令人惊叹的8个深度学习应用
2016 年,圍棋程序 AlphaGo 擊敗人類頂尖選手,讓大眾了解到深度學習的概念。不僅如此,在計算機視覺和自然語言處理領域,深度學習已經有了廣泛而成熟的應用場景。人臉識別、自動駕駛、安全防范,都有深度學習的身影。語音識別、問答系統、機器翻譯,都是深度學習技術的模范實踐。
下面收集了一些深度學習的創意應用,希望能夠幫助大家開開腦洞,并感受下深度學習在生活中的應用潛力。當然也會提供了盡可能多的學習資料,讓各位學霸能夠享受盡情折磨自己,不斷進步的快感。
1.Photo Wake-Up
華盛頓大學的博士生 Chung-Yi Weng 和他的朋友們共同開發的一種新形式的 3D 角色動畫,他們將深度學習中的 Mask R-CNN(實例分割模型)與 SMPL 模板(一種參數化人體模型)模型相結合,讓圖像中的人物從圖片走進我們的現實中。
通過從 2D 圖像中剪切出主體,將其裝配到預先構建的骨架上,這樣就可以讓圖像中的主體進行一系列預定動作,如跑步、走路、跳躍。當與智能設備(例如智能手機或平板電腦)一起使用時,3D 動畫可以通過 2D 的照片或者圖畫“喚醒”并走向現實。
資料推薦:
[1] 論文參考:https://arxiv.org/abs/1812.02246?context=cs
[2] 視頻資料:https://youtu.be/hs9K3eNkQOo
2.Let there be color!
自動為黑白照片/視頻內容進行上色。該項目運用深度學習網絡學習自然存在于照片中的某些模式——比如,天通常是藍的,云是白的或者灰的,草是綠的。通過這類規則,完全不需要人為操作就能夠對照片進行重新上色。趕緊偷偷的告訴爺爺去,"家里的黑白老照片馬上就要變彩色了!“
資料推薦:
[1] GitHub:https://github.com/satoshiiizuka/siggraph2016_colorization
[2] 論文參考:http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/data/colorization_sig2016.pdf
[3] 官方網站:http://iizuka.cs.tsukuba.ac.jp/projects/colorization/en/
3.LipNet
牛津大學和 Deepmind 的科學家共同完成了這一項目,通過“觀看”人類說話的視頻,以及輸入相應文字,對唇語的解讀準確率高達93.4%,遠超人類讀唇者52%的平均水平。對于聽力障礙的人來說這個簡直是福音。
資料推薦:
[1] GitHub:https://github.com/bshillingford/LipNet
[2] 論文參考:https://arxiv.org/pdf/1611.01599.pdf
4.Handwriting Generation
根據一些書寫筆跡,學習出筆的移動軌跡和文字之間的關系。然后生成一摸一樣的筆跡,并能過模仿多種筆跡。小朋友從此不再害怕老師要家長簽字了!
資料推薦:
[1] 論文參考:https://arxiv.org/pdf/1308.0850v5.pdf
[2] Demo展示:http://www.cs.toronto.edu/~graves/handwriting.html
5.Deep Dreaming
Google 的研究者找到了一種用深度學習來增強圖像特征的方法,隨后,他們就開發了 Deep Dreaming ——它能夠在圖片中生成一些不可思議的幻象。因為有些和夢境十分相似,因此取名 Deep Dreaming。具體生成什么樣的幻想與這個深度學習系統最近被暴露在什么樣的環境下有關,有時它甚至能生成嚇人的噩夢。
資料推薦:
[1] 項目首頁:https://research.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
[2] 影集:http://www.telegraph.co.uk/technology/google/11730050/deep-dream-best-images.html?frame=3370674
[3]GitHub:https://github.com/google/deepdream
6.Pix2Pix
這個點子與之前提到的 Let there be color!有點類似,不過要更有創造力一點。你可以往電腦中輸入一幅簡筆畫,甚至一些色塊,然后讓電腦發揮自己的創造力輸出新的圖片。類似地,你也可以把衣服航拍照片變成一幅地圖,將白天的場景變成夜晚。
資料推薦:
[1] GitHub:https://github.com/phillipi/pix2pix
[2] 論文參考:https://arxiv.org/pdf/1611.07004v1.pdf
7.DeepWarp
不管你手里拿到了誰的照片,用 Ganin 等人開發的這個深度學習網絡過一下,你就可以讓他的眼睛動起來:你可以讓他上下看、左右看,甚至繞著圈看…這么好用的表情包生產利器,趕緊收藏!
資料推薦:
[1] Demo:http://163.172.78.19/
[2] 參考論文:http://sites.skoltech.ru/compvision/projects/deepwarp/files/deepwarp_eccv2016.pdf
[3] 官方網站:http://sites.skoltech.ru/compvision/projects/deepwarp/
8. Pixel Recursive Super Resolution
谷歌大腦的研究者們訓練了一個深度學習網絡,根據一些分辨率極低的人臉圖像來預測這些面孔真實的樣子。從此馬賽克什么的統統都走開!
資料推薦:
[1] 論文參考:https://arxiv.org/abs/1702.00783
總結
以上是生活随笔為你收集整理的「我去,这也能行!」令人惊叹的8个深度学习应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 常见数据结构的 Python 实现(建议
- 下一篇: 基于京东手机销售数据用回归决策树预测价格