Deepfake平民化,10美元加一台笔记本,人人都能“换脸”阿汤哥
這段著名的視頻中比爾·哈德在不知不覺(jué)中變成湯姆·克魯斯,而且還是阿湯哥年輕時(shí)的樣子。
本文來(lái)自于微信公眾號(hào)硅谷洞察(ID:guigudiyixian),鈦媒體經(jīng)授權(quán)發(fā)布。
如果說(shuō)最近哪項(xiàng)技術(shù)在近段時(shí)間引發(fā)了美國(guó)全社會(huì)的反感,那毫無(wú)疑問(wèn)是人臉識(shí)別技術(shù)。
從去年開(kāi)始,美國(guó)就已經(jīng)開(kāi)始有禁止人臉識(shí)別的動(dòng)作了。去年 5 月,舊金山成為第一個(gè)禁止政府購(gòu)買(mǎi)和使用人臉識(shí)別技術(shù)的城;而今年受弗洛伊德事件影響,6 月 10 日,美國(guó)科技巨頭 IBM 宣布正式放棄人臉識(shí)別技術(shù),緊接著第二天,亞馬遜表示停止對(duì)警方提供面部識(shí)別技術(shù)。
這背后除了種族歧視的問(wèn)題以外,還存在另一個(gè)比較嚴(yán)重的隱患。那就是人們的面部數(shù)據(jù)可能被用于“深度偽造”(Deepfake)。
曾經(jīng),Deepfake 還是有一定門(mén)檻的。雖然網(wǎng)上有開(kāi)源的 Deepfake 的軟件和工具,但是要么硬件要求過(guò)高,要么就是「Fake」的不夠「Deep」。總之,想要制作出一個(gè)完美的 Deepfake 視頻需要專(zhuān)業(yè)人士大費(fèi)周章。
但是,讓人擔(dān)憂(yōu)的 Deepfake 如今已“平民化”。小探甚至發(fā)現(xiàn)了只需要 10 美元和一臺(tái)最基礎(chǔ)的筆記本就能進(jìn)行 Deepfake 的開(kāi)源工具包。只需要經(jīng)過(guò) 24 小時(shí),一張滿(mǎn)臉橫肉的面容就能變成大帥哥「湯姆·克魯斯」。其造假程度說(shuō)是「偷天換日」也不為過(guò)。
想知道這背后的工作原理和操作方式嗎?那就繼續(xù)往下看吧~
只需要 24 小時(shí),我就能變阿湯哥
某日,小探在B站上發(fā)現(xiàn)了一條名為「最高境界的換臉」的視頻。
視頻中一群「科技宅」在自己的實(shí)驗(yàn)室中進(jìn)行視頻拍攝,并運(yùn)用 AI 技術(shù)將他的臉換成著名演員湯姆·克魯斯的臉
換臉的過(guò)程總共需要五步「視頻轉(zhuǎn)圖片」、「提取臉部」、「訓(xùn)練模型」、「人臉替換」、「合成視頻」
首先,他們會(huì)為自己拍攝一段源視頻作為素材以供 AI 進(jìn)行學(xué)習(xí)。注意,在拍攝的過(guò)程中你的面部表情需要盡可能的多,這樣才能夠更好和需要替換的對(duì)象進(jìn)行融合。
拍攝源視頻時(shí)表情盡可能的豐富
然后利用視頻軟件對(duì)臉部表情進(jìn)行提取,這里用到的軟件是 AE 視頻剪輯。在視頻中人進(jìn)行運(yùn)動(dòng)的時(shí)候,對(duì)其臉部的輪廓和細(xì)節(jié)進(jìn)行「摳圖」,并生成一張張不同角度和表情的圖片。
讀取動(dòng)態(tài)面部數(shù)據(jù)
在圖片提取完成后,就可以開(kāi)始進(jìn)入「模型訓(xùn)練」部分了。
視頻中我們可以看到五個(gè)部分,其中最左邊的是最真實(shí)的照片,最中間的是需要替換的目標(biāo)人物的臉,最右邊模糊的部分是最終替換的結(jié)果預(yù)覽。
而中間兩條模糊的對(duì)比欄則是 AI 在進(jìn)行學(xué)習(xí)時(shí)不斷匹配最優(yōu)角度的過(guò)程對(duì)比。
導(dǎo)入人臉數(shù)據(jù)由 AI 進(jìn)行訓(xùn)練
在不停的學(xué)習(xí)過(guò)程中,AI 生成的圖片會(huì)和實(shí)際拍攝的圖片越來(lái)越接近,而最終學(xué)習(xí)的結(jié)果越真實(shí)則代表著最終的「換臉」真實(shí)度會(huì)越高。同時(shí)這也需要更久的時(shí)間。
AI 生成的面部數(shù)據(jù)會(huì)逐漸接近真實(shí)的人臉
而最終經(jīng)過(guò)一天的不間斷學(xué)習(xí),他們成功的將自己的臉更換成了湯姆克魯斯的臉。
「湯姆·克魯斯」來(lái)啦
雖然在視頻中我們可以看到,「湯姆·克魯斯」的臉在某些時(shí)候會(huì)因?yàn)闆](méi)有匹配好而產(chǎn)生扭曲,這也是因?yàn)?AI 只學(xué)習(xí)了一天的原因。但是在正常的視角下還是非常逼真的。
雖然視頻并沒(méi)有寫(xiě)明這幫「科技宅」使用的是哪種 Deepfake 工具。但是小探在搜索過(guò)程中發(fā)現(xiàn)了一款名叫「DeepFaceLab」的開(kāi)源工具,這是由一個(gè)名叫「ctrl shift face」的公司發(fā)布的開(kāi)源 Deepfake 工具。
Ctrl shift face 官網(wǎng)
而那段著名的 Deepfake 視頻就是采用「DeepFaceLab」制作的。這段著名的視頻中比爾·哈德在不知不覺(jué)中變成湯姆·克魯斯,而且還是阿湯哥年輕時(shí)的樣子。
你看得出來(lái)他們?cè)谝凰查g換臉了嗎?
目前這款工具包已經(jīng)在 GitHub 上獲得了五百多星,并且它支持最低 2G 顯存的 64 位像素學(xué)習(xí)。也就是說(shuō),你并不需要太多的算力就能夠在自己的電腦上進(jìn)行 AI 人臉學(xué)習(xí)。
DeepFaceLab 能在 2G 顯存 64 位像素下進(jìn)行 AI 換臉
DeepFaceLab 唯一的安裝要求就是對(duì)應(yīng)版本的顯卡驅(qū)動(dòng),甚至不需要 CUDA 和 CuDNN。并且該軟件還有中文官網(wǎng)以及詳細(xì)的中文安裝說(shuō)明和教程,同時(shí)還自帶許多人臉圖片數(shù)據(jù)。
根據(jù)其教程顯示,雖然沒(méi)有可視化的操作界面,但是其操作流程還算簡(jiǎn)單易懂。完全沒(méi)有代碼基礎(chǔ)的小白只要認(rèn)真隨著操作步驟操作就能很快速的上手。
Ctrl shift face 官網(wǎng)提供了三檔氪金服務(wù)
并且只需要最高 10 美元/月,就能夠使用暢享其所有的換臉數(shù)據(jù)庫(kù),這可真的算是良心價(jià)了。
這里值得注意的是,雖然這款工具包對(duì)于算力的基本要求非常低,但前面我們也提到過(guò),越高的顯存和越長(zhǎng)的 AI 學(xué)習(xí)時(shí)間才是高質(zhì)量 Deepfake 視頻的保障。所以,如果需要達(dá)到上面那種一瞬間換臉的程度,恐怕需要你電腦中昂貴的 GPU 長(zhǎng)時(shí)間的運(yùn)轉(zhuǎn)才能做到。
Deepfake 只是娛樂(lè),千萬(wàn)不要觸犯法律
如今,Deepfake 的工具和開(kāi)源包非常的多,許多極客和計(jì)算機(jī)愛(ài)好者都喜歡使用不同的軟件和工具制作自己的 Deepfake 視頻或音頻。
但是千萬(wàn)別忘了,Deepfake 這個(gè)專(zhuān)有名詞天生就帶有欺騙性質(zhì),如果濫用會(huì)對(duì)個(gè)人隱私、媒體公信力、司法裁決等多方面帶來(lái)困擾。
比如之前硅谷洞察報(bào)道過(guò)的,2018 年 4 月,美國(guó)前總統(tǒng)奧巴馬說(shuō)“特朗普是個(gè)徹頭徹尾的笨蛋”的視頻,在推特上獲得超過(guò) 200 萬(wàn)次的播放,2019 年 5 月特朗普在推特上轉(zhuǎn)發(fā)并嘲諷的美國(guó)眾議長(zhǎng)佩洛西說(shuō)話(huà)結(jié)巴的視頻引發(fā)大量關(guān)注,最終都被證明是由深度偽造技術(shù)生成的偽視頻。
使用男演員圖像偽造的奧巴馬發(fā)表講話(huà)視頻,圖片來(lái)自于網(wǎng)絡(luò)
這些虛假信息除了將直接影響個(gè)人信譽(yù)外,甚至還可能引發(fā)“蝴蝶效應(yīng)”導(dǎo)致整個(gè)社會(huì)秩序的紊亂。
而 2018 年在國(guó)內(nèi)出現(xiàn)的換臉 App「ZAO」,在經(jīng)歷上線(xiàn)三天的火爆后,立馬被下架封殺。并且國(guó)內(nèi)在去年年底相繼發(fā)布《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》、《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》等法規(guī),明確不得利用深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等新技術(shù)新應(yīng)用從事法律、行政法規(guī)禁止的活動(dòng)。
曾紅極一時(shí)的換臉 App ZAO,圖片來(lái)源于網(wǎng)絡(luò)
除了這些衍生的社會(huì)影響外,Deepfake 也給人臉識(shí)別這項(xiàng)技術(shù)本身帶來(lái)了一個(gè)無(wú)法逾越的挑戰(zhàn)。
2018 年,「Deepfake」這一概念的提出者 Sébastien Marcel 和 Pavel Korshunov 兩位科學(xué)家就表示根據(jù)目前人臉識(shí)別技術(shù)的發(fā)展水平,在相同模型下,同等訓(xùn)練時(shí)長(zhǎng)的人臉識(shí)別對(duì) Deepfake 視頻的識(shí)別錯(cuò)誤率高達(dá) 95%。也就是說(shuō),當(dāng)前已有的先進(jìn)人臉識(shí)別模型和檢測(cè)方法,在面對(duì) Deepfake 時(shí)基本束手無(wú)措。
兩位科學(xué)家指出,換臉技術(shù)的不斷發(fā)展的同時(shí),Deepfake 的造假能力也在隨之提升,兩者會(huì)在很長(zhǎng)的時(shí)間里「并駕齊驅(qū)」。
也就是說(shuō),將人臉識(shí)別技術(shù)比喻為蜘蛛俠的話(huà),那么 Deepfake 就是附在他身上的「毒液」。它會(huì)隨著本體力量的增強(qiáng)而不斷增強(qiáng),若用于正道它會(huì)成為不小的助力;但如果心存邪念,它強(qiáng)大的力量可能連本體都會(huì)吞噬。
所以在最后,小探想要提醒大家。Deepfake 對(duì)于人臉識(shí)別技術(shù)的發(fā)展是一種鞭策的力量,并且可以讓一些「科技宅」很好的測(cè)試自己電腦 GPU 的算力,但是如果使用這項(xiàng)技術(shù)從事違法犯罪,那可就是本末倒置了。
參考鏈接:
https://www.patreon.com/ctrl_shift_face
https://github.com/iperov/DeepFaceLab
https://www.bilibili.com/video/BV16x411R73Q?from=search&seid=3033760871383602659
總結(jié)
以上是生活随笔為你收集整理的Deepfake平民化,10美元加一台笔记本,人人都能“换脸”阿汤哥的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 东莞市景洪花园在哪里?
- 下一篇: scr指标原理和详解