當(dāng)前位置：首頁(yè) > 编程资源 > 综合教程 >内容正文

综合教程

Deepfake平民化，10美元加一台笔记本，人人都能“换脸”阿汤哥

發(fā)布時(shí)間：2023/11/23 综合教程 36 生活家

生活随笔收集整理的這篇文章主要介紹了 Deepfake平民化，10美元加一台笔记本，人人都能“换脸”阿汤哥小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

　　這段著名的視頻中比爾·哈德在不知不覺(jué)中變成湯姆·克魯斯，而且還是阿湯哥年輕時(shí)的樣子。

　　本文來(lái)自于微信公眾號(hào)硅谷洞察（ID：guigudiyixian），鈦媒體經(jīng)授權(quán)發(fā)布。

　　如果說(shuō)最近哪項(xiàng)技術(shù)在近段時(shí)間引發(fā)了美國(guó)全社會(huì)的反感，那毫無(wú)疑問(wèn)是人臉識(shí)別技術(shù)。

　　從去年開(kāi)始，美國(guó)就已經(jīng)開(kāi)始有禁止人臉識(shí)別的動(dòng)作了。去年 5 月，舊金山成為第一個(gè)禁止政府購(gòu)買(mǎi)和使用人臉識(shí)別技術(shù)的城；而今年受弗洛伊德事件影響，6 月 10 日，美國(guó)科技巨頭 IBM 宣布正式放棄人臉識(shí)別技術(shù)，緊接著第二天，亞馬遜表示停止對(duì)警方提供面部識(shí)別技術(shù)。

　　這背后除了種族歧視的問(wèn)題以外，還存在另一個(gè)比較嚴(yán)重的隱患。那就是人們的面部數(shù)據(jù)可能被用于“深度偽造”（Deepfake）。

　　曾經(jīng)，Deepfake 還是有一定門(mén)檻的。雖然網(wǎng)上有開(kāi)源的 Deepfake 的軟件和工具，但是要么硬件要求過(guò)高，要么就是「Fake」的不夠「Deep」。總之，想要制作出一個(gè)完美的 Deepfake 視頻需要專(zhuān)業(yè)人士大費(fèi)周章。

　　但是，讓人擔(dān)憂(yōu)的 Deepfake 如今已“平民化”。小探甚至發(fā)現(xiàn)了只需要 10 美元和一臺(tái)最基礎(chǔ)的筆記本就能進(jìn)行 Deepfake 的開(kāi)源工具包。只需要經(jīng)過(guò) 24 小時(shí)，一張滿(mǎn)臉橫肉的面容就能變成大帥哥「湯姆·克魯斯」。其造假程度說(shuō)是「偷天換日」也不為過(guò)。

　　想知道這背后的工作原理和操作方式嗎？那就繼續(xù)往下看吧~

　　只需要 24 小時(shí)，我就能變阿湯哥

　　某日，小探在B站上發(fā)現(xiàn)了一條名為「最高境界的換臉」的視頻。

　　視頻中一群「科技宅」在自己的實(shí)驗(yàn)室中進(jìn)行視頻拍攝，并運(yùn)用 AI 技術(shù)將他的臉換成著名演員湯姆·克魯斯的臉

　　換臉的過(guò)程總共需要五步「視頻轉(zhuǎn)圖片」、「提取臉部」、「訓(xùn)練模型」、「人臉替換」、「合成視頻」

　　首先，他們會(huì)為自己拍攝一段源視頻作為素材以供 AI 進(jìn)行學(xué)習(xí)。注意，在拍攝的過(guò)程中你的面部表情需要盡可能的多，這樣才能夠更好和需要替換的對(duì)象進(jìn)行融合。

　　拍攝源視頻時(shí)表情盡可能的豐富

　　然后利用視頻軟件對(duì)臉部表情進(jìn)行提取，這里用到的軟件是 AE 視頻剪輯。在視頻中人進(jìn)行運(yùn)動(dòng)的時(shí)候，對(duì)其臉部的輪廓和細(xì)節(jié)進(jìn)行「摳圖」，并生成一張張不同角度和表情的圖片。

　　讀取動(dòng)態(tài)面部數(shù)據(jù)

　　在圖片提取完成后，就可以開(kāi)始進(jìn)入「模型訓(xùn)練」部分了。

　　視頻中我們可以看到五個(gè)部分，其中最左邊的是最真實(shí)的照片，最中間的是需要替換的目標(biāo)人物的臉，最右邊模糊的部分是最終替換的結(jié)果預(yù)覽。

　　而中間兩條模糊的對(duì)比欄則是 AI 在進(jìn)行學(xué)習(xí)時(shí)不斷匹配最優(yōu)角度的過(guò)程對(duì)比。

　　導(dǎo)入人臉數(shù)據(jù)由 AI 進(jìn)行訓(xùn)練

　　在不停的學(xué)習(xí)過(guò)程中，AI 生成的圖片會(huì)和實(shí)際拍攝的圖片越來(lái)越接近，而最終學(xué)習(xí)的結(jié)果越真實(shí)則代表著最終的「換臉」真實(shí)度會(huì)越高。同時(shí)這也需要更久的時(shí)間。

　　AI 生成的面部數(shù)據(jù)會(huì)逐漸接近真實(shí)的人臉

　　而最終經(jīng)過(guò)一天的不間斷學(xué)習(xí)，他們成功的將自己的臉更換成了湯姆克魯斯的臉。

　　「湯姆·克魯斯」來(lái)啦

　　雖然在視頻中我們可以看到，「湯姆·克魯斯」的臉在某些時(shí)候會(huì)因?yàn)闆](méi)有匹配好而產(chǎn)生扭曲，這也是因?yàn)?AI 只學(xué)習(xí)了一天的原因。但是在正常的視角下還是非常逼真的。

　　雖然視頻并沒(méi)有寫(xiě)明這幫「科技宅」使用的是哪種 Deepfake 工具。但是小探在搜索過(guò)程中發(fā)現(xiàn)了一款名叫「DeepFaceLab」的開(kāi)源工具，這是由一個(gè)名叫「ctrl shift face」的公司發(fā)布的開(kāi)源 Deepfake 工具。

　　Ctrl shift face 官網(wǎng)

　　而那段著名的 Deepfake 視頻就是采用「DeepFaceLab」制作的。這段著名的視頻中比爾·哈德在不知不覺(jué)中變成湯姆·克魯斯，而且還是阿湯哥年輕時(shí)的樣子。

　　你看得出來(lái)他們?cè)谝凰查g換臉了嗎？

　　目前這款工具包已經(jīng)在 GitHub 上獲得了五百多星，并且它支持最低 2G 顯存的 64 位像素學(xué)習(xí)。也就是說(shuō)，你并不需要太多的算力就能夠在自己的電腦上進(jìn)行 AI 人臉學(xué)習(xí)。

　　DeepFaceLab 能在 2G 顯存 64 位像素下進(jìn)行 AI 換臉

　　DeepFaceLab 唯一的安裝要求就是對(duì)應(yīng)版本的顯卡驅(qū)動(dòng)，甚至不需要 CUDA 和 CuDNN。并且該軟件還有中文官網(wǎng)以及詳細(xì)的中文安裝說(shuō)明和教程，同時(shí)還自帶許多人臉圖片數(shù)據(jù)。

　　根據(jù)其教程顯示，雖然沒(méi)有可視化的操作界面，但是其操作流程還算簡(jiǎn)單易懂。完全沒(méi)有代碼基礎(chǔ)的小白只要認(rèn)真隨著操作步驟操作就能很快速的上手。

　　Ctrl shift face 官網(wǎng)提供了三檔氪金服務(wù)

　　并且只需要最高 10 美元/月，就能夠使用暢享其所有的換臉數(shù)據(jù)庫(kù)，這可真的算是良心價(jià)了。

　　這里值得注意的是，雖然這款工具包對(duì)于算力的基本要求非常低，但前面我們也提到過(guò)，越高的顯存和越長(zhǎng)的 AI 學(xué)習(xí)時(shí)間才是高質(zhì)量 Deepfake 視頻的保障。所以，如果需要達(dá)到上面那種一瞬間換臉的程度，恐怕需要你電腦中昂貴的 GPU 長(zhǎng)時(shí)間的運(yùn)轉(zhuǎn)才能做到。

　　Deepfake 只是娛樂(lè)，千萬(wàn)不要觸犯法律

　　如今，Deepfake 的工具和開(kāi)源包非常的多，許多極客和計(jì)算機(jī)愛(ài)好者都喜歡使用不同的軟件和工具制作自己的 Deepfake 視頻或音頻。

　　但是千萬(wàn)別忘了，Deepfake 這個(gè)專(zhuān)有名詞天生就帶有欺騙性質(zhì)，如果濫用會(huì)對(duì)個(gè)人隱私、媒體公信力、司法裁決等多方面帶來(lái)困擾。

　　比如之前硅谷洞察報(bào)道過(guò)的，2018 年 4 月，美國(guó)前總統(tǒng)奧巴馬說(shuō)“特朗普是個(gè)徹頭徹尾的笨蛋”的視頻，在推特上獲得超過(guò) 200 萬(wàn)次的播放，2019 年 5 月特朗普在推特上轉(zhuǎn)發(fā)并嘲諷的美國(guó)眾議長(zhǎng)佩洛西說(shuō)話(huà)結(jié)巴的視頻引發(fā)大量關(guān)注，最終都被證明是由深度偽造技術(shù)生成的偽視頻。

　　使用男演員圖像偽造的奧巴馬發(fā)表講話(huà)視頻，圖片來(lái)自于網(wǎng)絡(luò)

　　這些虛假信息除了將直接影響個(gè)人信譽(yù)外，甚至還可能引發(fā)“蝴蝶效應(yīng)”導(dǎo)致整個(gè)社會(huì)秩序的紊亂。

　　而 2018 年在國(guó)內(nèi)出現(xiàn)的換臉 App「ZAO」，在經(jīng)歷上線(xiàn)三天的火爆后，立馬被下架封殺。并且國(guó)內(nèi)在去年年底相繼發(fā)布《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》、《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》等法規(guī)，明確不得利用深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等新技術(shù)新應(yīng)用從事法律、行政法規(guī)禁止的活動(dòng)。

　　曾紅極一時(shí)的換臉 App ZAO，圖片來(lái)源于網(wǎng)絡(luò)

　　除了這些衍生的社會(huì)影響外，Deepfake 也給人臉識(shí)別這項(xiàng)技術(shù)本身帶來(lái)了一個(gè)無(wú)法逾越的挑戰(zhàn)。

　　2018 年，「Deepfake」這一概念的提出者 Sébastien Marcel 和 Pavel Korshunov 兩位科學(xué)家就表示根據(jù)目前人臉識(shí)別技術(shù)的發(fā)展水平，在相同模型下，同等訓(xùn)練時(shí)長(zhǎng)的人臉識(shí)別對(duì) Deepfake 視頻的識(shí)別錯(cuò)誤率高達(dá) 95%。也就是說(shuō)，當(dāng)前已有的先進(jìn)人臉識(shí)別模型和檢測(cè)方法，在面對(duì) Deepfake 時(shí)基本束手無(wú)措。

　　兩位科學(xué)家指出，換臉技術(shù)的不斷發(fā)展的同時(shí)，Deepfake 的造假能力也在隨之提升，兩者會(huì)在很長(zhǎng)的時(shí)間里「并駕齊驅(qū)」。

　　也就是說(shuō)，將人臉識(shí)別技術(shù)比喻為蜘蛛俠的話(huà)，那么 Deepfake 就是附在他身上的「毒液」。它會(huì)隨著本體力量的增強(qiáng)而不斷增強(qiáng)，若用于正道它會(huì)成為不小的助力；但如果心存邪念，它強(qiáng)大的力量可能連本體都會(huì)吞噬。

　　所以在最后，小探想要提醒大家。Deepfake 對(duì)于人臉識(shí)別技術(shù)的發(fā)展是一種鞭策的力量，并且可以讓一些「科技宅」很好的測(cè)試自己電腦 GPU 的算力，但是如果使用這項(xiàng)技術(shù)從事違法犯罪，那可就是本末倒置了。

　　參考鏈接：

　　https://www.patreon.com/ctrl_shift_face

　　https://github.com/iperov/DeepFaceLab

　　https://www.bilibili.com/video/BV16x411R73Q?from=search&seid=3033760871383602659

總結(jié)

以上是生活随笔為你收集整理的Deepfake平民化，10美元加一台笔记本，人人都能“换脸”阿汤哥的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。