DeepFaceLab 新手入门教程
DeepFaceLab新手0起點(diǎn)入門圖文教程詳解
工欲善其事必先利其器,想要玩轉(zhuǎn)換臉,硬件,軟件,系統(tǒng)必須跟上!先從準(zhǔn)備工作說起。
🔺硬件
🔺軟件
🔺系統(tǒng)
🔺驅(qū)動(dòng)
硬件
換臉軟件出來也好幾年了,但是目前依舊對硬件依賴比較大。想要在自己電腦上跑換臉軟件就必須要一張顯卡,想要輕松點(diǎn),就必須要一張好顯卡(今年搞一張好顯卡不容易)。 顯卡主要分N卡(英偉達(dá))和A卡(AMD),一般來說是推薦N卡,N卡的支持會(huì)更好,使用場景更廣泛。 在DeepFaceLab的歷史版本中,曾經(jīng)有支持A卡的opencl版本,中途放棄了對A卡的支持,2021終于有了支持A卡的DirectX12版本。總的來說,買一張中上水平的N卡,肯定可以玩,如果是A卡就需要確認(rèn)支持DirectX12。
常見的N卡有10系列,20系列,30系列。還有麗臺(tái),泰坦,特斯拉,安倍。幾乎所有顯存大于2G的N卡都支持。 rtx3060 12G 因?yàn)轱@存大,對于跑模型有優(yōu)勢,性價(jià)比較高。所有60結(jié)尾的卡,都是性價(jià)比比較高,功耗比較低,顯存還可以。而50結(jié)尾的卡么….。如果你只在乎性能,那么可以上目前最強(qiáng)的游戲卡RTX3090,指導(dǎo)價(jià)一萬出頭,市場價(jià)可能兩萬多。除了3090,上一代的2080ti,和上上代的1080ti 也是一個(gè)不錯(cuò)的選擇,這兩張卡顯存比較給力,速度也比較快,提取頭像比3000系列還有優(yōu)勢。
除了顯卡之外,其實(shí)CPU最好也跟上。顯卡特別快,處理器跟不上,整體速度就會(huì)下來。顯卡和cpu的比較強(qiáng)的情況下,電源供電一定要有保障。電源不夠的話,燒卡不至于,但是可能會(huì)重啟,不穩(wěn)定。
關(guān)于硬盤,使用普通HDD完全沒有問題,用SSD的話在某些情況下會(huì)更好。比如加載,寫入的時(shí)候,還有大量素材圖片拷貝,粘貼,刪除的時(shí)候。
總而言之,想要玩基于深度學(xué)習(xí)的軟件,都需要中高端配置。其中顯卡和顯存是核心指標(biāo)。
軟件
軟件方面,DeepFaceLab相比之前的一些換臉軟件,最大的優(yōu)勢就是“集成” 。如果你使用DeepFaceLab,千萬不要去裝什么CUDA,CUDN,除非你知道自己在干什么。
軟件方面主要是注意版本的問題。
DeepFaceLab最早的版本可以追溯到2018年,目前比較推薦的是2020年8月份的版本,以及2021年8月份的版本。選擇版本需要注意幾個(gè)點(diǎn)。
■A卡還是N卡? A卡只能用2019年opencl版和2021的DirectX12版。
■RTX2080ti:針對2080ti以及以下版本
■RTX3000:針對3000系列顯卡
■DirectX12:針對支持DirectX12
需要注意的是,2080ti版肯定不能用在30系列顯卡上,而rtx3000可以支持老顯卡。DirectX12并不針對A卡或者N卡,而是針對支持DirectX12的顯卡設(shè)備。言下之意不支持DirectX12的顯卡,不管你姓黃還是姓蘇,都沒用。大部分新卡都支持!
軟件下載:
百度網(wǎng)盤:https://pan.baidu.com/s/1h4ybBhCT7Qh9tN9og9eYUQ?提取碼:fmhe?
阿里網(wǎng)盤:https://www.aliyundrive.com/s/9jbRXkZjimZ
系統(tǒng)
從大的的范疇來說,除了MacOS支持不好之外,window和linux全部可以使用。
Window方面,主要是支持win10和win7。但是隨著30系列新顯卡的推出,win7不推薦了。使用30系列顯卡的朋友需確保三件事情:
■操作系統(tǒng)版本W(wǎng)in10 20h2+
■驅(qū)動(dòng)去官方下載更新到最新
■啟用操作系統(tǒng)的GPU加速計(jì)劃
驅(qū)動(dòng)不夠新,提取這一步就過不了。
系統(tǒng)不夠新,沒有GPU加速選項(xiàng)
沒有GPU加速選項(xiàng),可能導(dǎo)致訓(xùn)練卡死。
新版驅(qū)動(dòng)似乎對GPU加速?zèng)]有要求,但是保險(xiǎn)起見,還是先把上面幾點(diǎn)做好。
最后提示一下,XP和32位系統(tǒng)請自覺回避。
驅(qū)動(dòng)
DeepFaceLab唯一的依賴就是驅(qū)動(dòng)。驅(qū)動(dòng)最大的問題就是不夠新,因?yàn)镈FL一直在更新,往往都是針對最新的版本。所以驅(qū)動(dòng)一定要跟上。用魯大師和驅(qū)動(dòng)精靈的需要注意一下,這些第三方軟件安裝的驅(qū)動(dòng)有可能不是最新的,會(huì)出現(xiàn)問題,推薦用官方的Geforce Experience更新升級(jí)驅(qū)動(dòng)。
講過了安裝DeepFaceLab所需要的軟硬件環(huán)境。正常來說就可以進(jìn)入安裝,實(shí)操的階段了。但是,我覺得安裝之前還是要先結(jié)合workspace來講一些概念,這樣用起來會(huì)更加順暢。workspace這個(gè)是軟件自帶的目錄,安裝完之后就已經(jīng)存在了。
工作目錄里都有啥?
workspace主要包含如下文件:
■data_dst(目標(biāo)素材)
■data_src (源素材)
■model (模型)
■data_dst.mp4 (目標(biāo)視頻)
■data_src.mp4 (源視頻)
DeepFaceLab為了簡化操作和規(guī)范素材名稱,采用慣例的方式。就是把所有素材統(tǒng)一放workspace里面,而且統(tǒng)一命名。所有文件夾,文件名都不能亂改。
什么是視頻換臉?
所謂視頻換臉就是把一個(gè)人的臉換到另一個(gè)人的腦袋上并保持表情神態(tài)的同步。比如將張三的臉換到李四身上。源素材取自張三,我們需要換臉的對象是李四。張三提供臉,李四提供身體,最后的結(jié)果是李四看起來變成了張三。而為了實(shí)現(xiàn)換臉這個(gè)目標(biāo)我們需要收集兩個(gè)人的視頻。
張三的視頻叫data_src.mp4,我們稱為源視頻,
李四的視頻叫data_dst.mp4,我們稱為目標(biāo)視頻。
有了視頻之后我們需要將視頻里的人臉提取出來,讓AI去分析學(xué)習(xí)人臉特征。
data_dst 和data_src 文件夾里放的就是目標(biāo)視頻和源視頻中提取出來的圖片和人臉。
圖片是指把視頻轉(zhuǎn)換成一張一張的圖片,人臉是指從圖片中摳出人臉部分并擺端正,最后放在aligned文件夾里面。在摳圖的同時(shí)還會(huì)用一些點(diǎn)標(biāo)出人臉的輪廓放在debug文件里面。
模型是什么?
DeepFaceLab換臉看是有很多步驟,其實(shí)就兩大步驟,一個(gè)是訓(xùn)練模型,一個(gè)是應(yīng)用模型。model文件夾里面放的就是模型文件,是換臉軟件的核心所在。
那么模型是個(gè)啥東西??有人可能會(huì)理解為模板,這種比喻并不精確,但是有那么一點(diǎn)意思。模板只能簡單的復(fù)刻,但是模型可以自動(dòng)匹配各種表情,要智能一些。
其實(shí)在深度學(xué)習(xí)里面模型這個(gè)概念無處不在,我們常用的基于深度學(xué)的一些應(yīng)用,比如美顏,貼圖,翻譯,語音識(shí)別,語音合成,人臉識(shí)別,去碼,脫衣,背后都有模型。
模型就像是一個(gè)學(xué)富五車或者特別擅長某種技能的人。所謂訓(xùn)練模型,就像是訓(xùn)練一個(gè)小孩子,讓他學(xué)習(xí)增加某一方的能力。
那些“繪畫”能力特別強(qiáng)的機(jī)器視覺模型,我們可以把它比喻成一個(gè)畫師。沒學(xué)習(xí)之前,他什么不會(huì)。你給他看了很多法外狂徒的視頻,他不斷臨摹之后,就掌握了畫出張三的能力。因?yàn)樗拇竽X就是為繪畫而生,所以他閉著眼睛也能畫出張三,更厲害的是,給他一張李四的臉?biāo)材墚嫵龊屠钏谋砬橐粯拥膹埲.?dāng)然,要變得這么強(qiáng),除了天賦之外,學(xué)習(xí)時(shí)間肯定少不了,而且得多看高清視頻,記住各種細(xì)節(jié)才可以。光記住還不行,還得有一定的聯(lián)想能力。
訓(xùn)練模型也常常被稱為“煉丹”,而模型就是仙丹。要搞個(gè)仙丹肯定不容易是吧。比如,太上老君練齊天大圣,練了那么多太天,一不小心還是沒練成。練好一顆丹,需要很多條件。
■首先,得有好的原材料(人臉?biāo)夭?#xff09;。
■其次,得有好的丹爐(電腦硬件顯卡和CPU)
■再次,得掌握好火候(參數(shù))
■最后,八八六十四一天不能少。(時(shí)間)
初學(xué)者,肯定要反復(fù)嘗試,才能找到最好的方式。
不同仙丹,有不同的效果。有些包治百病(通用模型),有些只有一個(gè)功效比如長生不老(專用模型)
說回畫師,有的畫師稍作學(xué)習(xí)什么都能畫(通用模型),有的畫師只會(huì)畫一個(gè)人(專用模型)
名字不能隨便改
如果不懂workspace的命名規(guī)則,可能會(huì)出現(xiàn)一些問題。一定記住不要少文件,也不要改文件名。比如提取src的時(shí)候一定要有data_src.mp4這個(gè)視頻,其他名字沒用。合成視頻的時(shí)候一定要有dat_dst.mp4這個(gè)視頻,沒有那就直接報(bào)錯(cuò)。比如你自己的視頻原先叫“我很帥.mp4” ,你想換臉,就必須把這句話改掉,改成data_src.mp4 。不管多帥都得按規(guī)矩來。
如何用圖片來換臉?
雖然一直建議用視頻素材來換臉,但是依舊有很多人問到能不能用圖片換臉。能,是肯定能,但是你不要希望在DFL上用一張圖片來換出好的效果。用圖片換臉,只需要將完整的圖片直接放在data_src文件里面,然后用提取腳本提取人臉即可,其他操作和視頻換臉一模一樣。
概念這個(gè)東西吧,理解了很有用,不理解好像也沒啥用。不理解也沒關(guān)系,只要記住workspace這個(gè)文件夾,所有相關(guān)的素材都放在里面。下一篇,我們就“不講道理”了,直接一步一步來操作。
對于剛?cè)腴T的朋友來說,你給他直接上心法肯定沒啥有,最直接的還是教招式。實(shí)操,才有感覺嘛!DeepFaceLab雖然版本一直在升級(jí),但是整體步驟和執(zhí)行邏輯并沒有太大變化。所以老教程現(xiàn)在一樣能用了。但是為了教程的完整性,我就全部重寫一遍,稍作改進(jìn)。
安裝軟件
安裝過程其實(shí)非常簡單。一般發(fā)布的軟件包都是.exe結(jié)尾,本質(zhì)上其實(shí)就是一個(gè)用7z壓縮的壓縮包而已。大家可以通過我分享的鏈接,找到適合自己顯卡的版本,然后解壓安裝即可!
安裝的時(shí)候需要注意幾個(gè)點(diǎn)。
第一:殺毒軟件可能會(huì)有木馬警報(bào),添加信任就好。殺毒軟件可能會(huì)無警報(bào)刪文件,導(dǎo)致執(zhí)行的時(shí)候出現(xiàn)未知錯(cuò)誤。這種情況可以先退殺毒軟件,安裝完了就不受影響。
第二:安裝的時(shí)候記得選好路徑
路徑并沒有硬性要求,默認(rèn)是解壓到安裝包所在路徑。建議放在C盤外的其他盤的根目錄。文件路徑不要有中文,避免各種莫名其妙的問題,如上圖,最好放到磁盤根目錄,方便查找使用。
第三:輸入密碼
我發(fā)布的文件如果有密碼,就都是395267954。不管哪個(gè)版本直接輸入就好了。
解壓后就是如上圖的樣子。里面會(huì)有_internal和workplace文件夾。前者放的是源代碼和軟件相關(guān)的內(nèi)容,后者是工作目錄。除此之外還有一堆.bat結(jié)尾的文件。可以把這些稱為腳本或者批處理文件。里面是一行行的DOS命令。
批處理文件打開方式和EXE一模一樣,直接雙擊打開!每一個(gè)批處理文件都干一件事情,我們要做的就是按一定的順序點(diǎn)擊這些文件,就能完成換臉。是不是挺簡單?
執(zhí)行步驟
DFL換臉的思路是,想將視頻轉(zhuǎn)換成圖,從圖片中提取人臉,從人臉中學(xué)習(xí)特征。然后應(yīng)用模型,先對圖片進(jìn)行換臉,然后把圖片合成視頻,同時(shí)帶上原視頻的音軌。
具體來說可以分為如下幾步:
1.src視頻分解圖像?
2.dst視頻分解圖像
3.src提取面部?
4.dst提取面部
5.訓(xùn)練模型?
6.應(yīng)用模型?
7.合成視頻
批處理文件步驟依次如下:
2) src 視頻提取圖像extract images fromvideo data_src.bat
3) dst 視頻提取圖像(全幀率)extract imagesfrom video data_dst FULL FPS.bat
4) src 自動(dòng)提取面部data_src facesetextract.bat
5) dst 自動(dòng)提取面部data_dst facesetextract.bat
6) 訓(xùn)練SAEHD train SAEHD.bat
7) 應(yīng)用SAEHD merge SAEHD.bat
8) 合成 MP4 視頻merged to mp4.bat
其實(shí)看著很復(fù)雜,但真正的操作就幾個(gè)步驟,下面我就按照順序帶著大家操作一邊軟件,這里只講SEAHD模型的操作,Q96和AMP大同小異,模型參數(shù)這次也不做過多講解,后期的教程會(huì)單獨(dú)寫一篇關(guān)于參數(shù)的介紹。關(guān)于操作,這里做一個(gè)重點(diǎn)提示:遇事不決按回車!
Step1:src視頻 分解圖像
雙擊批處理文件?2) src 視頻提取圖像 extract?images from video data_src.bat
跳出黑色窗口,默認(rèn)回車,然后輸入jpg回車,就會(huì)自動(dòng)開始將視頻分解為圖片。
確認(rèn)幀率:視頻有一個(gè)指標(biāo)叫幀率,常見有24,30,60等,代表一秒鐘有幾張。第一個(gè)參數(shù)輸入10指的是一秒鐘只取10張;不輸入直接回車,默認(rèn)幀率是30就取30張。因?yàn)楹芏嘤耙晞‘嬅嫦鄬潭?#xff0c;沒必要全部取,否則后面會(huì)浪費(fèi)大量提取時(shí)間,而且模型訓(xùn)練壓力也會(huì)加大。這里根據(jù)自己的需求選擇,幀數(shù)越高,畫面越流暢,文件體積就越大。
輸出圖片格式: ?圖片格式,主要是jpg和png。png是無損格式,但是JPG能在保證畫質(zhì)的情況下減少巨量的空間。所以如果不是要求特別變態(tài),一般都用jpg。這樣可以減少空間,節(jié)省時(shí)間。
正常情況下,這個(gè)步驟執(zhí)行非常快,出現(xiàn)“搞定/done” 的字樣就是執(zhí)行完成了。完成后,workplace/data_src下面就會(huì)出現(xiàn)很多圖片,這就是從視頻里分解出來的圖片。文件名一般為0000x.jpg,其實(shí)這里面命名可以隨意,沒有強(qiáng)制要求。這里還有一個(gè)aligned的文件夾,是為后面步驟準(zhǔn)備的。
Step2:dst視頻 分解圖像
雙擊批處理文件?3) dst 視頻提取圖像(全幀率)extract images from video data_dst FULL FPS.bat
和上面的步驟類似,這次處理的是dst視頻。因?yàn)閐st必須一幀不落,所以沒有FPS選項(xiàng),只有圖片格式這一個(gè)選項(xiàng)。
處理完后的圖片保存在workspace/data_dst里面。
Step3:src 提取面部
雙擊批處理文件?4) src 自動(dòng)提取面部 data_src?faceset extract.bat
這一步的作用是提取src素材圖片中的人臉。這里有六個(gè)參數(shù),一般只需一路回車即可。第一次使用需要緩存GPU內(nèi)核,需要稍微等一等。開始提取后底部有顯示進(jìn)度,當(dāng)進(jìn)度到100%,會(huì)顯示圖片數(shù)量和提取到的人臉數(shù)量,并出現(xiàn)“搞定!!!” 就證明已經(jīng)出來成功并且處理完成。
處理完成后,頭像保存在data_src/aligned下面。
不少人在這個(gè)環(huán)節(jié)會(huì)遇到問題。
常見問題是:
驅(qū)動(dòng)不夠新,去官網(wǎng)下載更新到最新版本即可。
軟件不夠新,加QQ 395267954獲取新版
顯卡軟件不匹配,N卡分3系和非3系版本,3系顯卡(比如RTX3080,RTX3090等)用DFL_RTX3000_series.exe這個(gè)版本,非3系(如RTX2060,GTX1060等)用DFL_UPTO_RTX2080Ti.exe這個(gè)版本。A卡和老顯卡用DFL_DirectX12.exe版本。
提取完之后,如果src素材比較復(fù)雜,比如側(cè)臉多,仰頭低頭等復(fù)雜的角度,視頻中有多個(gè)人臉等,自動(dòng)切臉就會(huì)出現(xiàn)切錯(cuò)的情況。這個(gè)時(shí)候就需要做一些篩選。這個(gè)篩選可以寫一篇很長的文章。這里簡要說一下。主要是把一些不需要的素材刪除:
■很模糊的可以直接刪除
■不是目標(biāo)人物的可以直接刪除
■圖片殘缺的刪除
■臉部有遮擋的刪除
■臉部光照差異特別大的刪除
.....
Step4:dst 提取面部
雙擊批處理文件?5) dst 自動(dòng)提取面部 data_dst?faceset extract.bat
這一步的作用是提取dst素材圖片中的人臉。和上一步非常類似,這里就是少了一個(gè)“保存調(diào)試圖片”的參數(shù)。其實(shí)也不是少了,而是默認(rèn)就執(zhí)行了。
提取的頭像保存在data_dst/aligned的文件夾里。
提取完之后也要對素材進(jìn)行一個(gè)篩選。
把不是目標(biāo)人物的素材刪掉,把頭像旋轉(zhuǎn)的圖片刪掉。一般來說文件名后綴_1的都可以刪掉。dst的刪除核心原則是要換的人臉留下,不要換的統(tǒng)統(tǒng)刪掉。
這一步默認(rèn)就生成了debug的文件。
打開aligned_debug文件及里的其中一張圖片,可以看到人臉上有三種顏色的線框。
紅色就是頭像截取的區(qū)域,藍(lán)色是面部區(qū)域,綠色是人臉輪廓,以及五官定位的點(diǎn)。其實(shí)就是人臉的landmark。通過debug你可以直觀的看到人臉識(shí)別算法識(shí)別了哪些區(qū)域,有沒有識(shí)別正確。如果這個(gè)區(qū)域不在人臉上或者出現(xiàn)了亂七八糟的交織線,就說明這個(gè)臉部提取錯(cuò)誤,這個(gè)時(shí)候就需要手動(dòng)提取了。新手暫時(shí)不講如何手動(dòng)提取,后期的教程再做介紹。
Step5:訓(xùn)練模型
這里簡單介紹下目前的三種模型:一個(gè)是Q96適合低配電腦玩的輕量模型,優(yōu)點(diǎn)是對顯卡要求不高,比如2G顯存的老卡就可以玩。缺點(diǎn)是像素太低,沒有高級(jí)參數(shù)選項(xiàng),合成效果差,可玩性低。
另一種是AMP模型,這種模型剛出來不久,對素材要求高,訓(xùn)練出來效果逼真,但新手操作復(fù)雜,不建議新手玩這個(gè)模型。
最后一種就是今天我們要介紹的SAEHD模型,這個(gè)模型也是使用范圍最廣,運(yùn)用最成熟的一種模型。可以靈活調(diào)整各種模型的參數(shù),以達(dá)到最佳的訓(xùn)練效果。那么我們開始講SAEHD模型的訓(xùn)練。
雙擊批處理文件?6) 訓(xùn)練 SAEHD train?SAEHD.bat
這一步是訓(xùn)練模型,所有步驟中最重要,最難,也是最耗時(shí)間的部分。
SAEHD模型推薦顯卡顯存在4G+,這里就以分辨率為128,其他參數(shù)默認(rèn)的模型參數(shù)來演示,建議新手也跟我使用一樣的參數(shù)來練手,后期我會(huì)單獨(dú)做一個(gè)參數(shù)講解的教程。
如下圖,第一次運(yùn)行會(huì)提示創(chuàng)建新模型,這里隨便輸入模型名稱,比如我們這里輸入128 你也可以默認(rèn)回車,回車默認(rèn)創(chuàng)建名為 new 的模型文件名。一路回車即可!
所有參數(shù)設(shè)置完成后,程序就會(huì)自動(dòng)加載素材,并顯示模型的參數(shù),如下圖。
之后底部會(huì)有一行跳動(dòng)的數(shù)字,然后會(huì)跳出一個(gè)預(yù)覽窗口。如下圖
先來說說底部的數(shù)字,總共五列,分別代表:模型保存時(shí)間,迭代次數(shù),單次迭代時(shí)間,src損失,dst損失。理論上說,迭代次數(shù)是越多越好,損失是越低越好,零就是無損了嘛~不過,不可能達(dá)到,一般推薦數(shù)值在0.1以下!
這里補(bǔ)充一點(diǎn),win10新增了顯卡加速功能,開啟能大大提高訓(xùn)練速度,具體開啟方法為:設(shè)置-系統(tǒng)-顯示-圖形設(shè)置-硬件GPU加速計(jì)劃-打開
下面來說說預(yù)覽窗口
預(yù)覽窗口包含操作提示、loss曲線,人臉區(qū)域。人臉區(qū)域總共五列。第一列是src,第三列是dst。第二,四,五列為算法生成列,剛開始是純色,啥頭像都沒有。隨著訓(xùn)練的進(jìn)行,會(huì)慢慢出現(xiàn)輪廓,鼻子,眼睛,然后慢慢變清晰。
訓(xùn)練的過程就是等待這幾列變清晰的過程,最后一列就是換臉后的效果。
這一個(gè)步驟并不會(huì)自動(dòng)結(jié)束,需要自己判斷,然后手動(dòng)結(jié)束。可以通過損失值和預(yù)覽圖來進(jìn)行判斷。一般來說損失值(loss)值到了0.1左右就差不多了(推薦0.1以下)。但是素材質(zhì)量和數(shù)量不一樣,會(huì)影響這個(gè)指標(biāo)的變化速度。比如素材特別少,這個(gè)值降的特別快,特別低。圖片不是很清晰,這個(gè)值也降的特別快,特別低。反過來,圖片質(zhì)量高,數(shù)量多,這個(gè)就很難降低。但是這樣情況下訓(xùn)練出來的模型更好。
相比數(shù)字而已,通過預(yù)覽圖來判斷就更加直觀了,如上圖。只要觀察第二列是否無限接近第一列,第四列是否無限接近第三列。第五列的表情是否無限接近第四列。所有列的圖片是否都足夠清晰。如果是的,且損失值在0.1左右 ,那么就可以按回車或者直接關(guān)閉窗口,進(jìn)入下一步。
正常情況下模型會(huì)過幾十分鐘保存一次,也可以手動(dòng)按S直接保存。關(guān)閉后,可以重新點(diǎn)擊批處理文件繼續(xù)訓(xùn)練,不用擔(dān)心丟失進(jìn)度。當(dāng)然,要防止意外關(guān)機(jī)和重啟,可能會(huì)損壞模型。
Step6:應(yīng)用模型
雙擊批處理文件?7) 應(yīng)用 SAEHD merge?SAEHD.bat
這個(gè)步驟要做的是將圖片進(jìn)行換臉。應(yīng)用SAEHD模型也很簡單。啟動(dòng)直接按回車選中或者輸入對應(yīng)的數(shù)字選中上一步已經(jīng)訓(xùn)練好的模型。然后軟件就會(huì)加載模型并顯示模型參數(shù)。
然后需要配置兩個(gè)參數(shù):
一個(gè)是是否啟用交互模式,直接回車,默認(rèn)啟用。
一個(gè)是線程數(shù)量,輸入小于等于8的數(shù)字,回車。注意,如果你核心特別多,默認(rèn)回車會(huì)報(bào)錯(cuò)的!
稍等一會(huì)兒會(huì)彈出幫助界面。
這個(gè)界面并沒有任何功能上的用處,只是顯示了這個(gè)環(huán)節(jié)可以使用的快捷鍵。每個(gè)快捷鍵旁邊都有中文注釋,可以看個(gè)大概,具體的參數(shù)含義在后期的教程會(huì)做詳細(xì)的介紹。
點(diǎn)擊這個(gè)界面,確保輸入法為英文,按下鍵盤上的Tab,就可以進(jìn)入合成預(yù)覽界面。
進(jìn)來后,默認(rèn)情況下都會(huì)有人皮面具的感覺,這是正常現(xiàn)象。因?yàn)槲覀儏?shù)還沒有調(diào)整!就這個(gè)素材來說,只要調(diào)整W/S,E/D 快捷鍵即可(W和S鍵是調(diào)節(jié)遮罩侵蝕的加減;E和D鍵是調(diào)節(jié)遮罩羽化效果的加減),新手建議先學(xué)習(xí)這幾個(gè)參數(shù),基本也夠用了。調(diào)整后的效果如下:
調(diào)整后可以試試查看預(yù)覽效果,覺得差不多可以了,按下快捷鍵shift+?(向后應(yīng)用到所有幀) 然后再按下shift+>(自動(dòng)合成) 就開始自動(dòng)合成了。也可以通過鍵盤上的< 和 >進(jìn)行手動(dòng)切換,查看前后幀的合成效果。
黑色窗口會(huì)顯示所有的合成參數(shù),這里的參數(shù)后期進(jìn)階教程也會(huì)詳細(xì)介紹。等到進(jìn)度到了100%完成之后,手動(dòng)關(guān)閉窗口即可。
此時(shí),在data_dst下面已經(jīng)多了兩個(gè)文件,一個(gè)是merged,一個(gè)是merged_mask
進(jìn)入merged可以看到很多圖,這些圖片中的人臉已經(jīng)完全換臉。
進(jìn)入merged_mask可以看到一些黑色的圖片,中間有一個(gè)白色的區(qū)域。這些文件是為了方便后期制作。我們單純使用DFL的不用太關(guān)心。
Step7:合成視頻
雙擊批處理文件?8) 合成 MP4 視頻 merged to mp4.bat
這個(gè)步驟是將已經(jīng)換好臉的圖片轉(zhuǎn)換成視頻,并且會(huì)自動(dòng)讀取源視頻的配置信息,包括幀率,音軌這些。這個(gè)環(huán)節(jié)只有一個(gè)輸出碼率的參數(shù),常規(guī)來說4就夠了,你也可以默認(rèn)16。
除了合成mp4之外,還可以根據(jù)自己的需求合成無損視頻,AVI ,MOV等格式,便于后期處理。
執(zhí)行完成后,workspace下面多了兩個(gè)文件,分別是result.mp4和 result_mask.mp4 。result.mp4就是我們需要的最終視頻,后者是遮罩視頻,供后期使用。
雙擊打開視頻,就可以看到最終效果了。因?yàn)槲抑皇菫榱俗鼋坛?#xff0c;所以模型沒有充分的訓(xùn)練,合成也只是隨便調(diào)了幾個(gè)參數(shù),并非最終的完美效果,你可以根據(jù)自己的需要,繼續(xù)訓(xùn)練模型以達(dá)到最好的效果。
步驟其實(shí)不難,細(xì)節(jié)很多。有些是可以直接照搬別人經(jīng)驗(yàn)的。有些需要自己不斷摸索。這并不是什么傻瓜軟件,要做出好的效果肯定是要花時(shí)間研究。就像即便送你PS,PR,你沒有一定的學(xué)習(xí)積累不可能做出酷炫的效果。但是我可以保證,市面上幾乎所有神乎其技的換臉視頻都是基于DFL,有些可能專門準(zhǔn)備了道具場景并使用了后期制作。新手不要急于求成,一步步來,先學(xué)習(xí)軟件操作,再慢慢摸索,不要上來就換,基礎(chǔ)的知識(shí)都不學(xué)習(xí),一步一個(gè)腳印,相信你也很快能做出完美的作品!
本圖文教程基于TONY教程修改和完善!
2021年10月2日
總結(jié)
以上是生活随笔為你收集整理的DeepFaceLab 新手入门教程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pcm压缩 java,Java C.Pc
- 下一篇: 【Linux内核】物理内存组织结构