交互式多模型_DeepFaceLab824版 Avatar换头模型尝鲜!
近期DeepFaceLab又出現(xiàn)了大規(guī)模高頻次的更新,這對(duì)于喜歡這樣軟件的人來說應(yīng)該是個(gè)好消息,我們又有新版本可以玩了。不過,近期更新的版本bug到多根本無法使用….. 新手或者需要穩(wěn)定煉丹的強(qiáng)烈推薦620版。
于那些勇于跳坑,樂于跳坑的朋友,我們可以跳起來。824版本新加入的阿凡達(dá)模型(Avatar)讓人充滿了好奇怪。雖然完全不知道怎么玩,但是還是跟著作者的提示,加上自己的摸索成功的把模型跑出來了。接下來就分享一下Avatar模型的使用過程。
閑話已經(jīng)說完,搞起搞起。玩這個(gè)版本你需要先做幾個(gè)準(zhǔn)備。
首先,當(dāng)然需要新版軟件,入群672316851可獲得。
其次,你需要準(zhǔn)備兩個(gè)視頻。SRC視頻的要求比較高
根據(jù)文檔介紹,這個(gè)src視頻是有一些要求的。最硬性的要求是視頻比例必須是1:1,這要求讓我有點(diǎn)方。。。。
還有時(shí)長為10-20分鐘,新聞報(bào)道類視頻,背景為靜態(tài),每一幀中只有一張臉。
原話如下:
place data_src.mp4 10-20min square resolution video of news reporter sitting at the table with static background,other faces should not appear in frames.
經(jīng)過研究光到達(dá)以上標(biāo)準(zhǔn)在訓(xùn)練模型的時(shí)候還是會(huì)報(bào)錯(cuò)。一臉懵逼后只能去看源代碼,發(fā)現(xiàn)代碼做了一個(gè)像素的限制,必須是1:1之外,還有….256×256,512×512,1024×1024等限制。
所以總結(jié)來說,你需要一個(gè)1:1 ,像素為512×512或者1024×1024的視頻。?我為了偷懶就直接用了托尼的視頻。
當(dāng)以上兩個(gè)條件具備后,我們就可以進(jìn)入實(shí)操環(huán)節(jié)了。
第一步:2) extract images from video data_src.bat? 分解src視頻,全幀率,和以前的版本一樣操作
第二步:3.2) extract images from video data_dst FULL FPS.bat 分解dst視頻,全幀率。和以前的版本一樣操作
第三步:4) data_src mark faces S3FD best GPU.bat
這一步的腳本是新增的,和之前提取臉圖的腳本名字也有些差別,提取后的效果也是不一樣的。提取出來的并非臉部,而是整個(gè)上半身(估計(jì)是為了換頭才會(huì)這樣)。
第四步:5) data_dst extract unaligned faces S3FD best GPU.bat
這一步的腳本也是新添加的,不過提取后直觀上來看并無差別,提取結(jié)果為dst的頭像。
第五步:6) train AVATAR.bat
這個(gè)步驟大有不同,因?yàn)樾录尤肓藘蓚€(gè)參數(shù):Avatar,Stage。??
Avatar::我選的是2 head ,從字面意思是換頭。
Stage:選默認(rèn) 1 ?, 這個(gè)其實(shí)指的是Avatar模型的兩個(gè)階段,1代表第一個(gè)階段,2代表第二個(gè)階段。只有完成了兩個(gè)階段才能繼續(xù)后面的步驟。
第一階段,官方建議配置要求為6G顯存,據(jù)說BS可以開到32 ,我默默的開了4…. 啟動(dòng)后預(yù)覽圖如上。這個(gè)布局一看就很高端,只是大頭像兩側(cè)的彩色馬賽克讓我充滿了恐懼。
二階段,6G顯卡,bs4 ,這個(gè)我欣然接受。想要進(jìn)入第二階段,你必須先把模型關(guān)了,重新啟動(dòng),兩秒內(nèi)回車,將Stage參數(shù)改成2.
兩個(gè)階段,改變預(yù)覽圖的區(qū)域是不一樣的。第一階段專門練左邊,第二階段練右邊。
第一階段訓(xùn)練5萬+迭代,第二階段訓(xùn)練到頭像足夠清晰,然后就可以進(jìn)入下一個(gè)步驟了。
第六步:7) convert AVATAR.bat
這一個(gè)環(huán)節(jié)又出現(xiàn)了一個(gè)新功能。叫交互式轉(zhuǎn)換(Use interactive converter)。默認(rèn)為啟動(dòng),直接回車后,沒有任何參數(shù)就開始跳出一個(gè)交互式轉(zhuǎn)換的幫助界面。
說實(shí)話,第一次看到這個(gè)我是蒙的。我現(xiàn)在也是蒙的,但是我知道怎么繼續(xù),直接按Tab鍵切換,按Enter鍵啟動(dòng)。
通過Enter可以暫停和繼續(xù),暫停的時(shí)候?yàn)?strong>頭像,繼續(xù)的時(shí)候?yàn)?strong>沙漏。
換結(jié)束后,可以看到data_dst/merged目錄里面出現(xiàn)了很多圖片。這些圖片和data_src/aligned有點(diǎn)像,但是整個(gè)背景已經(jīng)消失了。以往我們跑基礎(chǔ)模型(H128,DF,SAE)的時(shí)候,往往合成的圖片為data_dst.mp4的分解出來的圖片,但是avatar合成的卻不是。估計(jì)這個(gè)功能還沒有完善,只是預(yù)覽版而已。
第七步:8) converted to mp4.bat
這一部很簡單,直接開啟,輸入3回車,就合成了視頻。因?yàn)閙erged里面的圖像為方形,所以合成后的視頻也是方形的。最終效果有點(diǎn)一言難盡~歡迎大家入坑嘗試。
申明:圖文均由deepfakes 中文網(wǎng)原創(chuàng),轉(zhuǎn)發(fā)請(qǐng)注明出處,謝謝!
文 托尼是塔克
總結(jié)
以上是生活随笔為你收集整理的交互式多模型_DeepFaceLab824版 Avatar换头模型尝鲜!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 咸字开头的成语有哪些?
- 下一篇: python棋盘放米循环结构_Pytho