Real-Time-Voice-Cloning(github声音克隆项目演示)
github項(xiàng)目地址
①檢查pytorch的安裝
②ffmpeg是做什么的,在哪里下載?怎么使用?
原文地址
ffmpeg是一個(gè)處理多媒體信息的框架,有視頻采集、視頻格式轉(zhuǎn)換、視頻抓圖、給視頻加水印等功能
requirements.txt
python項(xiàng)目中必須包含一個(gè) requirements.txt 文件,用于記錄所有依賴包及其精確的版本號(hào),以便新環(huán)境部署
切換到項(xiàng)目目錄,生成requirement.txt文件并查看
③Download Pretrained Models(預(yù)訓(xùn)練模型)
預(yù)訓(xùn)練模型作為包含所有三個(gè)模型(揚(yáng)聲器編碼器、合成器、聲碼器)的檔案。
存檔帶有與存儲(chǔ)庫(kù)相同的目錄結(jié)構(gòu),您需要將其內(nèi)容與存儲(chǔ)庫(kù)的根目錄合并。
下完pretrained.zip并解壓,有三個(gè)文件夾encoder、synthesizer、vocoder。
把這三個(gè)文件夾中的內(nèi)容復(fù)制到項(xiàng)目中對(duì)應(yīng)的三個(gè)同名文件夾中
④Test Configuration(測(cè)試配置)
python demo_cli.py
發(fā)現(xiàn)No module named 'librosa'
也就是說(shuō)少了個(gè)librosa模塊(librosa是一個(gè)非常強(qiáng)大的python語(yǔ)音信號(hào)處理的第三方庫(kù))
安裝:pip install librosa
發(fā)現(xiàn)No module named 'torch'????????安裝:pip install torch
發(fā)現(xiàn)No module named 'unidecode'????????安裝:pip install unidecode
發(fā)現(xiàn)No module named 'inflect'????????安裝:pip install inflect
發(fā)現(xiàn)No module named 'sounddevice'????????安裝:pip install sounddevice
都安裝完了,顯示如下
?⑤Download Datasets(數(shù)據(jù)集)
對(duì)于單獨(dú)使用工具箱,建議下載 LibriSpeech/train-clean-100
train-clean-100.tar.gz下好解壓,有一個(gè)LibriSpeech文件夾
在Real-Time-Voice-Cloning-master這個(gè)項(xiàng)目里面,自己建一個(gè)名為datasets的文件夾,將LibriSpeech文件夾放進(jìn)去
終端切換到項(xiàng)目的當(dāng)前目錄
運(yùn)行:python demo_toolbox.py -d datasets
即可Launch the Toolbox(啟動(dòng)工具箱)
在這過(guò)程中
發(fā)現(xiàn)No module named 'umap'????????
安裝:pip install umap-learn -i https://mirrors.ustc.edu.cn/pypi/web/simple
發(fā)現(xiàn)"Unable to import 'webrtcvad'???????
安裝:pip install webrtcvad
工具箱顯示如下?
總結(jié)
以上是生活随笔為你收集整理的Real-Time-Voice-Cloning(github声音克隆项目演示)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 对待人生观的态度
- 下一篇: android banner指示器高度,