當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Real-Time-Voice-Cloning（github声音克隆项目演示）

發(fā)布時(shí)間：2024/3/13 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了 Real-Time-Voice-Cloning（github声音克隆项目演示）小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

github項(xiàng)目地址

①檢查pytorch的安裝

②ffmpeg是做什么的，在哪里下載？怎么使用？

原文地址

ffmpeg是一個(gè)處理多媒體信息的框架，有視頻采集、視頻格式轉(zhuǎn)換、視頻抓圖、給視頻加水印等功能

requirements.txt

python項(xiàng)目中必須包含一個(gè) requirements.txt 文件，用于記錄所有依賴包及其精確的版本號(hào)，以便新環(huán)境部署

切換到項(xiàng)目目錄，生成requirement.txt文件并查看

③Download Pretrained Models（預(yù)訓(xùn)練模型）

預(yù)訓(xùn)練模型作為包含所有三個(gè)模型（揚(yáng)聲器編碼器、合成器、聲碼器）的檔案。

存檔帶有與存儲(chǔ)庫(kù)相同的目錄結(jié)構(gòu)，您需要將其內(nèi)容與存儲(chǔ)庫(kù)的根目錄合并。

下完pretrained.zip并解壓，有三個(gè)文件夾encoder、synthesizer、vocoder。

把這三個(gè)文件夾中的內(nèi)容復(fù)制到項(xiàng)目中對(duì)應(yīng)的三個(gè)同名文件夾中

④Test Configuration（測(cè)試配置）

python demo_cli.py

發(fā)現(xiàn)No module named 'librosa'

也就是說(shuō)少了個(gè)librosa模塊（librosa是一個(gè)非常強(qiáng)大的python語(yǔ)音信號(hào)處理的第三方庫(kù)）

安裝：pip install librosa

發(fā)現(xiàn)No module named 'torch'????????安裝：pip install torch

發(fā)現(xiàn)No module named 'unidecode'????????安裝：pip install unidecode

發(fā)現(xiàn)No module named 'inflect'????????安裝：pip install inflect

發(fā)現(xiàn)No module named 'sounddevice'????????安裝：pip install sounddevice

都安裝完了，顯示如下

?⑤Download Datasets（數(shù)據(jù)集）

對(duì)于單獨(dú)使用工具箱，建議下載 LibriSpeech/train-clean-100

train-clean-100.tar.gz下好解壓，有一個(gè)LibriSpeech文件夾

在Real-Time-Voice-Cloning-master這個(gè)項(xiàng)目里面，自己建一個(gè)名為datasets的文件夾，將LibriSpeech文件夾放進(jìn)去

終端切換到項(xiàng)目的當(dāng)前目錄

運(yùn)行：python demo_toolbox.py -d datasets

即可Launch the Toolbox（啟動(dòng)工具箱）

在這過(guò)程中

發(fā)現(xiàn)No module named 'umap'????????

安裝：pip install umap-learn -i https://mirrors.ustc.edu.cn/pypi/web/simple

發(fā)現(xiàn)"Unable to import 'webrtcvad'???????

安裝：pip install webrtcvad

工具箱顯示如下?

以上是生活随笔為你收集整理的Real-Time-Voice-Cloning（github声音克隆项目演示）的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。