基于 MSST 和 Wav2Svp 修改,可一键分离伴奏及人声,并根据人声生成工程,工程支持 svp、ustx、ust、vsqx、acep,该版本为精简版,只保留了所需部分代码。
- 安装PyTorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
- 安装依赖
pip install -r requirements.txt
- 命令行推理
python wav2project.py 歌声路径 输出路径 -t 曲速 -s 启用步骤 -f 格式(可选的其他工程格式:ust, ustx, vsqx, acep)
- webui推理
python webui.py
可选值: vocal_separation, harmony_removal, deverb, denoise
注意事项: 每步要用英文逗号 , 分隔。
注意事项:
- 请将所需权重下载到 models/msst 目录下
人声分离: model_bs_roformer_ep_368_sdr_12.9628 (点击下载)
去除和声: model_mel_band_roformer_karaoke_aufr33_viperx_sdr_10.1956(点击下载)
去除混响: deverb_bs_roformer_8_256dim_8depth(点击下载)
去除噪声: denoise_mel_band_roformer_aufr33_aggr_sdr_27.9768(点击下载)
注意事项
- rmvpe 模型下载到 models/rmpve
- some 模型下载到 models/some
midi提取: model_steps_64000_simplified (点击下载)
f0提取: rmvpe (点击下载)
MSST-WebUI: https://github.com/SUC-DriverOld/MSST-WebUI
Wav2Svp:https://github.com/SUC-DriverOld/wav2svp
LibreSVIP:https://github.com/SoulMelody/LibreSVIP