RVC:一个基于VITS的简单易用的语音转换(变声器)框架

RVC(Retrieval-based-Voice-Conversion-WebUI)是一个基于VITS的简单易用的语音转换(变声器)框架,项目开发者为知名科技UP花儿不哭,由于RVC的易用性和优质效果、已经成为了AI声音处理工具中的爆款项目。

在语音合成中,用户可以利用这个技术将自己的声音转化成喜欢的明星声音,从而实现个性化的语音合成。在语音助手领域,该技术可以帮助用户为语音助手定制不同的声音特征,增强用户体验。

框架优点:

  1. 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
  2. 即便在相对较差的显卡上也能快速训练
  3. 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
  4. 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
  5. 简单易用的网页界面
  6. 可调用UVR5模型来快速分离人声和伴奏
  7. 使用最先进的人声音高提取算法InterSpeech2023-RMVPE根绝哑音问题。效果最好(显著地)但比crepe_full更快、资源占用更小

GitHub仓库地址:《Retrieval-based-Voice-Conversion-WebUI》

在线演示:《RVC Online demo》

RVC常见问题解答:

语音转换(变声器)框架RVC常见问题解答-菜鸟AIGC资源社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容