音频处理

展开

MoeTTS v1.1.1免费版

大小:960.0M语言:简体 类别:音频处理系统:WinAll
简介|教程|评论(0)
软件性质:免费软件时间:2024-09-03 13:10:14

标签: MoeTTS

软件介绍

  MoeTTS是一款相当优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库,语音合成大部分角色效果非常好,后续还会发布至MoeTTS项目页。

MoeTTS

基本简介

  MoeTTS是一款Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库,训练时长3天,约900 Epoch,13人大型模型还在训练中,之后也会发布至MoeTTS项目页,视频后面的模型400 Epoch训练了5天,语音合成大部分角色效果很好了,数据较少的几个角色还不太行。

使用方法

  模型目录格式

  单模型可以放在任意位置,如果模型带有配置文件,请将它重命名为config.json并与TTS模型放置在同一目录。(例如hifigan,vits模型,它们是带有配置文件的)

  VITS模型请将config.json中的cleaners 改为custom_cleaners

  文本输入格式

  文本一般是输入音素(日语在这里应该输入罗马音),但具体要看模型训练者的数据是怎么输入的。比如我的ATRI模型(Tacotron2版本)是输入无空格罗马音,标点符号只支持逗号句号。

  自定义Cleaner与Symbols

  你可以在与moetts.exe同级的目录下找到custom文件夹,这里面存放了两种模型的文本模块。

  自定义cleaner:找到cleaners.py并修改custom_cleaners函数即可(软件默认只会移除不在symbols中的字符,不对文本做进一步处理)

  自定义symbols:找到symbols.py,将里面的符号为你需要的符号

  注意:不同模型可能使用不同的cleaners与symbols训练,有需要请修改他们,保证模型能正常使用。

  GUI使用方法

  tacotron2

  选择您的模型路径与输出目录,最后输入待合成文本,点击合成语音等待一会软件会将音频输出到输出目录/outpus.wav

  注意事项:

  首次合成需要加载模型,耗时较长,相同模型再次合成不会再次加载,直接合成。

  如果切换模型,再次合成会重新加载。

  如果修改cleaners与symbols,重新启动软件后才能生效。

  软件为64位版本,不支持32位系统。

  VITS特殊说明

  VITS-Single,VITS-Multi分别为单角色模型与多角色模型

  VITS-Multi中的原角色ID即待合成语音的角色ID,需要填入数字,目标角色ID为语音迁移功能的待迁移目标角色ID。

  待迁移音频需要22050的采样率,16位,单声道。

加载全部内容

热门推荐
推荐教程
猜你喜欢
相关合集
用户评论
本类排行