阿 B 开源的声音模型 IndexTTS 最近发布了更新,

它支持语音合成,和只用几秒的声音样本,完成音色克隆,

新版本优化了语音生成质量,可以自动纠正汉字的发音错误,可以自己设置语音停顿,

且只需要 8G 左右的显存。

下边是它的一些声音合成演示:

字节最近也更新了一款声音模型 MegaTTS 3,

同样支持小样本完成声音克隆,支持长文本语音合成、中英文混合输出。

IndexTTS:https://github.com/index-tts/index-tts

添加新评论