Zyphra推出开源文本转语音模型,仅需几秒音频即可克隆声音 Zyphra发布

游乐看科技 2025-02-17 17:42:15

Zyphra推出开源文本转语音模型,仅需几秒音频即可克隆声音 Zyphra发布了两款开源的文本转语音(TTS)模型Zonos,仅需5秒的样本音频即可克隆用户声音。模型基于1.6亿参数,训练数据超过20万小时,涵盖多种语言和表达方式。其中一款采用纯Transformer架构,另一款结合了Transformer和Mamba架构,后者在生成速度上提升了20%。目前支持中文。

0 阅读:0
游乐看科技

游乐看科技

感谢大家的关注