兄弟们,这下可以实现TTS 生成文本转语音自由了。 测试了一下阿里Qwen最新开源模型Qwen3-TTS-12Hz-1.7B-CustomVoice,部署在我这台M1Pro 32G 的笔记本就可以轻松跑起来。 做了一个简单的Demo测试,支持10多种主流语言,中英日韩等语言,支持语调、情绪、上下文内容感知调节,并且可以自定义和克隆音色。 整体的使用效果我觉得还不错,关键是这个模型还有个0.6b的模型,真的是给本地使用者的福音啊。 感兴趣的同学可以自己去试试,地址放评论区。
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?