GitHub上出现了一款名为Kitten TTS的开源文本转语音模型,参数规模极小。
- 模型大小仅25-80MB,最小版本不足25MB,基于ONNX运行
- 支持CPU推理,无需GPU即可运行
- 内置8种声音:Bella、Jasper、Luna、Bruno、Rosie、Hugo、Kiki、Leo
- 输出24kHz高质量音频,支持语速调节
- 提供15M、40M、80M三种参数规模可选
原文链接:https://github.com/KittenML/KittenTTS
🕐 发布于: 2026年03月20日 08:05
发表回复