首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜

自 GPT – 4o 出现后,中文语音合成大模型涌现,但在方言领域进展缓慢。巨人网络 AI Lab 团队构建了涵盖 20 种方言、超 20 万小时的数据集,训练出支持多种普通话方言混说的 TTS 大模型 Bailing – TTS 。采取了统一的方言 Token 规范、精细化 Token 对齐技术、层次混合专家结构、层次强化学习增强策略等创新技术。

上一篇:

下一篇:

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信