自 GPT – 4o 出现后,中文语音合成大模型涌现,但在方言领域进展缓慢。巨人网络 AI Lab 团队构建了涵盖 20 种方言、超 20 万小时的数据集,训练出支持多种普通话方言混说的 TTS 大模型 Bailing – TTS 。采取了统一的方言 Token 规范、精细化 Token 对齐技术、层次混合专家结构、层次强化学习增强策略等创新技术。
自 GPT – 4o 出现后,中文语音合成大模型涌现,但在方言领域进展缓慢。巨人网络 AI Lab 团队构建了涵盖 20 种方言、超 20 万小时的数据集,训练出支持多种普通话方言混说的 TTS 大模型 Bailing – TTS 。采取了统一的方言 Token 规范、精细化 Token 对齐技术、层次混合专家结构、层次强化学习增强策略等创新技术。