3秒语音样本即可合成逼真人声!智谱发布工业级GLM-TTS系统
创始人
2025-12-11 10:40:58
0

智谱今日发布工业级语音合成系统GLM-TTS,并在HuggingFace和ModelScope上开放模型权重。该系统仅需3秒语音样本即可学习说话人的音色和说话习惯,适用于通用朗读、情感配音等多个场景,实现自然流畅、贴近真人的语音效果。GLM-TTS采用两阶段生成架构,并引入基于GRPO的强化学习方案,在字错误率和情感表达上取得开源SOTA表现。该系统仅使用10万小时训练数据,远低于行业主流商用模型,同时兼顾训练成本和效果,预训练仅需单机4天即可达到开源SOTA水平。

GLM-TTS重点验证了教育、电子书与有声内容、智能客服等场景的应用。在教育场景中,该系统适配多音字和生僻字、公式符号,为教材和题库批量生成标准发音示范音频,并保持大规模合成的一致性和准确度。在电子书与有声内容场景中,GLM-TTS可以用单一音色完成整本书的朗读,也可以为不同角色配置专属音色,适配不同文体的节奏与情绪。在智能客服与语音助手场景中,GLM-TTS能为机器人客服打造温和但克制的声音形象,降低机械感,并与上游NLU/NLG模块协同,支持端到端语音交互。

智谱还开放了GLM-TTS的模型权重、推理代码和在线调用接口,方便开发者、研究者和企业评估与集成。开发者可以在GPU环境中快速部署GLM-TTS,并按需做二次开发。同时,智谱也提供了开放平台和API接口,支持从Demo试用到生产级大规模调用。用户还可以通过网页链接和智谱清言App/网页版快速体验GLM-TTS的合成效果。

相关内容

热门资讯

LG电子CES2026推AI座... 今日,LG电子宣布将在CES2026上推出一款基于高通骁龙Snapdragon Cockpit El...
中国新能源车市突破60%大关,... 12月11日,中国新能源汽车市场迎来重要里程碑。据乘联会最新数据,12月首周全国乘用车新能源零售渗透...
Stellantis联手Bol... 近日,汽车制造商Stellantis与欧洲出行平台Bolt宣布建立合作伙伴关系,共同致力于在欧洲范围...
“长安深蓝S07华为版上市:1... 12月11日,长安深蓝汽车宣布全新深蓝S07华为乾崑630长续航版全球上市,限时权益后到手价15.3...
魅族FlymeAuto生态用户... 12月11日,魅族科技宣布FlymeAuto系统11月新增生态用户数首次突破20万,达到20.1万,...
“无名”男子在医院躺了7年半,... 据媒体报道,一无名男子在医院躺了7年半,医院向社会寻求线索。他叫“无名”,是江苏镇江句容市人民医院神...
广州海珠将立足打造数智科创特区... 12月10日,中国共产党广州市海珠区第十三届委员会第十次全体会议召开。据悉,会议对“十四五”时期广州...
法治聚力惠民生 广州创新绘就社... 开篇语为进一步深化法治领域改革,激发创新活力,中共广州市委全面依法治市委员会办公室(以下简称“市委依...
国际人士:高市错误言行威胁地区... 日本首相高市早苗近期的涉台错误言论引发国内外舆论持续批评。国际人士表示,一个中国原则是国际社会普遍共...
【四中全会精神在基层】线上线下... 日前,一条展示310国道渑池段新貌的抖音短视频在当地“火”了。发布者货运司机张金宝曾因这条路坑洼不平...