语音克隆技术飞跃!VoxCPM1.5版本升级:音频质量翻倍
创始人
2025-12-10 17:09:59
0

今日,面壁智能宣布VoxCPM1.5版本正式上线,该版本在优化开发者体验的同时,带来了多项核心能力升级。VoxCPM是一个0.5B参数尺寸的语音生成基座模型,首次发布于今年9月。此次更新的亮点包括:高采样音频克隆能力的提升,AudioVAE采样率从16kHz提升至44.1kHz,使得模型能够根据高质量音频克隆出效果更佳、细节更丰富的声音;生成效率翻倍,VoxCPM1.5仅需6.25个token即可生成1秒音频,较之前版本提高一倍,同时保持了音频生成质量;开发者友好性增强,新增LoRA和全量微调脚本,支持深度定制;增强稳定性,减少音频伪影,优化长文本音频的生成效果。

VoxCPM1.5模型现已在Github和HuggingFace开源,开发者可以访问相关链接获取资源,进行进一步的开发和应用。这一更新标志着面壁智能在语音生成技术领域的又一进步,为开发者提供了更加强大和灵活的工具。

相关内容

热门资讯

小米YU7新入门级版亮相:续航... 5月10日,小米汽车YU7新增入门级版本,该版本相较于标准版在整备质量上有所降低,从2315kg降至...
现代IONIQ V亮相工信部公... 5月10日,现代汽车旗下全新车型IONIQ V(艾尼氪金星)正式出现在工信部第407批《道路机动车辆...
“蔚来李斌24小时直播见证:河... 5月10日,蔚来创始人、董事长兼CEO李斌开启24小时直播,与团队自驾验收河西走廊换电路线贯通。李斌...
北京现代艾尼氪V申报亮相:另类... 5月10日,工信部第407批新车申报目录中,北京现代旗下全新新能源品牌IONIQ(艾尼氪)首款车型—...
特斯拉Model S/X停产,... 5月10日,特斯拉宣布正式停产Model S和Model X两款车型,消费者只能购买库存现车。特斯拉...
吉利银河TT亮相工信部公告,4... 5月10日,工信部发布第407批《道路机动车辆生产企业及产品公告》,吉利银河品牌首款纯电轿跑银河TT...
特斯拉Model S/X签名版... 5月10日,特斯拉宣布推迟原定于5月12日的Model S/X Signature Edition(...
吉利银河TT纯电轿跑申报:5米... 5月10日,工信部第407批新车申报目录中,吉利银河品牌旗下全新纯电车型银河TT正式申报。这款中大型...
专访资深政法记者刘海陵:笔锋铸... 刘海陵的新闻人生,是改革开放的生动缩影,是法治进步的忠实见证,更是新闻理想的永恒传承。世纪之交,香江...
38岁身家过亿房地产老总家中遭... 南京市江宁区一身家过亿的房地产老总刘某,在家中遭人杀害,事发16年后,这处“凶宅”于5月7日进行第二...