语音克隆技术飞跃！VoxCPM1.5版本升级：音频质量翻倍_知识学习_花城资讯网

语音克隆技术飞跃！VoxCPM1.5版本升级：音频质量翻倍

创始人

2025-12-10 17:09:59

0次

今日，面壁智能宣布VoxCPM1.5版本正式上线，该版本在优化开发者体验的同时，带来了多项核心能力升级。VoxCPM是一个0.5B参数尺寸的语音生成基座模型，首次发布于今年9月。此次更新的亮点包括：高采样音频克隆能力的提升，AudioVAE采样率从16kHz提升至44.1kHz，使得模型能够根据高质量音频克隆出效果更佳、细节更丰富的声音；生成效率翻倍，VoxCPM1.5仅需6.25个token即可生成1秒音频，较之前版本提高一倍，同时保持了音频生成质量；开发者友好性增强，新增LoRA和全量微调脚本，支持深度定制；增强稳定性，减少音频伪影，优化长文本音频的生成效果。

VoxCPM1.5模型现已在Github和HuggingFace开源，开发者可以访问相关链接获取资源，进行进一步的开发和应用。这一更新标志着面壁智能在语音生成技术领域的又一进步，为开发者提供了更加强大和灵活的工具。

上一篇：欧盟推“E级车”提案，小型电动车价格或降10%至20%

下一篇：英特尔拟收购AI芯片企业SambaNova，CEO陈立武或成关键人物

相关内容

热门资讯

小米YU7新入门级版亮相：续航... 5月10日，小米汽车YU7新增入门级版本，该版本相较于标准版在整备质量上有所降低，从2315kg降至...

现代IONIQ V亮相工信部公... 5月10日，现代汽车旗下全新车型IONIQ V（艾尼氪金星）正式出现在工信部第407批《道路机动车辆...

“蔚来李斌24小时直播见证：河... 5月10日，蔚来创始人、董事长兼CEO李斌开启24小时直播，与团队自驾验收河西走廊换电路线贯通。李斌...

北京现代艾尼氪V申报亮相：另类... 5月10日，工信部第407批新车申报目录中，北京现代旗下全新新能源品牌IONIQ（艾尼氪）首款车型—...

特斯拉Model S/X停产，... 5月10日，特斯拉宣布正式停产Model S和Model X两款车型，消费者只能购买库存现车。特斯拉...

吉利银河TT亮相工信部公告，4... 5月10日，工信部发布第407批《道路机动车辆生产企业及产品公告》，吉利银河品牌首款纯电轿跑银河TT...

特斯拉Model S/X签名版... 5月10日，特斯拉宣布推迟原定于5月12日的Model S/X Signature Edition（...

吉利银河TT纯电轿跑申报：5米... 5月10日，工信部第407批新车申报目录中，吉利银河品牌旗下全新纯电车型银河TT正式申报。这款中大型...

专访资深政法记者刘海陵：笔锋铸... 刘海陵的新闻人生，是改革开放的生动缩影，是法治进步的忠实见证，更是新闻理想的永恒传承。世纪之交，香江...

38岁身家过亿房地产老总家中遭... 南京市江宁区一身家过亿的房地产老总刘某，在家中遭人杀害，事发16年后，这处“凶宅”于5月7日进行第二...