语音克隆技术飞跃!VoxCPM1.5版本升级:音频质量翻倍
创始人
2025-12-10 17:09:59
0

今日,面壁智能宣布VoxCPM1.5版本正式上线,该版本在优化开发者体验的同时,带来了多项核心能力升级。VoxCPM是一个0.5B参数尺寸的语音生成基座模型,首次发布于今年9月。此次更新的亮点包括:高采样音频克隆能力的提升,AudioVAE采样率从16kHz提升至44.1kHz,使得模型能够根据高质量音频克隆出效果更佳、细节更丰富的声音;生成效率翻倍,VoxCPM1.5仅需6.25个token即可生成1秒音频,较之前版本提高一倍,同时保持了音频生成质量;开发者友好性增强,新增LoRA和全量微调脚本,支持深度定制;增强稳定性,减少音频伪影,优化长文本音频的生成效果。

VoxCPM1.5模型现已在Github和HuggingFace开源,开发者可以访问相关链接获取资源,进行进一步的开发和应用。这一更新标志着面壁智能在语音生成技术领域的又一进步,为开发者提供了更加强大和灵活的工具。

相关内容

热门资讯

腾讯OVBU架构调整:AI技术... 近日,腾讯PCG(平台与内容事业群)下的OVBU(腾讯在线视频业务)完成了组织架构调整。内部新成立了...
起亚赛图斯全新换代:全球主角、... 起亚紧凑型SUV赛图斯迎来全面换代,新车将定位为全球产品线的“主角”。此次换代在外观上采用更锐利的设...
首次同期举办!创交会海交会将于... 12月10日,一场新闻通气会提前揭开了科创盛会的面纱——12月15日至16日,中国创交会与海交会将首...
【“中国游记”第二季⑨】勇敢的... 来中国想玩点刺激的?那就和美国博主“PPPeter”一起勇闯云南陇川,来这里开“蜂巢盲盒”吧!从野外...
全球瞭望丨英媒:中国入境游持续... 新华社伦敦12月9日电(记者赵小娜)英国专业旅游行业媒体《旅游评论》杂志网站8日发表评论文章说,20...
好评中国|精细化服务放大冰雪经... 评论员 牛可心随着2025-2026雪季开启,铁路部门在京张高铁北京北至崇礼间各车站运行的G字头列车...
理响中国·烽火丹心丨勿忘九一八... 历史上,日本军国主义多次以所谓“存亡危机”为借口发动对外侵略包括以“行使自卫权”为由悍然制造九一八事...
青春华章 向海图强丨山东向海图... 山东是海洋大省,海岸线长3505公里、约占全国的1/6,毗邻海域面积15.86万平方公里、与陆域面积...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
理想汽车VLA技术突破:自动驾... 今日,理想汽车自动驾驶负责人郎咸朋发表长文,回应宇树科技CEO王兴兴对VLA模型(视觉-语言-动作)...