AI新突破!面壁智能开源全模态旗舰MiniCPM-o4.5
创始人
2026-02-04 21:20:57
0

今日(2月4日),面壁智能宣布开源新一代全模态旗舰模型MiniCPM-o4.5。这款模型以其“边看、边听、主动说”的全模态能力,突破了传统AI“对讲机”式的交互限制,实现了行业首个“即时自由对话”的大模型。MiniCPM-o4.5已在GitHub、HuggingFace等平台开源,展现了其跨平台能力,尤其在天数智芯、华为昇腾等6款芯片上实现了端到端推理性能提升。

MiniCPM-o4.5以其9B参数,在全模态、视觉理解、文档解析、语音理解和生成、声音克隆等方面达到了SOTA水准。该模型在能效比方面表现突出,通过更低的显存占用和更快的响应速度,提供了SOTA级全模态表现的同时,实现了更好的推理效率和更低的推理开销。在语音生成方面,MiniCPM-o4.5通过新的模型设计和数据方法,全面提升了音色、拟人度和声音表现力,解决了长语音合成中的音色不统一等问题。此外,MiniCPM-o4.5在声音克隆上提供了更多的声音选择,能够基于几秒的声音样本克隆定制新音色,并进行角色扮演的语音对话。模型采用了端到端的全模态架构,并加入了全双工多模态实时流机制、主动交互机制、可配置语音建模设计。

相关内容

热门资讯

苹果官方紧急提醒!iPhone... 4月15日,苹果官方服务号“Apple”发布《更新iOS 以保护你的iPhone免受网页攻击》提示。...
咖啡“从”这里飘香:看广州北部... 当咖啡的醇香从都市商圈飘向乡野山间,一场以咖啡为媒介的产业实践正在广州北部悄然生长。青山绿水、荔甜稻...
从“柜台”到“客厅”:一间服务... 4月的广州,春意正浓。在越秀区人民街果菜西社区一栋不起眼的居民楼下,一间服务站里飘出咖啡香,几位老人...
数说“新”变化|丝路枢纽活力迸... 一季度,新疆机场(集团)有限责任公司累计完成年旅客吞吐量1252.52万人次,保障航班起降11.27...
广交世界,七个维度读懂广货有多... 第139届广交会将于4月15日开幕。本届广交会高手云集,首次增设智能穿戴、显示技术、消费级无人机、集...
宝马Z4停产在即,2026年Q... 近日,宝马Z4的生产即将画上句号。欧洲市场的最后一批车型已于3月完成生产,而美国市场的最后一批车型也...
福特CEO承诺:新车价格将降至... 5月6日,福特CEO吉姆·法利强调,降低新车价格以提高其可负担性是汽车行业的当务之急。他指出,尽管部...
微软或放弃2030年清洁电力目... 今日,彭博社报道微软可能搁置其激进的清洁能源承诺。微软正在评估是否推迟或放弃2030年实现100%清...
小米增程SUV大变样:新品牌“... 近日,小米汽车首款增程SUV的最新动态引发关注。此前外界普遍认为该车型将隶属于小米品牌,并猜测其名称...
鸿蒙智行首款硬派SUV曝光:增... 近日,享界即将推出的硬派越野车谍报图曝光,预计该车将成为鸿蒙智行首款硬派SUV。新车采用方盒子造型,...