10B参数量挑战200B性能!阶跃星辰Step3-VL-10B多模态模型开源
创始人
2026-01-20 18:56:01
0

今日,阶跃星辰宣布其多模态模型Step3-VL-10B开源。该模型以10B参数量,在视觉感知、逻辑推理、数学竞赛及通用对话等基准测试中达到同规模SOTA水平,解决了参数量小与智能水平高的行业难题。Step3-VL-10B在多项评测中媲美甚至超越规模大10-20倍的开源模型和顶级闭源旗舰模型,使得原本只能在云端运行的复杂多模态推理能够下沉到手机、电脑等端侧设备中。

Step3-VL-10B具备三大核心亮点:极致视觉感知标杆、深层逻辑推演与长程推理、强大端侧Agent交互。模型在STEM推理、识别、OCR&文档、GUIGrounding、空间理解、代码等核心维度取得优秀分数,尤其在PaCoRe范式下表现更优。其性能得益于全参数端到端多模态联合预训练、大规模多模态强化学习演进以及并行协调推理机制(PaCoRe)。

Step3-VL-10B的开源,意味着世界一流的多模态能力有望以更低成本、更少算力获得,推动终端走向“主动理解与可执行交互”,重塑人机交互体验。目前,Base模型和Thinking模型均已开源,阶跃星辰欢迎社区讨论交流和微调模型,共同推动小模型实现智能跃迁。

相关内容

热门资讯

2025年中国智能手机出货量再... 近日,多家市场调研机构公布了2025年四季度和全年的全球及中国市场智能手机出货量统计。数据显示,中国...
兰博基尼2025年全球销量破纪... 1月20日,意大利豪华跑车制造商兰博基尼宣布,2025年全球交付量达到10747辆,较上一年度略有增...
AI浪潮来袭:80%员工担忧工... 1月20日,全球人力资源服务机构任仕达发布《工作趋势观察》报告,揭示了人工智能(AI)对全球劳动力市...
中国车企欧洲销量破10万,市场... 1月20日,中国车企在欧洲市场的销量表现亮眼。2025年12月,中国车企在欧洲的总销量同比激增126...
英伟达被控使用“安娜档案馆”百... 1月20日,英伟达被指控使用“安娜档案馆”的数百万本盗版书籍为其人工智能模型训练提供数据支持。在一项...
丈夫出轨中学同学9年,婚内赠与... 中学同窗重逢滋生婚外情,九年纠葛牵扯财产纠纷。中国裁判文书网日前公布的一例判例显示,丈夫婚内擅自赠与...
荔湾区委书记刘晨辉:建设具有经... 1月19日,广州市第十六届人民代表大会第六次会议开幕,大会回顾了2025年及“十四五”时期发展成就,...
文化中国行·联播一瞬丨雪未融、... 大寒是二十四节气中的最后一个节气,“过了大寒,又是一年”。大寒处在三九、四九时段,也是一年中最冷的时...
“十五五”开好局起好步 | 以... 央视网消息:“十四五”期间,安徽物流体系升级成效显著。2026年,“十五五”开局之年,安徽正以科技创...
迎战寒潮:一线坚守筑牢民生温暖... 中国气象局1月18日18时升级调整重大气象灾害(寒潮)四级应急响应为(寒潮、冰冻、暴雪)三级。中央气...