苹果联手威斯康星大学发布RubiCap,AI图像描述技术新突破
创始人
2026-03-26 09:26:41
0

3月26日,苹果公司与威斯康星大学麦迪逊分校联合发布了名为RubiCap的AI训练框架,旨在优化密集图像描述模型的训练流程。这项技术能够识别图片中的各个局部区域,并为每个细节生成精准的文字说明,对于训练视觉语言模型、文本生成图像以及改善无障碍工具等领域具有重要意义。

RubiCap框架通过创新的强化学习机制,解决了传统训练方法中人工标注成本过高的问题。系统首先从数据集中抽取5万张图像,并利用GPT-5、Gemini2.5Pro等大模型生成候选描述。随后,系统通过Gemini2.5Pro分析候选内容,提炼共识与遗漏点,转化为清晰的评分标准。最后,Qwen2.5模型根据这些标准对描述进行打分,为模型提供结构化的精准反馈。

基于RubiCap框架,苹果训练出了参数量分别为20亿、30亿和70亿的三个模型。测试数据显示,这些紧凑型模型展现出了惊人的效率,其中70亿参数模型在盲测中获得了最高的排名,并实现了最低的“幻觉”错误率,全面超越了参数量高达720亿的前沿大模型。30亿参数的微型模型在部分测试中甚至反超了70亿参数版本,证明高质量的图像描述模型可以摆脱对庞大参数量的绝对依赖。

相关内容

热门资讯

奇瑞路虎联手打造新能源硬派SU... 今日,网络上曝光了一组路虎和奇瑞联合打造的FREELANDER神行者品牌首车的实车照。该车定位为新能...
比亚迪腾势D9新突破:5分钟快... 3月26日,比亚迪第二代腾势D9的预售消息引发关注。据悉,该车型将于3月29日开启预售,并计划在今年...
马斯克xAI视频生成器Grok... 3月26日,埃隆·马斯克宣布其人工智能公司xAI计划全面升级AI视频生成器GrokImagine,以...
苹果联手威斯康星大学发布Rub... 3月26日,苹果公司与威斯康星大学麦迪逊分校联合发布了名为RubiCap的AI训练框架,旨在优化密集...
谷歌发布Lyria3Pro:3... 3月26日,谷歌宣布推出其最新的音乐生成模型Lyria3Pro,标志着音乐AI技术的又一进步。与前一...
通用汽车120万辆车支持App... 3月26日,通用汽车宣布将向别克和GMC品牌旗下多款热门车型推送OTA更新,以扩大原生Apple M...
泰国新能源车市骤降,中国车企面... 近日,泰国新能源车市遭遇政策切换导致的市场低谷。根据泰国工业联合会(FTI)3月24日发布的数据,泰...
雷克萨斯ES换代:外观激进内饰... 近日,新一代雷克萨斯ES在国内开启预售,预售价为30.88万元。新车在外观上进行了较大改变,车身线条...
小米SU7Max:新手友好,智... 3月26日,小米汽车针对新一代SU7Max的操控与安全问题发布官方答疑。新车通过硬件升级和智能系统优...
广州新机场落子珠江西岸,大湾区... 3月25日,随着机器轰鸣、土方开挖,广州新机场正式动工建设。这不仅是多了一座机场,更是粤港澳大湾区在...