苹果联手威斯康星大学发布RubiCap，AI图像描述技术新突破_知识学习_花城资讯网

苹果联手威斯康星大学发布RubiCap，AI图像描述技术新突破

创始人

2026-03-26 09:26:41

0次

3月26日，苹果公司与威斯康星大学麦迪逊分校联合发布了名为RubiCap的AI训练框架，旨在优化密集图像描述模型的训练流程。这项技术能够识别图片中的各个局部区域，并为每个细节生成精准的文字说明，对于训练视觉语言模型、文本生成图像以及改善无障碍工具等领域具有重要意义。

RubiCap框架通过创新的强化学习机制，解决了传统训练方法中人工标注成本过高的问题。系统首先从数据集中抽取5万张图像，并利用GPT-5、Gemini2.5Pro等大模型生成候选描述。随后，系统通过Gemini2.5Pro分析候选内容，提炼共识与遗漏点，转化为清晰的评分标准。最后，Qwen2.5模型根据这些标准对描述进行打分，为模型提供结构化的精准反馈。

基于RubiCap框架，苹果训练出了参数量分别为20亿、30亿和70亿的三个模型。测试数据显示，这些紧凑型模型展现出了惊人的效率，其中70亿参数模型在盲测中获得了最高的排名，并实现了最低的“幻觉”错误率，全面超越了参数量高达720亿的前沿大模型。30亿参数的微型模型在部分测试中甚至反超了70亿参数版本，证明高质量的图像描述模型可以摆脱对庞大参数量的绝对依赖。

上一篇：谷歌发布Lyria3Pro：3分钟AI音乐生成突破，告别模仿时代！

下一篇：马斯克xAI视频生成器GrokImagine升级，抢占AI视频市场先机

相关内容

热门资讯

奇瑞路虎联手打造新能源硬派SU... 今日，网络上曝光了一组路虎和奇瑞联合打造的FREELANDER神行者品牌首车的实车照。该车定位为新能...

比亚迪腾势D9新突破：5分钟快... 3月26日，比亚迪第二代腾势D9的预售消息引发关注。据悉，该车型将于3月29日开启预售，并计划在今年...

马斯克xAI视频生成器Grok... 3月26日，埃隆·马斯克宣布其人工智能公司xAI计划全面升级AI视频生成器GrokImagine，以...

苹果联手威斯康星大学发布Rub... 3月26日，苹果公司与威斯康星大学麦迪逊分校联合发布了名为RubiCap的AI训练框架，旨在优化密集...

谷歌发布Lyria3Pro：3... 3月26日，谷歌宣布推出其最新的音乐生成模型Lyria3Pro，标志着音乐AI技术的又一进步。与前一...

通用汽车120万辆车支持App... 3月26日，通用汽车宣布将向别克和GMC品牌旗下多款热门车型推送OTA更新，以扩大原生Apple M...

泰国新能源车市骤降，中国车企面... 近日，泰国新能源车市遭遇政策切换导致的市场低谷。根据泰国工业联合会（FTI）3月24日发布的数据，泰...

雷克萨斯ES换代：外观激进内饰... 近日，新一代雷克萨斯ES在国内开启预售，预售价为30.88万元。新车在外观上进行了较大改变，车身线条...

小米SU7Max：新手友好，智... 3月26日，小米汽车针对新一代SU7Max的操控与安全问题发布官方答疑。新车通过硬件升级和智能系统优...

广州新机场落子珠江西岸，大湾区... 3月25日，随着机器轰鸣、土方开挖，广州新机场正式动工建设。这不仅是多了一座机场，更是粤港澳大湾区在...