苹果AI新突破:UniGen1.5一模型三用,图像理解生成编辑全搞定
创始人
2025-12-19 07:55:58
0

近日,苹果研究团队发布了多模态AI模型UniGen1.5,该模型在单一系统中集成了图像理解、生成与编辑三大核心功能。UniGen1.5的突破在于构建了一个统一框架,使得一个模型能够同时完成图像理解、图像生成以及图像编辑任务。这种统一架构能够利用强大的图像理解能力反哺生成效果,实现更精准的视觉输出。苹果团队还首创引入了“编辑指令对齐”的后训练阶段,通过预测目标图像的详细文本描述来提升编辑的准确度。

UniGen1.5在强化学习层面也有所创新,研究团队设计了一套统一的奖励系统,能够同时应用于图像生成和图像编辑的训练过程。这一突破让模型在处理不同类型的视觉任务时,能够遵循一致的质量标准,增强了系统的“抗干扰”性。在多项行业标准基准测试中,UniGen1.5展现了强劲的竞争力,其在GenEval和DPG-Bench测试中分别获得高分,显著优于其他方法。尽管UniGen1.5整体表现优异,但研究人员也指出了其局限性,如在生成图片内的文字时容易出错,以及在部分编辑场景下可能出现主体特征漂移的问题。这些问题将是团队未来的优化重点。

相关内容

热门资讯

大众ID.ERA系列首款轿车亮... 5月9日,工信部发布了第407批《道路机动车辆生产企业及产品公告》新产品公示,其中上汽大众ID.ER...
华为技术加持!东风奕派M8大六... 今日,东风奕派发布了奕派M8的最新预告图,这款大六座SUV搭载了华为乾崑技术,预计将于本月亮相。奕派...
星火成炬 沃野新篇|路虽遥 行... 当一条条路如大地的脉络联通人间烟火,也如一把把利剑斩断深山阻隔,乡愁有了安稳归途,乡土有了振兴出路。
粤超草根球员群像:五金店老板、... “当茂名进球后,屏幕上出现队标,还写着‘入波嗲’,又开心又感动!”5月3日,粤超茂名队主场迎战湛江队...
南方日报评论员:以“五大行动”... 文丨南方日报评论员“百县千镇万村高质量发展工程”是广东破解城乡区域发展不平衡难题的关键抓手,在全省发...
香港海关侦破两宗毒品案件,查获... 文、图/羊城晚报全媒体记者 鄢敏5月8日晚,香港特区政府新闻网公布侦破两宗毒品案件相关情况。据新闻公...
【图解】“五一”遇春假,全场景... 内容来源:经济日报文案/设计:景远策划:刘江校对:石兰审核:张厚为
人民论坛网评 | 从群众视角看... 习近平总书记强调,“为民造福是最大政绩”“业绩好不好,要看群众实际感受,由群众来评判”。政绩不是干部...
全国防灾减灾周将至,广东省地震... 记者5月7日从广东省地震局获悉,在即将到来的全国防灾减灾周,位于广州市越秀区先烈中路81号大院广东省...
“向东看”见证中国感召力(人民... 一个“赋能型大国”,秉计利天下之胸怀,行务实可行之举措,担立己达人之责任,日益成为道义之锚、信心之源...