小红书联手复旦突破AI绘画技术,InstanceAssemble精准构图革命
创始人
2025-12-26 10:56:59
0

12月26日,小红书与复旦大学合作,推出了一项名为InstanceAssemble的突破性技术,该技术在布局控制生成(Layout-to-Image)领域取得显著进展。InstanceAssemble通过“实例组装注意力”机制,能够根据用户指定的空间布局约束生成精准图像,解决了布局对齐不准、语义脱节和计算成本过高的问题。这项技术基于扩散变换器架构,并允许用户通过提供物体的边界框位置和内容描述来生成符合语义的图像内容,无论是简单物体还是复杂场景,都能保持高精度的布局对齐和语义一致性。

InstanceAssemble技术在适配主流模型方面表现出色,通过约7100万个参数(约3.46%额外参数)适配StableDiffusion3-Medium模型,适配Flux.1模型的参数比例更是低至0.84%。在包含90万个实例的密集布局数据集上,InstanceAssemble的性能大幅超越了现有方法。为了更准确地衡量布局与图像的匹配程度,研究团队还创建了“Denselayout”基准测试集和“LayoutGroundingScore”(LGS)评估指标。实验结果表明,即使在训练时仅使用稀疏布局,InstanceAssemble也能在密集布局上保持稳健性能。

这项技术已经开源,代码和预训练模型可在GitHub上获取,为设计、广告和内容创作等领域的应用提供了强大支持。InstanceAssemble的开源将进一步推动AI绘画技术的发展,使其在多实例图像生成精度上实现新的突破。

相关内容

热门资讯

比亚迪海鸥2026款即将发布:... 5月9日,比亚迪宣布2026款海鸥“智感进阶”车型将于5月11日正式发布,这将是首款支持搭载激光雷达...
蚂蚁集团发布万亿级AI模型Ri... 5月9日,蚂蚁集团旗下百灵大模型发布了万亿级旗舰思考模型Ring-2.6-1T,专为应对真实复杂任务...
百度文心5.1模型全球排名第四... 5月9日,百度宣布推出新一代基础大模型——文心大模型5.1,并已在百度千帆模型广场、文心一言官网上线...
华为联手五菱打造华境S SUV... 5月8日,华境S正式上市,推出四款配置版本,售价区间为15.98-20.38万元,限时置换价14.9...
奥迪E7X开启预售!豪华纯电S... 今日,奥迪E7X正式开启预售,推出5款车型,预售价区间为28.98万元至37.98万元。这款豪华中大...
AI对话新突破!StepAud... 5月9日,阶跃星辰发布了新一代实时语音大模型StepAudio2.5Realtime,并已全面上线。...
阿维塔07L亮相:加长车身+豪... 今日,阿维塔官方发布了全新阿维塔07L的外观图。与阿维塔07相比,07L在前脸设计上变化不大,依旧保...
大众电动GTI首秀!ID.Po... 5月9日,大众汽车宣布将在纽博格林24小时耐力赛期间发布首款电动GTI车型——ID.PoloGTI,...
25亿美元融资到手,阶跃星辰拆... 5月8日,据接近阶跃星辰的人士透露,该公司即将完成近25亿美元的融资。参与此次投资的包括华勤、龙旗、...
12亿打造全球首个室内降雪试验... 5月8日,我国室内最大的全季冰雪汽车试验基地在内蒙古呼伦贝尔牙克石市正式奠基开工。该项目由中国汽车技...