12月23日,阿里巴巴通义Qwen团队推出了Qwen-Image-Edit-2511图像编辑模型,这是在Qwen-Image-Edit-2509基础上的全新升级。该模型专注于图像编辑场景,旨在解决在保持原图主体结构不变的情况下,对特定区域进行精准修改的行业难题,为开发者和设计师提供了更高效的AI辅助工具。
Qwen-Image-Edit-2511模型的亮点在于其强大的指令遵循能力,用户只需输入自然语言指令,如“将画面中的猫换成狗”或“移除背景中的路人”,模型即可自动理解并执行操作。模型通过深度融合视觉编码器与语言模型,精确识别图像中的语义对象,确保在修改目标物体的同时,最大限度地保留原图的光影、纹理及背景一致性。此外,模型还进一步改善了人物一致性,能够在保留主体身份特征和视觉风格的情况下,进行富有想象力的编辑。
Qwen-Image-Edit-2511还增强了多人合影场景中的一致性表现,能够将两张独立的人物图像高保真地融合为一张协调的群像照片。模型将部分精选的热门LoRA直接集成到基础模型中,无需额外微调即可启用其效果,例如光照增强LoRA下,用户可实现逼真的光照控制。同时,模型引入了更强的几何推理能力,可直接为设计或标注目的生成辅助构造线。


