12月31日,阿里通义大模型开源发布了Qwen-Image-2512,这一模型在图像生成领域实现了三大核心能力的飞跃式提升。Qwen-Image-2512能够生成更真实的人物质感,通过精准刻画皮肤纹理、发丝走向和表情神态,甚至理解“微微前倾”等语义细节,告别了塑料脸和模糊五官的问题。此外,该模型在自然纹理的刻画上也更为细腻,无论是水流、苔藓、金毛犬的绒毛还是盘羊的粗硬皮毛,都能得到细致的表现。
Qwen-Image-2512在文字渲染方面也取得了显著进步,不仅能够排版时间轴、呈现技术图表,还能生成带多格漫画和对话框的健康科普海报。在AIArena超过1万局的用户盲测中,Qwen-Image-2512在开源模型中表现最优,并在与多款闭源模型的对比中展现出显著竞争力。这一模型的全面开源,为图像生成技术的发展提供了新的推动力,其官方生成示例和开源地址已对外公布。


