今日,阿里云通义宣布开源发布Z-Image基座模型,该模型尺寸为6B,是一款非蒸馏基座模型,保留了全量权重分布。Z-Image原生支持CFG引导机制,为LoRA、ControlNet等微调任务提供了训练基础。该模型旨在打破单一维度的写实局限,无论是追求光影效果的Photorealism,还是具有情绪张力的动漫与数字艺术,Z-Image都能够捕捉并重构每一处风格细节。
Z-Image在专项优化上也有所突破,优化了采样空间分布,确保不同原生出图的面孔与构图具备显著差异,多人场景中能够剥离个体特征,避免AI“大众脸”的现象。此外,Z-Image能够灵敏响应负向提示词,通过NegativePrompt快速过滤瑕疵、净化画面,实现从构图到光影的深度掌控。
Z-Image的开源地址已公布,包括GitHub、魔搭以及HuggingFace平台,方便开发者和研究者访问和使用。GitHub地址为:网页链接;魔搭地址为:网页链接;HuggingFace地址为:网页链接。


