美团开源6B参数图像生成模型，文生图与编辑能力惊艳提升！_知识学习

美团开源6B参数图像生成模型，文生图与编辑能力惊艳提升！

创始人

2025-12-08 10:29:57

0次

今日，美团LongCat团队宣布正式发布并开源了图像生成模型LongCat-Image。该模型以6B参数规模，在文生图和图像编辑的核心能力上接近更大尺寸模型的效果。LongCat-Image采用文生图与图像编辑同源的架构设计，并结合渐进式学习策略，实现了指令遵循精准度、生图质量与文字渲染能力的高效协同提升，尤其在单图编辑的可控性和文字生成的汉字覆盖度方面表现突出。

LongCat-Image在图像编辑领域的多个重要基准测试中达到开源SOTA水平，其性能突破的背后是一套紧密协同的训练范式和数据策略。模型基于文生图Mid-training阶段模型进行初始化，并采用指令编辑与文生图多任务联合学习机制，深化对复杂多样化指令的理解。此外，通过预训练阶段的多源数据及指令改写策略，以及SFT阶段引入人工精标数据，实现了指令遵循精准度、泛化性和编辑前后视觉一致性的共同提升。

针对中文文本渲染的行业痛点，LongCat-Image通过课程学习策略提升字符覆盖度和渲染精准度。预训练阶段基于千万量级合成数据学习字形，覆盖通用规范汉字表的8105个汉字；SFT阶段引入真实世界文本图像数据，提升在字体、排版布局上的泛化能力；RL阶段融入OCR与美学双奖励模型，进一步提升文本准确性与背景融合自然度。通过对prompt中指定渲染的文本采用字符级编码，大幅降低模型记忆负担，实现文字生成学习效率的跨越式提升。

上一篇：奇瑞捷途山海L7PLUS「城市NOA」全国上线，11.99万起售！

下一篇：以下是一些改写“回应民生关切”的方式，你可以根据具体情境和表达需求进行选择：对民生关切予以回应：强调了主动去做、给予回应的动作，突出了积极的态度。针对民生关切作出回应：明确了是针对特定的民生问题进行回应，使回应更具针对性。以回应民生关切为导向：将回应民生关切作为行动的导向，体现了重视民生的理念。对民生关切进行积极回应：强调了回应的积极态度，即主动、认真地对待民生关切。用回应民生关切来体现：表明通过回应民生关切来展现某种价值或态度，突出了回应的重要性。以回应民生关切为己任：将回应民生关切视为自

美团开源6B参数图像生成模型，文生图与编辑能力惊艳提升！

相关内容

热门资讯