腾讯混元发布80亿参数图像编辑神器,一键合成创意图片!
创始人
2026-01-26 13:00:04
0

今日,腾讯混元发布混元图像3.0图生图(HunyuanImage3.0-Instruct)模型,该模型支持图片编辑与多图融合功能,并已在“元宝”平台同步上线。混元图像3.0图生图拥有80亿参数量,采用混合专家(MoE)架构,基于混元图像3.0的原生多模态架构基础模型,通过指令微调和后训练,实现了对用户输入图像和编辑指令的深度理解与处理。

混元图像3.0图生图能够理解输入图像内容,并基于用户的提示词进行推理,以确定需要编辑的区域、编辑步骤及保留区域,形成详细编辑指令。该模型支持多样化的图片编辑与多图融合能力,包括增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑能力,以及将多张照片中的人物或元素提取合成合照与生成新图片。

在数据层面,混元团队构建了千万量级的图生图数据,覆盖80+任务,并在持续训练阶段注入这些数据,使模型掌握基础编辑功能。同时,混元团队针对图生图数据构造了思维链,让模型学会先分析用户图像和意图,输出更加详细的编辑指令提升编辑效果。后训练阶段,混元图像3.0图生图采用自研MixGRPO算法,结合奖励模型多轮迭代,对齐用户偏好,提升了指令响应和非编辑区域保持一致的效果。

相关内容

热门资讯

北汽新能源“方盒子”硬派越野车... 近日,多位博主分享了鸿蒙智行享界品牌越野车型的伪装车谍照。谍照背景中出现了“北汽新能源XXXX工厂”...
一季度中国软件业收入增11.6... 5月7日,工信部官方微信公众号发布数据显示,2026年一季度我国软件和信息技术服务业收入达34920...
Adobe Acrobat新增... Adobe于5月6日宣布在Acrobat中推出PDFSpaces分享功能,该功能旨在将静态材料转化为...
鸿蒙智界V9预售火爆,72小时... 近日,鸿蒙智行旗下首款MPV智界V9开启预售,起售价39.98万元,顶配价格52.98万元。智界V9...
别克至境E7两周销量破5000... 5月6日,别克汽车官方宣布,至境E7上市两周累计交付量已突破5000台,其中“有孩家庭”占比超过80...
电竞潮燃“五一”,电竞粤超东莞... 羊城晚报讯 记者陈旭泽报道:5月5日,2026广东省电子竞技超级联赛(以下简称“电竞粤超”)城市巡回...
广东多所高校探索“艺科融通”复... 文/羊城晚报全媒体记者 秦小杰图/受访者提供近日,广东多所专业类高校密集举办系列活动,深入探索艺术与...
两名“红领巾”的跨国相遇!越南... 文/羊城晚报全媒体记者 张小悦图/通讯员 岳青“He is my best friend!(他是我最...
华晨宇直播哭了,发文致歉 4月22日晚,歌手华晨宇发文致歉,在云南举办的火星乐园2.0因不可抗力延期。全文如下:火星乐园2.0...
广州荔湾多宝街道:空间挖潜+数... 文/羊城晚报全媒体记者 梁怿韬 通讯员 成广聚 陈梓佳图/通讯员提供空间狭窄,是地处老城区的广州市荔...