阿里万相2.6系列模型发布:全球功能最全视频生成技术革新
创始人
2025-12-16 14:23:43
0

12月16日,阿里巴巴发布了新一代万相2.6系列模型,该系列针对专业影视制作和图像创作场景进行了全面升级。万相2.6是国内首个支持角色扮演功能的视频模型,具备音画同步、多镜头生成及声音驱动等功能,被认为是全球功能最全的视频生成模型。模型已上线阿里云百炼和万相官网。

万相2.6视频生成升级亮点包括角色扮演功能,能够参考输入视频中的角色外观和音色,实现角色扮演,并按提示词生成单人、多人、人与物合拍的视频。此外,模型还能将简单提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,保持多镜头间主体、场景等关键信息的一致性。在音频方面,万相2.6支持多人对话场景的稳定生成,提升真实自然的人声表达和音乐、歌曲生成的质量。模型还能生成最长15秒的视频,提升画面时空内容容量,支持更完整的叙事。音频驱动生成功能允许根据用户输入的文本和音频驱动生成视频,并实现多镜头演绎。

在图像生成方面,万相2.6升级亮点包括艺术风格的高度美学与可控性,精准捕捉艺术灵魂,支持多种艺术风格有机融合,过渡平滑,创作出独具一格的视觉作品。细节刻画更为生动丰富,赋予图像故事感与表现力。在写实人像生成中,人物神态自然、肤质真实,有效削弱“AI感”。模型综合优化构图与光影,呈现更具表现力的人像视角。此外,万相2.6还能依据中英文长文本内容,结合美学设计与图文协调性,精准生成海报、图文说明、信息图表等,实现内容与视觉的高度统一。

相关内容

热门资讯

小鹏G9L亮相工信部:轴距加长... 5月9日,工信部最新一期申报图中曝光了小鹏汽车的全新车型——小鹏G9L。这款新车在设计上延续了小鹏G...
地块控规修正获批 逾120年黄... 新快报讯 记者陈慕媛报道 新快报记者近日从广州市规划和自然资源局了解到,《广州市道教黄大仙祠AF02...
在当代文学史上留下中阿“同写一... 文/羊城晚报全媒体记者 梁善茵 熊安娜图/主办方提供“青春似火焰源源暖众生,唤醒天地飞奔不了情,冲破...
男子7年间将女友家中近15万元... 近日,辽宁鞍山警方破获了一起男友用练功券替换女友现金的盗窃案件。日前,刘女士发现,家中冰箱里的14....
早接晚送、途经菜市场!广州越秀... 文/羊城晚报全媒体记者 卢佳圳 通讯员 詹苹苹图/欧广傑“妈,明天早上9点,车在楼下接您,晚上5点半...
广州高新区投资集团有限公司党委... 广州市纪委监委5月8日通报:广州高新区投资集团有限公司党委委员、副总经理罗淡彬涉嫌严重违纪违法,目前...
TCL华星t8项目封顶,广州黄... 文/羊城晚报全媒体记者 卢佳圳 通讯员 郑嘉俊 范敏玲图/通讯员提供5月8日,位于广州开发区、黄埔区...
总台记者观察丨日本舆论对高市内... 日本高市早苗内阁推动的设立“国家情报局”相关法案5月8日在日本参议院全体会议进入审议阶段。总台记者 ...
(乡村行·看振兴)广东连江口镇... 中新网清远5月8日电 (张璐 林钰欣)时下,走进清远英德市连江口镇的一片麻竹林,只见翠绿的竹林竹节拔...
馕咖啡风靡北京 | 真相 在新疆,馕不只是食物,更是传承千年的丝路文化符号,是刻在各族人民生活里的烟火底气。从丝路馕香到网红馕...