今日,千问App宣布正式上线两款强大的视频和图像生成模型:通义万相Wan2.5和Qwen-Image的独家满血特供版。用户现在可以在新升级的千问App中免费体验这些功能。
通义万相Wan2.5是业界少数具备音画同步能力的视频模型之一,能够根据提供的照片和文字生成匹配的人声、音效和背景音乐。该模型采用原生多模态架构,支持生成肢体动作自然、口型匹配准确的1080P高清唱跳视频,最长可达10秒。千问App支持多种类型的照片,包括真人、萌宠、二次元角色、文物和卡通形象。
Qwen-Image模型在图像编辑方面表现出更高的一致性,并在多视角转换、多图像融合、多模态推理等方面取得突破。新模型能够精准编辑和修改图片中的文字,支持双图“拼贴”与“融合”以及基于参考图进行编辑。在生成亚洲人像和中文方面表现更真实和稳定,海报设计达到商用级别。
