1月31日,快手宣布推出新一代视频生成模型可灵3.0系列,目前处于超前内测阶段。该系列包含图片3.0、视频3.0和视频3.0Omni,对原有模型进行了技术升级。图片3.0模型新增组图生成能力,支持批量生成逻辑连贯的系列画面,输出分辨率提升至2K与4K级别,增强画面细节一致性,强化对构图、视角等元素的控制精度。视频3.0模型采用统一的多模态训练框架,支持文本、图像、视频片段等多种输入形式,单次视频生成时长最高可达15秒,并支持3-15秒灵活时长设置。
视频3.0模型功能改进主要包括新增智能分镜系统,增强主体一致性控制,升级音画同步能力,提升文字生成清晰度。视频3.0Omni版本额外支持创建视频主体特征库,可提取3-8秒视频中的角色形象与音色进行还原应用。此次升级涉及多模态指令解析架构优化、音频采样区间调整及特征解耦重组方案。
