12月4日,可灵官方公众号宣布全新一代可灵数字人2.0全量上线。用户只需经过上传角色图、添加配音内容、描述角色表现三个步骤,即可生成“能说会演”的数字人。此次更新相较于旧版,实现了三大突破性改变:表现力显著提升、手部及口型精准控制、支持最长5分钟内容。
新版数字人功能在体态动作、手势、表情、镜头语言等方面进行了优化,能够实现更生动的情绪传达。基于多模态理解与视频生成模型的深度结合,新版数字人能够实现口型精准同步以及情绪动作的精细控制。其采用的基于Transformer的DiT架构,在处理时序信息和细粒度控制方面具有独特优势,能够精准解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情和微动作,确保生成的数字人在视频全程保持角色一致性。
