12月3日,快手旗下的可灵AI宣布推出首个音画同出模型,该技术能够实现单次生成画面、自然语音、匹配音效以及环境氛围,打通音画两个世界。这一创新技术提供了两条创作路径:文生音画,即从一句话生成完整的音视频;图生音画,让静态画面开口说话并动起来。该模型强调“音画由您全盘掌控”,适用于多种场景,包括单人独白、旁白解说、多人对白以及音乐表演。
可灵2.6的音画同出模型能够广泛应用于商品展示、生活Vlog、新闻播报、演讲表达等单人独白场景,以及商品讲解、赛事解说、纪录片、故事叙述等旁白解说场景。此外,它还适用于访谈节目、短剧等多人对白场景,以及唱歌、说唱表演、多人合唱、乐器演奏等音乐表演场景。这一技术的上线,为内容创作者提供了更加丰富和便捷的创作工具,有望推动音视频内容创作的新浪潮。

