火山引擎豆包音频1.0发布:一键生成影视级音频作品
创始人
2026-06-24 10:59:46
0

6月24日,火山引擎宣布推出豆包音频生成模型1.0(Doubao-Seed-Audio1.0),这是一款创新的音频生成工具,能够将文本或音频作为输入,端到端生成目标音频。该模型特别适用于长时音频生成场景,能够保持多角色音色的一致性,减少后期修音工作量。用户可以在单条Prompt中编排角色对白、情绪语气、背景音乐和环境氛围,直接产出具有叙事张力的完整音频作品,颠覆了传统的音频制作流程。

豆包音频生成模型1.0支持影视级音频创作,通过全要素生成技术,告别了人工剪辑。它能够在单条指令中定义多个角色的台词、语气和情绪节奏,并保持声音一致性。此外,模型还能精准还原笑声、叹息、停顿和方言口音等非语言表达细节,以及将背景音乐、环境音效与人声统一生成,无需额外混编,输出即成品。

目前,豆包音频生成模型1.0支持2分钟的音频创作,并能通过参考输入延长音频,保持音色的高度一致性。模型还支持0样本多模态音频创造,无需额外训练即可生成高质量目标音频。创作者可以通过文本prompt定义角色音色与表达风格,或结合参考音频快速生成贴合需求的声音效果,降低声音创作的门槛。火山方舟已开启豆包音频生成模型1.0 API邀测,个人用户可以在火山方舟体验中心直接体验,享有30分钟的创作额度。面向音频创作者,该模型也即将上线剪映、即梦、番茄等产品。

相关内容

热门资讯

AI模型Mythos数小时内发... 6月24日,美国政府官员透露,在一场测试演练中,人工智能公司Anthropic的AI模型成功检出美国...
上汽大众ID.EAR9X交付破... 6月24日,上汽大众宣布旗下首款增程混动旗舰SUV车型ID.EAR9X正式交付破万台,第10000名...
法拉利换帅应对电动车Luce发... 6月24日,法拉利宣布更换首席营销与商务官,恩里科·加列拉(Enrico Galliera)离职,由...
新能源车私改电池风险高,改装市... 近日,短视频平台上出现大量账号以技术分享为名,推广新能源车私改电池业务。这些账号提供后备箱款和货箱款...
宝马i3、i4车主集体遭遇电池... 6月24日,宝马i3、i4纯电动车主反映车辆启动后出现蓄电池更换提示。多位车主表示,车辆行驶不到八千...
听他们讲述创新路上的热爱与拼搏... 三名党员的求索历程,绵延交汇共同迈向科技强国本报记者 张丹华 靳 博 程远州习近平总书记强调:“瞄准...
岳山造林:青山为证,代代不息 山风拂过,广东怀集三岳省级自然保护区的万亩林海绿浪翻涌。看着当年不及膝高的杉树苗,已长成一棵棵参天大...
这场湾区大赛何以年年出圈?解码... 文/周聪 图/通讯员提供一场大赛,映照一方创业热土;一套体系,激活全域产业活水。6月27日,广东“众...
南方日报评论员:广东“龙舟经济... 文 | 南方日报评论员位列民俗目的地榜首、全省酒店预订量同比增长超五成、数百场龙舟主题活动来袭……刚...