Meta发布革命性音频分离技术:一键提取乐队吉他声!
创始人
2025-12-18 00:01:45
0

今日,Meta发布了首个统一的多模态音频分离模型SAMAudio,标志着音频处理技术的新突破。SAMAudio通过自然、多模态的提示简化音频处理,能够从复杂的音频混合中分离出任何声音,无论是通过文本、视觉提示还是时间段标记。该模型的核心是感知编码器视听(PE-AV),基于Meta早先分享的开源感知编码器模型构建,实现先进性能。

SAMAudio提供了三种音频分割方法:文本提示、视觉提示和时间片段提示。文本提示允许用户输入特定声音名称以提取音频,视觉提示则通过在视频中点击发声物体来分离音频,而时间片段提示则允许用户标记目标音频出现的时间段。此外,Meta还发布了SAMAudio-Bench和SAMAudioJudge,分别作为音频分离的基准测试和自动评估模型。

Meta今日还发布了第二个模型——PerceptionEncoderAudiovisual,作为SAMAudio成果的核心引擎。该模型基于Meta四月发布的开源模型MetaPerceptionEncoder构建,将计算机视觉能力扩展到了音频领域。SAMAudio的访问地址为:网页链接。

相关内容

热门资讯

谷歌新推Gemini3Flas... 今日,谷歌宣布推出Gemini3Flash,这款新模型旨在降低使用成本的同时保留旗舰模型的专业级推理...
风浪中的生命接力:深圳海警紧急... 文、图/羊城晚报全媒体记者 侯梦菲 通讯员 王林崴近日,深圳大鹏新区果洲海域上演了一场紧张而温暖的生...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
捷尼赛思G90自刹惊魂:萨维尔... 近日,捷尼赛思在北美市场召回483辆G90旗舰轿车,原因是车辆在无障碍物的情况下会突然自动刹车。问题...
福特暂停电动车型生产,LG新能... 12月17日,LG新能源与福特汽车解除了价值约457亿元人民币的电动汽车电池供应合同。该合同原定于2...
美国车市新风向:皮卡SUV霸榜... 近日,2025年前三季度美国汽车市场销量榜单揭晓,皮卡和SUV车型继续受到消费者青睐。在前十名中,皮...
Meta发布革命性音频分离技术... 今日,Meta发布了首个统一的多模态音频分离模型SAMAudio,标志着音频处理技术的新突破。SAM...
视频丨日本媒体人:高市是个不知... 近期,日本首相高市早苗涉台错误言论在日本国内引起强烈不满。日本《朝日新闻》前记者佐藤章12月16日表...
映宇宙集团执行总裁夏晓晖:扎稳... 文/羊城晚报全媒体记者 沈钊“我们不是来单打独斗的,是来当‘连接器’的。”12月17日,映宇宙集团执...
30岁健美冠军王昆突然去世!曾... 近日,有消息称,曾拿过职业冠军的健美选手王昆去世。今天(12月17日),记者从安徽省健美运动协会了解...