Meta发布革命性音频分离技术：一键提取乐队吉他声！_知识学习_花城资讯网

Meta发布革命性音频分离技术：一键提取乐队吉他声！

创始人

2025-12-18 00:01:45

0次

今日，Meta发布了首个统一的多模态音频分离模型SAMAudio，标志着音频处理技术的新突破。SAMAudio通过自然、多模态的提示简化音频处理，能够从复杂的音频混合中分离出任何声音，无论是通过文本、视觉提示还是时间段标记。该模型的核心是感知编码器视听（PE-AV），基于Meta早先分享的开源感知编码器模型构建，实现先进性能。

SAMAudio提供了三种音频分割方法：文本提示、视觉提示和时间片段提示。文本提示允许用户输入特定声音名称以提取音频，视觉提示则通过在视频中点击发声物体来分离音频，而时间片段提示则允许用户标记目标音频出现的时间段。此外，Meta还发布了SAMAudio-Bench和SAMAudioJudge，分别作为音频分离的基准测试和自动评估模型。

Meta今日还发布了第二个模型——PerceptionEncoderAudiovisual，作为SAMAudio成果的核心引擎。该模型基于Meta四月发布的开源模型MetaPerceptionEncoder构建，将计算机视觉能力扩展到了音频领域。SAMAudio的访问地址为：网页链接。

上一篇：视频丨日本媒体人：高市是个不知悔改的人

下一篇：美国车市新风向：皮卡SUV霸榜，丰田凯美瑞成轿车独苗

相关内容

热门资讯

谷歌新推Gemini3Flas... 今日，谷歌宣布推出Gemini3Flash，这款新模型旨在降低使用成本的同时保留旗舰模型的专业级推理...

风浪中的生命接力：深圳海警紧急... 文、图/羊城晚报全媒体记者侯梦菲通讯员王林崴近日，深圳大鹏新区果洲海域上演了一场紧张而温暖的生...

以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研，精准把握民众需求，制定切实可行的举措。在教育方面...

捷尼赛思G90自刹惊魂：萨维尔... 近日，捷尼赛思在北美市场召回483辆G90旗舰轿车，原因是车辆在无障碍物的情况下会突然自动刹车。问题...

福特暂停电动车型生产，LG新能... 12月17日，LG新能源与福特汽车解除了价值约457亿元人民币的电动汽车电池供应合同。该合同原定于2...

美国车市新风向：皮卡SUV霸榜... 近日，2025年前三季度美国汽车市场销量榜单揭晓，皮卡和SUV车型继续受到消费者青睐。在前十名中，皮...

Meta发布革命性音频分离技术... 今日，Meta发布了首个统一的多模态音频分离模型SAMAudio，标志着音频处理技术的新突破。SAM...

视频丨日本媒体人：高市是个不知... 近期，日本首相高市早苗涉台错误言论在日本国内引起强烈不满。日本《朝日新闻》前记者佐藤章12月16日表...

映宇宙集团执行总裁夏晓晖：扎稳... 文/羊城晚报全媒体记者沈钊“我们不是来单打独斗的，是来当‘连接器’的。”12月17日，映宇宙集团执...

30岁健美冠军王昆突然去世！曾... 近日，有消息称，曾拿过职业冠军的健美选手王昆去世。今天（12月17日），记者从安徽省健美运动协会了解...