Meta发布革命性音频分离技术:一键提取乐队吉他声!
创始人
2025-12-18 00:01:45
0

今日,Meta发布了首个统一的多模态音频分离模型SAMAudio,标志着音频处理技术的新突破。SAMAudio通过自然、多模态的提示简化音频处理,能够从复杂的音频混合中分离出任何声音,无论是通过文本、视觉提示还是时间段标记。该模型的核心是感知编码器视听(PE-AV),基于Meta早先分享的开源感知编码器模型构建,实现先进性能。

SAMAudio提供了三种音频分割方法:文本提示、视觉提示和时间片段提示。文本提示允许用户输入特定声音名称以提取音频,视觉提示则通过在视频中点击发声物体来分离音频,而时间片段提示则允许用户标记目标音频出现的时间段。此外,Meta还发布了SAMAudio-Bench和SAMAudioJudge,分别作为音频分离的基准测试和自动评估模型。

Meta今日还发布了第二个模型——PerceptionEncoderAudiovisual,作为SAMAudio成果的核心引擎。该模型基于Meta四月发布的开源模型MetaPerceptionEncoder构建,将计算机视觉能力扩展到了音频领域。SAMAudio的访问地址为:网页链接。

相关内容

热门资讯

上汽MG07轿跑新车型亮相:纯... 5月9日,工信部发布了第407批《道路机动车辆生产企业及产品公告》新产品公示,其中上汽集团的MG07...
比亚迪海狮08震撼登场:全球首... 今日,比亚迪在第407批《道路机动车辆生产企业及产品公告》新产品公示列表中,推出了其首款闪充插混SU...
吉利汽车拟购福特西班牙产线 欧... 近日,西班牙行业媒体《LaTribunadeAutomoción》报道称,吉利汽车(00175.HK...
大众ID.ERA系列首款轿车亮... 5月9日,工信部发布了第407批《道路机动车辆生产企业及产品公告》新产品公示,其中上汽大众ID.ER...
华为技术加持!东风奕派M8大六... 今日,东风奕派发布了奕派M8的最新预告图,这款大六座SUV搭载了华为乾崑技术,预计将于本月亮相。奕派...
星火成炬 沃野新篇|路虽遥 行... 当一条条路如大地的脉络联通人间烟火,也如一把把利剑斩断深山阻隔,乡愁有了安稳归途,乡土有了振兴出路。
粤超草根球员群像:五金店老板、... “当茂名进球后,屏幕上出现队标,还写着‘入波嗲’,又开心又感动!”5月3日,粤超茂名队主场迎战湛江队...
南方日报评论员:以“五大行动”... 文丨南方日报评论员“百县千镇万村高质量发展工程”是广东破解城乡区域发展不平衡难题的关键抓手,在全省发...
香港海关侦破两宗毒品案件,查获... 文、图/羊城晚报全媒体记者 鄢敏5月8日晚,香港特区政府新闻网公布侦破两宗毒品案件相关情况。据新闻公...
【图解】“五一”遇春假,全场景... 内容来源:经济日报文案/设计:景远策划:刘江校对:石兰审核:张厚为