苹果新研究:AI如何用文字描述识别你的动作?
创始人
2025-11-22 08:04:52
0

11月22日,科技媒体9to5Mac报道,苹果公司最新研究显示,大语言模型(LLM)能够通过分析音频和运动数据的文本描述来精准识别用户活动,未来有望应用于Apple Watch。这项名为“后期多模态传感器融合”的技术,结合了LLM的推理能力与传统传感器数据,即使在传感器信息不足的情况下,也能准确判断用户正在进行的具体活动。

研究的核心方法是,大语言模型不直接处理用户的原始音频录音或运动数据,而是分析由专门的小型模型生成的文本描述。音频模型会生成描述声音环境的文字,如“水流声”,而基于惯性测量单元(IMU)的运动模型则会输出动作类型的预测文本。这种方式既保护了用户隐私,又验证了LLM在理解和融合多源文本信息以进行复杂推理方面的强大能力。

为验证该方法,研究团队使用了包含数千小时第一人称视角视频的Ego4D数据集,从中筛选出12种日常活动进行测试。结果显示,即使没有任何针对性训练,大语言模型在活动识别任务中的表现也远超随机猜测的水平,其F1分数表现优异。当获得一个参考示例后,模型的准确度还会进一步提升。这项研究表明,利用LLM进行后期融合,可以有效开发出强大的多模态应用,节省额外的内存和计算资源。

相关内容

热门资讯

广州车展新车大爆发,零跑A10... 今日,2025广州车展盛大开幕,展会规模达22万平方米,乘用车共设13个展馆。本届车展上,众多新能源...
3年内新增3位院士 这家医院何... 文/羊城晚报全媒体记者 陈辉图/医院提供11月21日,当两院院士增选结果揭晓时,中山大学肿瘤防治中心...
实现全线贯通! 广州机场第二高... 从天河、黄埔等广州城区前往白云机场的车程缩短至30分钟羊城晚报讯 记者严艺文、通讯员章杨杨报道:11...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
广汽联手宁德时代,埃安A级车将... 11月21日,广汽集团在广州车展期间宣布,将与宁德时代展开全方位合作,共同推进换电技术的发展。广汽集...
苹果新研究:AI如何用文字描述... 11月22日,科技媒体9to5Mac报道,苹果公司最新研究显示,大语言模型(LLM)能够通过分析音频...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...