苹果新研究：AI如何用文字描述识别你的动作？_知识学习

苹果新研究：AI如何用文字描述识别你的动作？

创始人

2025-11-22 08:04:52

0次

11月22日，科技媒体9to5Mac报道，苹果公司最新研究显示，大语言模型（LLM）能够通过分析音频和运动数据的文本描述来精准识别用户活动，未来有望应用于Apple Watch。这项名为“后期多模态传感器融合”的技术，结合了LLM的推理能力与传统传感器数据，即使在传感器信息不足的情况下，也能准确判断用户正在进行的具体活动。

研究的核心方法是，大语言模型不直接处理用户的原始音频录音或运动数据，而是分析由专门的小型模型生成的文本描述。音频模型会生成描述声音环境的文字，如“水流声”，而基于惯性测量单元（IMU）的运动模型则会输出动作类型的预测文本。这种方式既保护了用户隐私，又验证了LLM在理解和融合多源文本信息以进行复杂推理方面的强大能力。

为验证该方法，研究团队使用了包含数千小时第一人称视角视频的Ego4D数据集，从中筛选出12种日常活动进行测试。结果显示，即使没有任何针对性训练，大语言模型在活动识别任务中的表现也远超随机猜测的水平，其F1分数表现优异。当获得一个参考示例后，模型的准确度还会进一步提升。这项研究表明，利用LLM进行后期融合，可以有效开发出强大的多模态应用，节省额外的内存和计算资源。

上一篇：以下是一些改写“回应民生关切”的方式，你可以根据具体情境和表达需求进行选择：对民生关切予以回应：强调了主动去做、给予回应的动作，突出了积极的态度。针对民生关切作出回应：明确了是针对特定的民生问题进行回应，使回应更具针对性。以回应民生关切为导向：将回应民生关切作为行动的导向，体现了重视民生的理念。对民生关切进行积极回应：强调了回应的积极态度，即主动、认真地对待民生关切。用回应民生关切来体现：表明通过回应民生关切来展现某种价值或态度，突出了回应的重要性。以回应民生关切为己任：将回应民生关切视为自

下一篇：广汽联手宁德时代，埃安A级车将全实现“可充可换”

苹果新研究：AI如何用文字描述识别你的动作？

相关内容

热门资讯