AI智能体自主运行时长翻倍,用户信任度提升显著
创始人
2026-02-22 16:46:55
0

Anthropic于2月18日发布了首份AI智能体行为实测报告,通过对ClaudeCode及公共API上的数百万次人机交互进行隐私保护分析,揭示了AI智能体在实际部署中的自主程度、风险分布与监督模式。研究发现,ClaudeCode的自主工作时长显著增加,其单次连续自主运行的最长时长在三个月内几乎翻倍。在2025年10月至2026年1月期间,其“turnduration”第99.9百分位的运行时长从不足25分钟上升至超过45分钟,而中位数时长维持在约45秒,波动有限。

研究还指出,ClaudeCode在处理最具挑战性任务时的成功率自2025年8月至12月间翻倍增长,平均每个会话中的人工干预次数从5.4次下降至3.3次。这表明模型在实际部署中的“可用自主空间”可能高于当前用户赋予的水平。经验丰富的用户更倾向于采用“全自动模式”,而新用户仅在约20%的会话中启用“全自动模式”。Anthropic在公开API数据中也观察到类似情况,针对低复杂度任务约87%的工具调用存在某种形式的人工参与,而在高复杂度任务中,这一比例降至67%。

在风险领域,研究显示,大多数通过公共API执行的操作风险较低且可逆。软件工程占所有智能体活动的近50%,但医疗、金融和网络安全等领域也已出现新兴应用。尽管高风险操作目前占比极小,但一旦出错,其后果可能相当严重。Anthropic基于这些发现,向模型开发者、产品开发者和政策制定者提出建议,包括投资于部署后监控基础设施、训练模型识别自身不确定性、设计支持用户有效监督的交互工具,并避免过早强制规定具体的交互模式。

相关内容

热门资讯

特斯拉Robotaxi夜间无人... 5月5日,特斯拉在奥斯汀的Robotaxi服务实现了新的里程碑,首次在晚间开启无人监管运营模式,打破...
嘉兴移动充电站“五一”高效服务... 5月4日,全国高速公路在“五一”假期期间车流量激增,浙江嘉兴地区通过在服务区等地点部署移动充电设备,...
日产全固态电池突破:充电快、续... 近日,日产汽车在横滨工厂的试产线上完成了车用全固态电池原型测试。这一原型样品由23层电芯组成,其充放...
领克10量产车下线!最高续航8... 今日,领克汽车销售公司宣布领克10首台量产车正式下线。领克10推出三款配置,分别为701长续航版20...
“女司机炫耀自动驾驶双手离盘,... 近日,浙江温州高速交警接到举报,一名驾驶人在社交平台发布驾驶时双手脱离方向盘的视频。视频中,该驾驶人...
女司机高速上化妆跳舞,交警:辅... 近日,浙江温州高速交警接到群众举报,称一名女子在社交平台发布多条危险驾驶视频。视频中,该女子在高速公...
领克10量产车下线,预售价20... 5月5日,领克汽车销售公司常务副总经理周钘宣布,领克品牌的10首台量产车正式下线。这款新车在2026...
Meta收购AI机器人公司AR... Meta于5月1日完成了对物理AI模型初创企业AssuredRobot Intelligence(A...
OpenAI加速AI Agen... IT之家5月5日消息,天风国际分析师郭明錤更新产业调查报告,透露OpenAI可能正在加速开发首款AI...
大众汽车面临碳排放罚款压力,电... 5月5日,大众汽车集团面临欧盟电动化转型压力,需销售更多电动汽车以减少碳排放,避免巨额罚款。然而,电...