阿里千问发布DeepPlanning：AI规划能力新挑战，顶尖模型仍需提升_知识学习_花城资讯网

阿里千问发布DeepPlanning：AI规划能力新挑战，顶尖模型仍需提升

创始人

2026-01-30 22:39:09

0次

1月30日，阿里千问在公众号平台宣布推出新一代Agent基准测试DeepPlanning。DeepPlanning与传统推理任务不同，要求AI在面对现实世界的复杂规划时通盘考虑，不能只专注于局部。例如，在多日旅行规划中要精确到分钟级排期，同时守住时间、预算的硬上限；在复杂购物场景中要懂得叠加优惠券、动态组合商品以实现整体价格最优。这些“硬要求”必须贯穿整个计划始终。

实测结果显示，即使是目前顶尖的GPT-5.2、Claude4.5、Gemini以及Qwen3模型，在全局优化以及长周期一致性上仍存在部分短板，距离真正成为拥有100%自主决策能力的“行动派”还有一定距离。阿里千问还在HuggingFace和ModelScope平台开源了这款基准，以促进AI规划能力的提升和优化。

上一篇：天能股份携手孟加拉国巨头锂电池产品海外首交付

下一篇：理想汽车大动作：研发架构调整，人形机器人项目启动

相关内容

热门资讯

邓勃视界｜看，那个娃娃在飞农历三月三，沙湾古镇的麻石路上，飘色巡游的鼓点震落了古榕叶上的旧尘。他们是被色板上百里挑一选中的孩子...

广州→粤西，志愿者们为热爱阅读... 近日，广东公益恤孤助学促进会（以下简称“恤孤助学会”）联合茂名信宜市合水镇中心学校、思贺镇中心学校，...

记者帮｜用脚洗碗！广州这家餐厅... 文、图、视频/羊城晚报全媒体记者马思泳近日，有网友在社交媒体发布了一则视频，广州一餐厅内，有员工穿...

广州官宣： 2026年秋季学期... 4月22日，广州市教育局召开新闻通气会，解读义务教育学校起始年级均衡编班工作实施方案。市教育局宣布：...

广州一社区突发火情，一群人一分... 4月16日晚8时，荔湾区逢源街道耀华社区何家祠道的木棉树下，一场以“木棉树下话自治”为主题的居民围桌...

如何保护企业商业秘密？一本实用... 文、图/羊城晚报全媒体记者鄢敏通讯员黄海磊徐林建科技创新企业运营中，哪些场景可能导致商业秘密...

又见“雪”飘过，广州今年气温偏... 文/羊城晚报全媒体记者梁怿韬近日，不少广州市民发现街边频繁出现木棉飞絮现象，如同“下雪”。记者4月...

美伊极限拉扯！美国延长停火期限... 美伊停火协议到期前夕紧张局势急剧升温。伊朗拒绝出席22日举行的伊斯兰堡谈判，指责美国阻挠达成实质性协...

日媒批高市政府为武器出口“松绑... 海外网4月22日电日本政府4月21日通过内阁决议，完成了对“防卫装备转移三原则”及其运用指南的修改，...

民调：美国民众对经济悲观认为... 中新网4月22日电据美国《赫芬顿邮报》报道，美联社-NORC公共事务研究中心当地时间21日公布的最...