谷歌DeepThink升级:AI推理能力飞跃,助力科研工程新突破
创始人
2026-02-13 07:34:00
0

2月13日,谷歌宣布对Gemini3DeepThink进行重大升级,推出专门针对科学、研究与工程场景的“推理模式”,以推动智能技术在科研领域的前沿发展。此次升级由谷歌与各行业科学家、研究人员合作完成,旨在应对科研环境中常见的复杂问题,如缺少清晰边界、未必存在唯一解,以及数据杂乱或不完整等挑战。

升级后的DeepThink在数学、算法与编程等高难推理任务上继续提升表现。在终极人类考试(Humanity'sLastExam)上取得48.4%的成绩;在ARC-AGI-2上达到84.6%,并由ARCPrizeFoundation验证;在Codeforces竞赛编程基准上获得3455的Elo;并在2025年国际数学奥林匹克竞赛(IMO2025)上达到金牌水平表现。此外,新版DeepThink在化学、物理等科学领域也展现出更强的能力,如在2025年国际物理奥林匹克与国际化学奥林匹克的笔试部分取得金牌级结果,同时在理论物理相关的CMT-Benchmark上获得50.5%的得分。

谷歌表示,DeepThink的目标不仅是追求基准测试成绩,更希望推动实际工程与科研应用,例如帮助研究人员解释复杂数据、帮助工程师通过代码对物理系统进行建模。未来,谷歌将持续将DeepThink带到研究人员和实践者“最需要的地方”,并通过GeminiAPI开放早期访问,以促进技术的实际应用和进一步发展。

相关内容

热门资讯

市场监管总局突破测控装备智能化... 5月6日,市场监管总局联合国内科技力量在装备系统智能化领域取得显著进展。研究团队运用自然语言处理和人...
丰田130亿建印度三厂,目标年... 5月6日,丰田汽车宣布在印度西部马哈拉施特拉邦投资约3000亿日元(约合130亿元人民币)新建三座整...
Rivian拟自产激光雷达,C... 近日,美国电动汽车制造商Rivian的CEO RJ·斯卡林奇透露,公司正在考虑自行生产激光雷达传感器...
华为鸿蒙系统升级:小艺帮记新增... 5月6日,华为鸿蒙HarmonyOS 6.1系统对“小艺帮记”功能进行了更新,新增身份验证和同步收藏...
疲劳驾驶酿大祸!男子信辅助驾驶... 5月5日,杭甬高速宁波方向发生一起因驾驶员过度信任辅助驾驶系统而引发的违规停车事件。一辆黑色SUV在...
小米SU7销量破8万!限时权益... 5月6日,小米汽车宣布新一代SU7上市48天以来,锁单量已突破8万台。为庆祝这一成绩,小米汽车推出限...
F1将迎V8引擎回归,2030... 5月6日,国际汽联(FIA)主席穆罕默德·本·苏拉耶姆在迈阿密大奖赛期间宣布,F1计划在2030年左...
Meta被控盗用百万作品训练A... 5月5日,多家出版商联合起诉Meta Platforms,指控其非法使用受版权保护的书籍和期刊文章来...
中国联通车联网卡落地1亿辆汽车... 5月6日,中国联通宣布搭载其车联网卡的第1亿辆汽车正式落地,标志着我国建成全球规模最大的车联网连接基...
岚图董事长卢放:新能源车需创新... 5月6日,岚图汽车科技股份有限公司董事长卢放发表文章,探讨了品牌历史与未来的关系。卢放指出,在各地车...