首位“AI科学家”通过图灵测试
创始人
2026-03-30 08:09:44
0

AI生成论文首次通过同行评审,相关研究发表在《自然》杂志上

□克莉斯汀

近日,一款由日本初创公司Sakana AI联合英国牛津大学和加拿大不列颠哥伦比亚大学于2024年开发的自主研究工具“AI科学家”,生成了一篇论文,首次通过了人类专家的同行评审。这意味着,AI工具已能够自主完成从研究构思、实验执行到论文撰写的全流程科研工作。

相关研究结果已发表于3月25日的专业期刊《自然》(Nature)上。

什么是“AI科学家”?

“AI科学家”是一个端到端自动化科学研究全过程的AI系统,由一系列“智能体”(Agent)构成。这些智能体建立在现有的大语言模型之上,它能够自主完成从研究构思到论文发表的整个科研生命周期,包括:一、生成研究想法,在用户指定的机器学习研究子领域中,迭代生成高水平的研究方向和假设;二、执行实验,编写代码、运行实验、可视化结果;三、撰写论文,按照标准机器学习会议论文格式,使用LaTeX模板逐节撰写完整论文;四、进行同行评审,通过自动评审系统评估论文的科学质量。

这个“AI科学家”有两种工作模式:基于模板的模式(使用人类提供的代码模板作为起点)和模板自由的模式(完全自主生成代码并进行更广泛的科学探索)。

提交论文给专家团队审验并发表,只是研究团队为了验证“AI科学家”实际能力的一种实验。

自主完成全部撰写过程

2024年8月,研究团队已在相关平台推出了这位“首个旨在全面自动化科学流程的人工智能工具”——AI科学家(AI scientist)。

2025年4月,该研究团队将完全由“AI科学家”生成的三篇研究论文提交给国际顶级机器学习会议——国际学习表征会议(ICLR)进行同行评审,结果其中一篇成功通过专家评审。研究团队指出,这篇论文从研究想法、编写代码、运行实验、绘制和分析数据,到撰写完整的科学论文,均由“AI科学家”自主完成。

这标志着AI自主研究工具成功通过了科研领域的“图灵测试”(一种判断机器是否具备智能的经典方法,超过30%的人类测试者误认为它是人类,则被视为它通过测试),其产出论文的质量已达到与人类研究者相当的水平。

论文仍存在创新不足等问题

2026年3月25日,研究团队在国际顶尖学术期刊《自然》(Nature)发表了这篇题为《Towards end-to-end automation of AI research》的研究论文。

研究团队表示,如果负责任地开发,“AI科学家”等自主系统能够极大地加速科学发现过程。不过,在正式发表的论文中,研究团队仍谨慎地将关于这一成果的表述,从原预印本的论文中的“全自动化科研”修正为“自动化科研”。专家指出,尽管该系统表现出色,但目前仍局限于计算类研究,且生成的论文创新性不足。但正如研究团队所言,此类AI研究工具的最终定位应是“共同科学家”,旨在让人类从繁琐、单调的实验中解放出来,进而把更多精力用于处理更具创造性的科学难题。

从目前的结果来看,随着AI系统能力的指数级增长和成本的指数级下降,“AI科学家”的性能还有望大幅提升。未来,同样的方法可以应用于其他科学领域,例如自动化化学实验室等。不过,研究团队强调,在科学界建立明确的披露和评估标准前,需要谨慎推进这类AI系统的应用,确保它们被用于促进而非破坏科学诚信。

相关内容

热门资讯

招商银行布局未来:2025年营... 3月30日,招商银行董事长缪建民在2025年度业绩发布会上宣布,招商银行将致力于打造行业内第一家智能...
零跑A10周末订单超9000台... 3月30日,零跑汽车宣布在周末期间订单量超预期,大定超过9000台,其中周六为4394台,周日达到4...
零跑D19旗舰SUV即将上市:... 今日,零跑汽车COO徐军宣布,家族旗舰车型零跑D19将于4月16日正式上市。新车尺寸为5252/19...
科技巨头碳中和目标遇挑战:数据... 3月30日,科技巨头谷歌和微软在实现清洁能源和碳排放目标方面面临挑战。六年前,谷歌承诺到2030年所...
DeepSeek服务瘫痪12小... 3月30日,DeepSeek服务遭遇大规模中断,网页端与App持续瘫痪约12小时。用户报告登录失败、...
国内电动车品牌集体涨价,锂价飙... 国内主流电动两轮车品牌九号、雅迪、台铃、爱玛等计划自4月起对旗下大部分车型上调售价,预计涨幅200-...
smart精灵6号蓝色版征名启... 今日,smart品牌官方揭晓了中型轿车“精灵6号(smart精灵#6EHD)”的蓝色外观,并启动了征...
宝马暂缓增程车型量产,纯电续航... 近日,宝马产品负责人贝恩德·克尔伯在采访中表示,宝马对增程车型持观望态度。尽管技术上可行,但由于现实...
小鹏MONAM03升级上市:智... 今日,小鹏汽车宣布2026款小鹏MONAM03将于4月2日19:30正式上市。本月早些时候,该车型已...
特斯拉FSD技术遭欧洲新车安全... 3月30日,欧洲新车安全评鉴协会(EuroNCAP)技术总监理查德·施拉姆对特斯拉的全自动驾驶(FS...