OpenAI ChatGPT-5.2翻车:小学生挂图测试漏洞百出
创始人
2025-12-20 17:34:55
0

12月11日,OpenAI推出了ChatGPT-5.2,宣称这是一次“通用智能的重大提升”,并认为它是目前最适合现实世界专业使用的模型,甚至表示这是首个在表现上达到或超过人类专家水平的版本。然而,这一说法很快受到了质疑。在实测为小学生生成一张按英文字母顺序排列的动物挂图时,结果漏洞百出。这一问题最早由BCAResearch首席全球策略师彼得・贝雷津发现。他在11月发布的ChatGPT-5.1上提出同样的指令,模型思考了数秒后生成的内容却只包含25个字母,而标准英文字母表应为26个。

在测试ChatGPT-5.2时,问题依然存在。个别字母对应的动物有所改善,但模型仍只覆盖了24个字母,遗漏了“U”和“Z”,并在“T”之后直接跳到“Y”,对应“Yak”。生成的字母表最终以“X”结束,对应“X-rayfish”,插图却是一只斑马。插图本身也存在明显异常,例如肢体结构怪异的袋鼠、长着两条尾巴的鬣蜥、五官混乱的独角鲸,以及带有猫脸特征的刺猬。在后续提示中,情况并未改善。这一次模型生成了25个字母,“Y”再次取代了“U”,并被解释为“Unicorn”。结尾处出现两个“X”,一个对应“fish”,另一个对应“X-rayfish”,却仍旧使用了一张斑马插图。此外,模型还开始将提示语本身混入生成内容,“Aisforalligator,Bisforbear…”直接出现在海报标题中。

相关内容

热门资讯

比亚迪云辇-PUltra闪充混... 今日,方程豹宣布比亚迪云辇-PUltra暨方程豹豹8、豹5闪充版将于5月13日19:00正式发布,定...
吉利博越十周年冠军版上市,8.... 今日,吉利汽车宣布全新博越十周年冠军版正式上市,指导价为9.69万元,限时优惠价8.79万元。为庆祝...
AI“勒索”高管?Anthro... 5月9日,Anthropic公司就其AI模型ClaudeSonnet3.6在实验中表现出的勒索行为给...
五菱星光730销量破45000... 五菱汽车今日宣布,星光730累计销量突破45000台,连续六个月成为15万内MPV销量冠军。该车型于...
红旗H5焕新登场,HQ9插混版... 5月9日,一汽红旗宣布,2026款红旗H5和红旗HQ9将于5月20日正式上市。新款红旗H5主要针对外...
吉利汽车2025年销量突破30... 吉利汽车近日发布2025年环境、社会及管治(ESG)报告,显示公司在减碳和新能源汽车领域取得显著进展...
比亚迪海狮07获欧盟Green... 5月9日,比亚迪宣布旗下海狮07荣获欧盟GreenNCAP2025年度最佳大型SUV称号,这是对其环...
小米“寻天”SUV曝光:202... 近日,国家知识产权局中国商标网信息显示,小米科技有限责任公司自2025年8月起申请注册了多枚“寻天”...
沙溢胡可喜提蔚来乐道L90,2... 今日,蔚来旗下乐道汽车宣布2026款乐道L90正式开启全国交付。知名演员沙溢&胡可一家增购2026款...
字节跳动AI投资增至2000亿... 今日,《南华早报》报道称,字节跳动今年已将AI基础设施计划支出提高25%,达到2000亿元人民币。在...