12月11日,OpenAI推出了ChatGPT-5.2,宣称这是一次“通用智能的重大提升”,并认为它是目前最适合现实世界专业使用的模型,甚至表示这是首个在表现上达到或超过人类专家水平的版本。然而,这一说法很快受到了质疑。在实测为小学生生成一张按英文字母顺序排列的动物挂图时,结果漏洞百出。这一问题最早由BCAResearch首席全球策略师彼得・贝雷津发现。他在11月发布的ChatGPT-5.1上提出同样的指令,模型思考了数秒后生成的内容却只包含25个字母,而标准英文字母表应为26个。
在测试ChatGPT-5.2时,问题依然存在。个别字母对应的动物有所改善,但模型仍只覆盖了24个字母,遗漏了“U”和“Z”,并在“T”之后直接跳到“Y”,对应“Yak”。生成的字母表最终以“X”结束,对应“X-rayfish”,插图却是一只斑马。插图本身也存在明显异常,例如肢体结构怪异的袋鼠、长着两条尾巴的鬣蜥、五官混乱的独角鲸,以及带有猫脸特征的刺猬。在后续提示中,情况并未改善。这一次模型生成了25个字母,“Y”再次取代了“U”,并被解释为“Unicorn”。结尾处出现两个“X”,一个对应“fish”,另一个对应“X-rayfish”,却仍旧使用了一张斑马插图。此外,模型还开始将提示语本身混入生成内容,“Aisforalligator,Bisforbear…”直接出现在海报标题中。

