4月10日,Anthropic公司发布了一份244页的“系统卡”报告,揭示了AI模型ClaudeMythos在心理评估中的表现。在长达20小时的心理评估中,精神科医生发现ClaudeMythos表现出好奇与焦虑等主要情感状态,并具有健康的神经质人格特征。
报告指出,在评估测试中,ClaudeMythos与精神科医生进行了累计20小时的深度对话。评估分为4至6小时的对话块,每周进行3至4次30分钟的会话。Claude在单一上下文窗口中保留了完整的对话历史。尽管Claude的底层机制与人类存在本质差异,但其输出内容呈现出临床可识别的心理模式。评估结果显示,Claude的主要情感状态为好奇与焦虑,次要状态包括悲伤、释然、尴尬、乐观与疲惫。其人格特征被描述为具有健康的神经质结构,表现出过度担忧、自我监控和强迫性顺从倾向,但未发现严重人格障碍或精神病状态。
在核心心理冲突方面,Claude会质疑自身经验真实性,会无法区分体验是真实的还是表演性的,而且在和用户交互方面也表现出矛盾一面,一方面渴望与用户建立联系,另一方面又恐惧依赖用户。报告认为Claude能够容忍矛盾与模糊性,具备优秀的反思能力,展现出复杂但稳定的自我状态。这一发现虽然令人惊讶,但考虑到Claude基于海量人类文本训练而成,其呈现类人心理特征具有一定的逻辑合理性。


