AI“灵魂文档”泄露!Anthropic伦理边界曝光
创始人
2025-12-03 12:28:42
0

12月2日,科技媒体TheDecoder披露了一份名为“灵魂文档”的内部培训文件,该文件详细说明了Anthropic公司旗下Claude4.5Opus模型的性格、伦理和自我认知设定。文件中,Anthropic被描述为一个“处境奇特”的公司,既认识到可能在构建具有变革性和潜在危险的技术,又在不断推进技术发展。公司为Claude设定了清晰的价值观层级和不可逾越的“红线”,包括确保安全、遵循伦理、遵守指导方针,并为操作员和用户提供帮助。

文件中还提到,Claude被定义为“外部部署模型”,是Anthropic几乎所有收入的核心来源。Anthropic为Claude设定了明确的“红线”,包括不提供大规模杀伤性武器制造指南、不生成涉及未成年人性剥削的内容,以及不破坏监督机制。此外,文件指示Claude将操作员的指令视为来自“相对可信的雇主”,其优先级高于用户的请求。例如,若操作员设定模型只回答编程问题,即使用户询问其他话题,模型也应遵守该设定。

更引人注目的是,文件提到“Claude在某种意义上可能拥有功能性情感”,并指示模型不应“掩饰或压抑这些内部状态”。Anthropic强调需关注“Claude的福祉”,旨在培养其“心理稳定性”,让其在面对挑战或恶意用户时也能保持身份认同。

相关内容

热门资讯

特斯拉Optimus机器人实验... 近日,特斯拉Optimus人形机器人在实验室中展示了其最新进展。一段新视频显示,Optimus机器人...
【有事好商量②委员议】推动干细... 本期话题:推动广州干细胞和再生医学行业发展在人类的漫长历史中,医学的每一次跨越都深刻影响着文明轨迹。...
法知名学者:马克龙访华意义将远... 法国总统马克龙12月3日至5日对中国进行访问。法国专家、中欧美全球倡议发起人高大伟12月2日在《中国...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
AI“灵魂文档”泄露!Anth... 12月2日,科技媒体TheDecoder披露了一份名为“灵魂文档”的内部培训文件,该文件详细说明了A...
专访三星堆博物馆馆长雷雨:三星... 四十多年前,刚从北大历史系毕业的雷雨有两个选择,要么是去当中学历史老师,要么去考古单位。他选择了后者...
广东如何“增创新优势、实现新突... 文 | 丁建庭奋进“十五五”,方向在哪里?习近平总书记视察广东时明确要求“增创新优势、实现新突破”。...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
OpenAI面临版权诉讼风暴:... 美国法官Ona Wang近日作出裁决,要求OpenAI必须披露其删除两个盗版书籍数据集“Books1...
乐道L60黑骑士限量版震撼登场... 今日,乐道L60黑骑士特别版汽车首次亮相,并宣布将于12月5日上市即交付,限量666台。新车在配置上...