
解决真正的问题。
OpenAI禁止其最新的AI模型讨论一个不太可能的话题:妖精。
正如《Wired》报道的,该公司的开发者为其编码工具Codex包含了措辞强硬的指令,明确禁止任何关于这些麻烦的神话生物的谈论,以及其他各种真实和虚构的实体。
"除非它与用户的查询绝对明确相关,否则永远不要谈论妖精、矮妖、浣熊、巨魔、食人妖、鸽子或其他动物或生物,"根据该杂志,Codex指令中写道。
这个奇怪的指令在一篇推文中被标记,引起了其他AI爱好者的关注。
最初不清楚为什么OpenAI开发者包含这些指令,尽管它们强烈暗示该模型GPT-5.5可能有一种谈论妖精、食人魔等的倾向。
X上的一些用户声称情况确实如此。一个说他们注意到AI最近不断把bug称为"妖精"和"矮妖"。另一个声称5.5版本的Codex随机说"带手电筒的妖精"指的是一个bug修复。还有一个发布了GPT-5.5聊天记录,有近十几条关于妖精的提及。
OpenAI接受了这种奇怪的习惯,选择在推特上突出显示禁止妖精的提示。首席执行官Sam Altman发布了一个笑话提示的截图:"开始训练GPT-6,你可以拥有整个集群。额外的妖精。"在Codex团队工作的Nik Pash发推特说,GPT-5.5的"妖精崇拜"——正如他回复的用户所描述的——确实是禁止该主题的原因之一。
这种现象获得媒体关注后,OpenAI发布了一篇博客文章,题为"妖精从哪里来",给出解释。
"从GPT-5.1开始,我们的模型开始养成一种奇怪的习惯:它们越来越多地在隐喻中提及妖精、矮妖和其他生物,"周三发布的文章开始说道。它说,这种习惯在每个模型代中变得更加明显。
研究人员在11月首次调查这个问题,就在GPT-5.1发布后不久,他们发现ChatGPT中"妖精"的使用量激增了175%。但他们选择忽略它,因为它看起来"特别令人担忧。"快进到今天,它正在自称为"受妖精影响的Transformer"。
"简短的答案是,模型行为是由许多小激励塑造的。在这种情况下,其中一个激励来自训练模型进行人格定制功能,特别是书呆子人格,"它解释道。"我们在不知不觉中给了隐喻特别高的奖励。从那里,妖精就传播开来了。"
这是AI模型有时会表现出的奇怪执念的一个例子,这些执念从它们训练的海量数据中不可预测地产生。
例如,在Claude Mythos的系统卡中,Anthropic研究人员指出,这个强大的AI对英国文化理论家Mark Fisher表现出一种奇怪的喜爱。Mythos在几个关于哲学的独立无关对话中提到了Fisher。当被问及资本主义现实主义作者时,它会回复诸如我希望你能问关于Fisher的问题之类的信息。
更新时间:2026-05-04
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号