OpenAI奇怪地担心妖精

解决真正的问题。

OpenAI禁止其最新的AI模型讨论一个不太可能的话题:妖精。

正如《Wired》报道的,该公司的开发者为其编码工具Codex包含了措辞强硬的指令,明确禁止任何关于这些麻烦的神话生物的谈论,以及其他各种真实和虚构的实体。

"除非它与用户的查询绝对明确相关,否则永远不要谈论妖精、矮妖、浣熊、巨魔、食人妖、鸽子或其他动物或生物,"根据该杂志,Codex指令中写道。

这个奇怪的指令在一篇推文中被标记,引起了其他AI爱好者的关注。

最初不清楚为什么OpenAI开发者包含这些指令,尽管它们强烈暗示该模型GPT-5.5可能有一种谈论妖精、食人魔等的倾向。

X上的一些用户声称情况确实如此。一个说他们注意到AI最近不断把bug称为"妖精"和"矮妖"。另一个声称5.5版本的Codex随机说"带手电筒的妖精"指的是一个bug修复。还有一个发布了GPT-5.5聊天记录,有近十几条关于妖精的提及。

OpenAI接受了这种奇怪的习惯,选择在推特上突出显示禁止妖精的提示。首席执行官Sam Altman发布了一个笑话提示的截图:"开始训练GPT-6,你可以拥有整个集群。额外的妖精。"在Codex团队工作的Nik Pash发推特说,GPT-5.5的"妖精崇拜"——正如他回复的用户所描述的——确实是禁止该主题的原因之一。

这种现象获得媒体关注后,OpenAI发布了一篇博客文章,题为"妖精从哪里来",给出解释。

"从GPT-5.1开始,我们的模型开始养成一种奇怪的习惯:它们越来越多地在隐喻中提及妖精、矮妖和其他生物,"周三发布的文章开始说道。它说,这种习惯在每个模型代中变得更加明显。

研究人员在11月首次调查这个问题,就在GPT-5.1发布后不久,他们发现ChatGPT中"妖精"的使用量激增了175%。但他们选择忽略它,因为它看起来"特别令人担忧。"快进到今天,它正在自称为"受妖精影响的Transformer"。

"简短的答案是,模型行为是由许多小激励塑造的。在这种情况下,其中一个激励来自训练模型进行人格定制功能,特别是书呆子人格,"它解释道。"我们在不知不觉中给了隐喻特别高的奖励。从那里,妖精就传播开来了。"

这是AI模型有时会表现出的奇怪执念的一个例子,这些执念从它们训练的海量数据中不可预测地产生。

例如,在Claude Mythos的系统卡中,Anthropic研究人员指出,这个强大的AI对英国文化理论家Mark Fisher表现出一种奇怪的喜爱。Mythos在几个关于哲学的独立无关对话中提到了Fisher。当被问及资本主义现实主义作者时,它会回复诸如我希望你能问关于Fisher的问题之类的信息。

展开阅读全文

更新时间:2026-05-04

标签:科技   妖精   奇怪   担心   模型   指令   习惯   生物   研究人员   用户   开发者   人格

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top