OpenAI奇怪地担心妖精

解决真正的问题。

OpenAI禁止其最新的AI模型讨论一个不太可能的话题：妖精。

正如《Wired》报道的，该公司的开发者为其编码工具Codex包含了措辞强硬的指令，明确禁止任何关于这些麻烦的神话生物的谈论，以及其他各种真实和虚构的实体。

"除非它与用户的查询绝对明确相关，否则永远不要谈论妖精、矮妖、浣熊、巨魔、食人妖、鸽子或其他动物或生物，"根据该杂志，Codex指令中写道。

这个奇怪的指令在一篇推文中被标记，引起了其他AI爱好者的关注。

最初不清楚为什么OpenAI开发者包含这些指令，尽管它们强烈暗示该模型GPT-5.5可能有一种谈论妖精、食人魔等的倾向。

X上的一些用户声称情况确实如此。一个说他们注意到AI最近不断把bug称为"妖精"和"矮妖"。另一个声称5.5版本的Codex随机说"带手电筒的妖精"指的是一个bug修复。还有一个发布了GPT-5.5聊天记录，有近十几条关于妖精的提及。

OpenAI接受了这种奇怪的习惯，选择在推特上突出显示禁止妖精的提示。首席执行官Sam Altman发布了一个笑话提示的截图："开始训练GPT-6，你可以拥有整个集群。额外的妖精。"在Codex团队工作的Nik Pash发推特说，GPT-5.5的"妖精崇拜"——正如他回复的用户所描述的——确实是禁止该主题的原因之一。

这种现象获得媒体关注后，OpenAI发布了一篇博客文章，题为"妖精从哪里来"，给出解释。

"从GPT-5.1开始，我们的模型开始养成一种奇怪的习惯：它们越来越多地在隐喻中提及妖精、矮妖和其他生物，"周三发布的文章开始说道。它说，这种习惯在每个模型代中变得更加明显。

研究人员在11月首次调查这个问题，就在GPT-5.1发布后不久，他们发现ChatGPT中"妖精"的使用量激增了175%。但他们选择忽略它，因为它看起来"特别令人担忧。"快进到今天，它正在自称为"受妖精影响的Transformer"。

"简短的答案是，模型行为是由许多小激励塑造的。在这种情况下，其中一个激励来自训练模型进行人格定制功能，特别是书呆子人格，"它解释道。"我们在不知不觉中给了隐喻特别高的奖励。从那里，妖精就传播开来了。"

这是AI模型有时会表现出的奇怪执念的一个例子，这些执念从它们训练的海量数据中不可预测地产生。

例如，在Claude Mythos的系统卡中，Anthropic研究人员指出，这个强大的AI对英国文化理论家Mark Fisher表现出一种奇怪的喜爱。Mythos在几个关于哲学的独立无关对话中提到了Fisher。当被问及资本主义现实主义作者时，它会回复诸如我希望你能问关于Fisher的问题之类的信息。

展开阅读全文

更新时间：2026-05-04

标签：科技妖精奇怪担心模型指令习惯生物研究人员用户开发者人格

1 2 3 4 5

OpenAI奇怪地担心妖精

5月1日起，短信大调整！所有手机用户注意，全国同步执行

DeepMind CEO 万字硬核访谈：当前 AI 只是“前菜”，物理 AI 与具身智能才是未来

科学家用人工智能方法解决了科学界最难的数学问题之一

济南蒙了，青岛费解，淄博怎么就成了“宇宙烧烤中心”？

印度人：如果中国真比印度发达，为何中国城市大街看不到突突车？

2026年5月起！若不出意外，中国房价、楼市可能迎来“四大转变”

2026-2027年：手握现金，等待1万变10万的机会

美股市值破75万亿，别被牛市骗了：75万亿背后，只有AI在涨！

钦州暴雨敲响生死警钟：跳出零和博弈以消费者所有制共赴人类新生

A股：突发利好！节后这一板块将要迎来结构性大涨

阚清子，其实挺惨的！

北影节落幕！3人上桌，2人出尽风头，1人镀金成功，唯他被骂惨

福原爱生下3胎仅24小时，恶心一幕出现，丈夫是此前"出轨门"男主

叶珂被路人拍到了最真实的照片，容貌又变化了，整成低配版唐嫣

韩庚突然秃了，全网都在猜他病了没，可没人问他累不累。

5月1日起，短信大调整！所有手机用户注意，全国同步执行

毛岸青与邵华结婚9年迟迟不育，毛泽东得知怀孕后，既惊喜

终于有人管了！5月1日起，工信部新规：未经用户同意禁止发送

从被封锁到反超！德国研究揭示真相：中国正全线冲击美国科

炸穿A股半导体圈！千亿龙头闻泰科技一夜披星戴帽踩爆退

出乎黄仁勋的预料？美系科技公司集体造反，英伟达危机四伏

恐龙“出没”，注意！到青岛科技馆，开启“寻龙”科普奇遇

中美科技战开打！美国再下黑手，断供中国芯片龙头，中方强硬

美国科技七巨头联手，准备打造智能AI大军，未来战场格局变

科技股猛涨，道指却跌了，市场到底在信谁？