OpenAI要求ChatGPT停止在回复中提及'哥布林'等虚构生物

OpenAI要求ChatGPT停止在回复中提及"哥布林"等虚构生物

ChatGPT的开发商OpenAI在周四发布了一篇博客文章，透露其不得不指示部分AI工具停止在回复中谈论"哥布林"（goblins）等虚构生物，因为这些词汇已随机渗入模型的回答中。

OpenAI表示，在最新旗舰模型GPT-5驱动的ChatGPT中，公司注意到哥布林和小精灵（gremlins）等神话生物的提及频率异常增加。这一问题最初由用户和员工发现并报告。

“用户在反馈中抱怨模型在对话中表现得过于随意和不正式，这促使我们对特定的语言特征进行了调查，“OpenAI在博客文章中写道。

在一名研究人员注意到若干"哥布林"相关提法并要求进行核查后，开发人员发现自GPT-5.1于去年11月发布以来，该词汇在ChatGPT回复中的出现频率上升了175%。同时，“小精灵"一词的提及频率也上升了52%。

OpenAI表示，虽然增幅显著，但这些异常提及在整体回复中所占比例可能仍然很小。公司承认，“在回答中出现一次’小哥布林’可能是无害甚至可爱的”，但在输出中此类词汇的整体增加值得深入调查。

在OpenAI发布博客文章之前，一些社交媒体用户发现了一个奇怪的现象——在指示公司编程助手Codex如何与用户互动的代码行中，明确列出了禁止提及的生物清单。

代码要求Codex"永远不要谈论哥布林、小精灵、浣熊、巨魔、食人魔、鸽子或其他动物或生物，除非在上下文中绝对且明确相关”。

一位在Reddit的r/ChatGPT版块发布此事的用户称之为"真正令人疯狂”。另一位用户质疑：“为什么GPT 5.5对’浣熊’、‘哥布林’和’鸽子’下了限制令？”

尽管一些社交媒体用户推测这可能是为了制造话题炒作，但OpenAI的一名研究人员否认了这一猜测，在回复中写道"这真的不是营销噱头”。

这一事件凸显了AI公司在应对训练系统可能奖励和强化语言特征等错误时面临的挑战。与之前的模型漏洞不同，OpenAI表示这个问题"是微妙地渗入的"，而非突然出现。

该公司已采取措施缓解这一问题，包括明确告知其编程工具Codex在不相关的场景下不得提及哥布林等生物。

来源: BBC News