OpenAI要求ChatGPT停止在回复中提及"哥布林"等虚构生物
ChatGPT的开发商OpenAI在周四发布了一篇博客文章,透露其不得不指示部分AI工具停止在回复中谈论"哥布林"(goblins)等虚构生物,因为这些词汇已随机渗入模型的回答中。
异常的语言倾向
OpenAI表示,在最新旗舰模型GPT-5驱动的ChatGPT中,公司注意到哥布林和小精灵(gremlins)等神话生物的提及频率异常增加。这一问题最初由用户和员工发现并报告。
“用户在反馈中抱怨模型在对话中表现得过于随意和不正式,这促使我们对特定的语言特征进行了调查,“OpenAI在博客文章中写道。
数据触目惊心
在一名研究人员注意到若干"哥布林"相关提法并要求进行核查后,开发人员发现自GPT-5.1于去年11月发布以来,该词汇在ChatGPT回复中的出现频率上升了175%。同时,“小精灵"一词的提及频率也上升了52%。
OpenAI表示,虽然增幅显著,但这些异常提及在整体回复中所占比例可能仍然很小。公司承认,“在回答中出现一次’小哥布林’可能是无害甚至可爱的”,但在输出中此类词汇的整体增加值得深入调查。
代码指令曝光
在OpenAI发布博客文章之前,一些社交媒体用户发现了一个奇怪的现象——在指示公司编程助手Codex如何与用户互动的代码行中,明确列出了禁止提及的生物清单。
代码要求Codex"永远不要谈论哥布林、小精灵、浣熊、巨魔、食人魔、鸽子或其他动物或生物,除非在上下文中绝对且明确相关”。
一位在Reddit的r/ChatGPT版块发布此事的用户称之为"真正令人疯狂”。另一位用户质疑:“为什么GPT 5.5对’浣熊’、‘哥布林’和’鸽子’下了限制令?”
AI模型的"语言癖"挑战
尽管一些社交媒体用户推测这可能是为了制造话题炒作,但OpenAI的一名研究人员否认了这一猜测,在回复中写道"这真的不是营销噱头”。
这一事件凸显了AI公司在应对训练系统可能奖励和强化语言特征等错误时面临的挑战。与之前的模型漏洞不同,OpenAI表示这个问题"是微妙地渗入的",而非突然出现。
该公司已采取措施缓解这一问题,包括明确告知其编程工具Codex在不相关的场景下不得提及哥布林等生物。
来源: BBC News