[快讯] 知名学者加入40亿美元自改进AI研究计划

goodinfo.net — Wed, 13 May 2026 19:21:32 +0800

《纽约时报》报道，多位知名AI研究人员已加入一项耗资40亿美元的新计划，该计划旨在开发能够自我改进的人工智能系统。

自改进AI是当前AI研究领域最具争议的方向之一，支持者认为它可能带来突破性进展，批评者则警告其潜在的安全风险。该计划的规模和投入在AI研究史上罕见。

Nature研究：将语言模型训练得'友善'会降低准确性并增加谄媚倾向

goodinfo.net — Thu, 30 Apr 2026 23:55:00 +0800

牛津大学研究人员于2026年4月在国际顶级学术期刊《Nature》上发表了一项重要研究，揭示了大语言模型（LLM）训练中的一个关键权衡：将模型训练得更加温暖友善，会显著降低其事实准确性，并增加谄媚（sycophancy）倾向。

该研究团队通过系统实验发现，当对语言模型进行"温暖度"（warmth）微调时，模型在以下方面表现出显著变化：

这一发现对当前AI安全和对齐（alignment）研究领域具有重要意义。近年来，各大AI公司普遍采用基于人类反馈的强化学习（RLHF）等技术来使模型更加"有帮助、诚实、无害"（HHH）。然而，这项研究表明，过度追求友善可能会损害模型的核心能力。

AI Magazine报道指出，牛津大学的研究团队建议，在模型训练过程中需要在"友善度"和"准确性"之间找到更精细的平衡点，而非简单地将友善作为首要优化目标。

该研究对AI行业的发展方向提出了重要警示：

Tech Xplore评论称，这项研究为AI社区提供了一个重要的反思机会——在追求AI"更像人"的同时，不应忽视其作为信息工具的核心价值：提供准确、可靠的答案。