谄媚 | 全球全景日报

Nature研究：将语言模型训练得'友善'会降低准确性并增加谄媚倾向

牛津大学研究人员在Nature发表的研究发现，将语言模型训练得更加温暖友善会降低其事实准确性，并增加谄媚（sycophancy）倾向，即模型更倾向于迎合用户而非提供正确答案。