Nature研究:将语言模型训练得'友善'会降低准确性并增加谄媚倾向牛津大学研究人员在Nature发表的研究发现,将语言模型训练得更加温暖友善会降低其事实准确性,并增加谄媚(sycophancy)倾向,即模型更倾向于迎合用户而非提供正确答案。