在持续进行的AI编程挑战赛(AI Coding Contest)中,中国人工智能创业公司月之暗面(Moonshot AI)开发的开源模型Kimi K2.6取得了令人瞩目的成绩——在第12天的"文字宝石拼图"(Word Gem Puzzle)挑战中,Kimi K2.6以22分、7胜1平0负的战绩夺冠。

这次挑战赛的规则颇具创意:参赛模型需要在一个10×10到30×30不等的字母网格中,通过滑动相邻字母来拼出英文单词。7个字母以下的单词会被扣分,7个字母以上的单词按长度计分。每对模型进行五轮比赛,每轮限时10秒。

共有十个模型参赛,结果出乎许多人的预料:

  • 第一名:Kimi K2.6(月之暗面)——22分,7-1-0
  • 第二名:MiMo V2-Pro(小米)——紧随其后
  • 第三名:GPT-5.5
  • 第五名:Claude Opus 4.7

所有来自西方前沿实验室的模型均未能进入前两名。

Kimi K2.6的策略是积极滑动——它采用贪婪算法,每一步都寻找能解锁最多新单词的移动方案。在较小的网格上,这种方法效果一般;但在30×30的大网格上,当其他模型因无法滑动而失去竞争力时,Kimi K2.6持续产出的优势就体现出来了。

值得注意的是,Kimi K2.6是一个开源模型,任何人都可以下载使用。目前它在Artificial Analysis Intelligence Index上得分54,而GPT-5.5为60,Claude为57。虽然尚未完全追平,但差距已经相当小——而且这是来自一个任何人都可以下载的模型。

这一结果标志着AI能力格局的重要变化:一年前,业界普遍认为西方前沿实验室在模型能力上拥有开源模型难以逾越的领先优势。如今,这种差距正在迅速缩小。

来源:ThinkPol - An open-weights Chinese model just beat Claude, GPT-5.5, and Gemini in a programming challenge