在为期 12 天的 AI 编程竞赛中,中国初创公司 Moonshot AI 的开源模型 Kimi K2.6 以 22 个比赛积分(7胜1平0负)夺冠,击败了 OpenAI 的 GPT-5.5(第三名)和 Anthropic 的 Claude Opus 4.7(第五名)。小米的 MiMo V2-Pro 获得第二名,智谱 AI 的 GLM 5.1 排名第四。
比赛项目为 Word Gem Puzzle,一种滑动字母拼图。Kimi 采用贪婪策略,优先选择能解锁高价值单词的移动,在 30×30 的大棋盘上表现尤为突出。Nvidia 的 Nemotron Super 3 因代码语法错误未能参赛,实际有 9 个模型参与竞争。
看英文原文 →