Kimi K2.7 Code 开源:代码基准全面提升,token 消耗降 30%

K2.7 Code 解决的核心问题

K2.6 的长程编程任务有两个痛点:指令遵循在长上下文中衰减,以及过度思考导致 token 浪费。K2.7 Code 针对这两个问题做了定向优化——指令遵循能力提升,平均 token 消耗减少 30%。

Kimi K2.7 Code 发布并开源

基准测试表现

代码能力方面,K2.7 Code 相比 K2.6 全面提升:Kimi Code Bench v2 提升 21.8%(50.9 → 62.0),Program-Bench 提升 11%(48.3 → 53.6),MLS Bench Lite 提升 31.5%(26.7 → 35.1)。

但和闭源模型相比仍有差距。GPT-5.5 在 Kimi Code Bench v2(69.0)和 Program-Bench(69.1)上领先,Opus 4.8 在 MLS Bench Lite(42.8)上最高。K2.7 Code 的定位是开源模型中的编程专精方向,不是全面超越闭源模型。

Coding + Agents 基准对比

Agent 能力跟随代码能力同步提升。Kimi Claw 24/7 Bench 提升 9.1%,MCP Atlas 提升 9.5%,MCP Mark Verified 提升 11.5%。GPT-5.5 在 MCP Mark Verified 上拿到了 92.9 的全场最高分,Agent 场景仍是闭源模型的优势领域。

Token 效率

K2.7 Code 的一个实际价值在于 token 效率。在 Program-Bench 上,K2.6 需要 175k token 达到 48.3% 的性能,K2.7 Code 只需要 100k token 就达到 53.6%——性能更高、消耗更少。

K2.7 Code vs K2.6 性能与 Token 消耗对比

可用性和定价

K2.7 Code 已在 Kimi API 开放平台和 Kimi Code 上线。定价与 K2.6 一致:1M token 输入 6.5 元、输出 27 元,命中缓存的输入价格调整为 1.3 元。模型权重开源在 HuggingFace,支持本地部署。

需要注意:K2.7 Code 必须开启思考模式(Thinking)才能发挥最佳性能,关闭后会回退到 K2.6。非编程任务仍推荐 K2.6。

6 倍速版本

6 月 15 日上线高速版,输出速度约 180 Token/s(短上下文可达 260 Token/s),价格是普通版的 2 倍。高速版在 Kimi Code Plan 中消耗 3 倍用量。

来源:月之暗面 Kimi 公众号

相关推荐