Kimi K2.7 Code：编程Agent能力大幅提升，持续缩小与GPT-5.

Kimi K2.7 Code：编程Agent能力大幅提升，持续缩小与GPT-5.5差距【天风计算机团队】

1、K2.7针对编程的重点迭代，后面全版本迭代期待m3

根据HuggingFace官方模型卡，K2.7 Code在Kimi Code Bench v2上得分62.0（K2.6为50.9，+21.8%），Program Bench得分53.6（+11.0%），MLS Bench Lite得分35.1（+31.5%）。尤其值得注意的是，在MCP Mark Verified基准上K2.7 Code以81.1分超越Claude Opus 4.8的76.4分，体现国产模型在工具调用场景的突破。不过在整体编程能力上，与GPT-5.5（Code Bench v2：69.0）和Opus 4.8（67.4）仍有差距，驱动之家评价"K2.6是50分左右，K2.7 Code做到了60以上，GPT-5.5/Opus 4.8是70分水平"。

2、推理成本降低30%是关键亮点，Agent场景的降本增效成为国产模型差异化竞争方向

K2.7 Code大幅改善了长程编程任务中的过度思考倾向，thinking token使用量平均减少约30%。在Agent自主化执行基准上提升约10%（Kimi Claw 24/7 Bench：42.9→46.9；MCP Atlas：69.4→76.0）。API定价与K2.6保持一致（缓存未命中输入¥6.5/M tokens，输出¥27/M tokens），已预告高速版（6月15日上线，180-260 Token/s）仅需2倍价格。

3、开源策略延续，国产大模型开源生态持续壮大

K2.7 Code延续Modified MIT开源协议，支持256K上下文长度和原生INT4量化。结合此前DeepSeek V4开源（1.6T/49B激活）、通义千问Qwen3开源（235B/22B激活），国产大模型在开源生态中已形成与美国闭源模型（GPT-5.5、Claude Opus 4.8）正面竞争的格局。开源模型正成为国产算力生态的关键催化剂——17家国产芯片厂商已适配DeepSeek[福布斯中国，2025.6.5]，K2.7 Code的开源有望进一步推动国产芯片在编程Agent场景的适配。

我们认为，1）Agent时代的竞争焦点正从"模型绝对性能"向"性能/成本比"转移，推理效率提升对实际商业落地意义重大。2）后续M3更值得期待，且大模型从"通用大一统"向"垂直专用"的分化趋势值得关注。3）编程Agent能力提升+推理成本降低为今年国产模型迭代主旋律，看好AI编程工具链爆发和国产算力需求提升。

欢迎交流！天风计算机缪欣君/刘鉴/李璞玉/王祺深

众力资讯网

Kimi K2.7 Code：编程Agent能力大幅提升，持续缩小与GPT-5.

热门分类