众力资讯网

Kimi K2.7 Code:编程Agent能力大幅提升,持续缩小与GPT-5.

Kimi K2.7 Code:编程Agent能力大幅提升,持续缩小与GPT-5.5差距【天风计算机团队】

1、K2.7针对编程的重点迭代,后面全版本迭代期待m3

根据HuggingFace官方模型卡,K2.7 Code在Kimi Code Bench v2上得分62.0(K2.6为50.9,+21.8%),Program Bench得分53.6(+11.0%),MLS Bench Lite得分35.1(+31.5%)。尤其值得注意的是,在MCP Mark Verified基准上K2.7 Code以81.1分超越Claude Opus 4.8的76.4分,体现国产模型在工具调用场景的突破。不过在整体编程能力上,与GPT-5.5(Code Bench v2:69.0)和Opus 4.8(67.4)仍有差距,驱动之家评价"K2.6是50分左右,K2.7 Code做到了60以上,GPT-5.5/Opus 4.8是70分水平"。

2、推理成本降低30%是关键亮点,Agent场景的降本增效成为国产模型差异化竞争方向

K2.7 Code大幅改善了长程编程任务中的过度思考倾向,thinking token使用量平均减少约30%。在Agent自主化执行基准上提升约10%(Kimi Claw 24/7 Bench:42.9→46.9;MCP Atlas:69.4→76.0)。API定价与K2.6保持一致(缓存未命中输入¥6.5/M tokens,输出¥27/M tokens),已预告高速版(6月15日上线,180-260 Token/s)仅需2倍价格。

3、开源策略延续,国产大模型开源生态持续壮大

K2.7 Code延续Modified MIT开源协议,支持256K上下文长度和原生INT4量化。结合此前DeepSeek V4开源(1.6T/49B激活)、通义千问Qwen3开源(235B/22B激活),国产大模型在开源生态中已形成与美国闭源模型(GPT-5.5、Claude Opus 4.8)正面竞争的格局。开源模型正成为国产算力生态的关键催化剂——17家国产芯片厂商已适配DeepSeek[福布斯中国,2025.6.5],K2.7 Code的开源有望进一步推动国产芯片在编程Agent场景的适配。

我们认为,1)Agent时代的竞争焦点正从"模型绝对性能"向"性能/成本比"转移,推理效率提升对实际商业落地意义重大。2)后续M3更值得期待,且大模型从"通用大一统"向"垂直专用"的分化趋势值得关注。3)编程Agent能力提升+推理成本降低为今年国产模型迭代主旋律,看好AI编程工具链爆发和国产算力需求提升。

欢迎交流!天风计算机 缪欣君/刘鉴/李璞玉/王祺深