二面：怎么省Claude Code缓存，我说了四点：用Subage，我整理出符合

二面：怎么省Claude Code缓存，我说了四点：用Subage，我整理出符合面试口述节奏的四点答案如下：

第一点：用Subagent隔离可变任务，保护主会话缓存

实际开发中如果把所有任务都放在主会话里，频繁切换模型、加载新MCP、执行临时任务很容易污染全局前缀，直接导致整段缓存全失效。我的处理逻辑是任务分层：主会话只保留稳定的全局规划、长上下文维护、CLAUDE.md配置和固定工具调用；调研、爬虫、编译测试这类临时“脏活”，全部交给Subagent运行。Subagent本身自带默认5分钟TTL和独立缓存，不会改动主会话的前缀，这种优化可以把主会话缓存命中率从30%提升到80%以上，长会话运行越久，成本节省越明显。

第二点：做分层缓存规划，稳定内容放前缀、动态内容只追加

Claude Cache的核心机制是前缀完全匹配，只要前缀改动1个token，整段缓存就会失效，所以我总结了4条可落地的规范：

1. 把系统提示、工具定义、CLAUDE.md这类固定内容放在最开头，一次生成全程不动；
2. 时间、路径、临时状态这类动态信息，绝对不写到前缀里，只在后续对话追加；
3. 文件路径和配置尽量用占位符，避免绝对路径污染前缀；
4. 功能开关不要直接删改前缀段落，用注释占位保持前缀长度一致。
优化后90%的内容都可以稳定缓存，每轮只需要支付10%动态token的成本。

第三点：合理用 /compact + cache_edits ，压缩历史不破坏缓存

很多人会踩一个误区：为了缩减上下文直接删除历史消息，结果改动前缀直接导致缓存失效，反而越删成本越高。正确做法分两步：

1. 用Microcompact搭配 cache_edits ：不需要在本地删消息，通过API指令让服务端隐藏旧的工具调用结果，不会改变前缀hash，缓存也不会中断；
2. 长会话定期调用 /compact ：把早期对话压缩成摘要，但仍然复用原有的系统前缀和工具定义，避免缓存冷启动。
参数上我一般会把压缩后token预算控制在50k左右，单文件压缩不超过5k，平衡成本和可用性。

第四点：做好TTL和模型规划，坚持少切换、长会话选长TTL

TTL根据场景选择就好：如果是5分钟以内一次的高频连续工作，选默认5分钟TTL即可，写入成本更低；如果是跨休息、跨会议的长会话，直接开1小时TTL，订阅版免费，API调用只需要开启 ENABLE_PROMPT_CACHING_1H=1 配置就行。
模型层面要记住两个原则：首先中途绝对不要换模型，Opus、Sonnet、Haiku不同模型的缓存是完全隔离的，换模型就会缓存全失；如果确实需要多模型配合，就用Subagent跑其他模型，主会话固定锁定一个模型即可。

最后面试总结可以直接说：优化Claude Code缓存成本的核心就是四句话：主会话稳定前缀+Subagent隔离脏活+cache_edits安全压缩+合理规划TTL和模型策略，按照这个方案优化后，缓存命中率可以做到80%以上，整体使用成本能直接降低60%~80%。

开源Agent 企业GEO优化 geo优化系统 codex编程 geo优化流程 cpp后端 Xcode技巧

众力资讯网

二面：怎么省Claude Code缓存，我说了四点：用Subage，我整理出符合

热门分类