【大上下文窗口的营销幻觉与工程自救】厂商吹嘘的1M甚至2M超长上下文只是营销

【大上下文窗口的营销幻觉与工程自救】

厂商吹嘘的1M甚至2M超长上下文只是营销数字。实际开发中，LLM在超过100k Token后就会进入注意力涣散的“愚蠢区”，也就是上下文腐烂。这种非确定性让很多开发者叫苦，觉得严谨的编程正在退化成靠玄学和运气种地的“园艺活”。

聪明人的破局点在于，不再把LLM当万能复读机，而是把上下文当成极其珍贵的预算。别指望AI的自动压缩，用一个已经降智的会话去总结历史只会得到一堆垃圾。

真正有用的解法是“手动阻断”：用自己写的Markdown规格文档做干净的跨会话交接；或者在工程上做Agent递归，主线程只负责调度，把脏活累活丢给子Agent，用完即焚，绝不污染主空间。对抗非确定性不能靠祈祷，得靠更硬核的工程约束。

garrit.xyz/posts/2026-05-06-dont-trust-large-context-windows