众力资讯网

【大上下文窗口的营销幻觉与工程自救】 厂商吹嘘的1M甚至2M超长上下文只是营销

【大上下文窗口的营销幻觉与工程自救】

厂商吹嘘的1M甚至2M超长上下文只是营销数字。实际开发中,LLM在超过100k Token后就会进入注意力涣散的“愚蠢区”,也就是上下文腐烂。这种非确定性让很多开发者叫苦,觉得严谨的编程正在退化成靠玄学和运气种地的“园艺活”。

聪明人的破局点在于,不再把LLM当万能复读机,而是把上下文当成极其珍贵的预算。别指望AI的自动压缩,用一个已经降智的会话去总结历史只会得到一堆垃圾。

真正有用的解法是“手动阻断”:用自己写的Markdown规格文档做干净的跨会话交接;或者在工程上做Agent递归,主线程只负责调度,把脏活累活丢给子Agent,用完即焚,绝不污染主空间。对抗非确定性不能靠祈祷,得靠更硬核的工程约束。

garrit.xyz/posts/2026-05-06-dont-trust-large-context-windows