上下文预算
上下文预算是指管理 AI 模型上下文窗口的艺术,是 [[Boris Cherny]] 反复强调的效率关键。上下文窗口是有限的资源,必须精打细算,保持高效。
核心原则
- 上下文是核心资源:上下文窗口有限,必须精打细算。
- 50% 阈值:上下文使用超过 50% 应立即压缩。
- 避免 agent dumb zone:上下文超 50% 时,Claude 的推理能力会显著下降。
管理方法
/compact命令:上下文超 50% 立即使用,压缩上下文。/clear命令:手动重置上下文,开始新会话。/resume命令:重命名重要会话并恢复。context: fork:在隔离子代理运行 Skill,主上下文只见最终结果。- 子代理:将任务卸载,保持主上下文干净。
- CLAUDE.md 控制在 200 行以内:避免上下文被无关规则占用。
相关概念
- [[claude-dot-md]] — 行为守则配置文件,上下文预算的关键组成部分
- [[agentic-engineering]] — 结构化 AI 编程方法论
- [[context-engineering]] — 上下文工程技术
- [[skills-claude-code]] — 技能插件系统,支持
context: fork