二元测试与验收反馈回路

二元测试与验收反馈回路

二元测试与验收反馈回路是Agent工程中的核心方法论，指通过构建明确的Pass/Fail测试标准，让Agent能够自主迭代、自我修正的闭环机制。

核心原理

二元断言（Binary Assertions）：构建可以通过脚本自动评估的Pass/Fail检查点，或由另一个专门负责评判的LLM给出明确的Yes/No判断。
自动化评估回路：Agent生成代码 → 运行测试 → 读取失败日志 → 自我反思 → 修改代码。
成功率提升：通过反复试错，Agent可以将成功率从60%提升到90%以上。

为什么重要

在[[ai循环时代]]，人类不再亲自编写代码，而是作为"牧羊人"管理多个Agent。如果没有自动化的验收反馈回路，人类将成为验证Agent产出的瓶颈，无法实现真正的并行化。

实践方法

先搭建测试框架：在开始使用Agent之前，先花时间搭建自动化的测试框架。这是Agent自主迭代的"安全网"。
设计覆盖边界条件的测试用例：测试用例需要覆盖所有边界条件，确保Agent产出的质量。
构建自动化的验收流水线：将测试集成到CI/CD流程中，实现自动化的Pass/Fail判断。
建立错误反馈机制：当测试失败时，将错误堆栈（Stack Trace）直接发给对应的Agent要求重写。

关联概念

该概念与[[verification-and-rework-cost]]（AI生成代码的验证与返工成本）直接相关——完善的验收反馈回路可以显著降低验证成本。同时，它是[[从码农到牧羊人]]范式转移中"测试和验收能力成为新护城河"这一论断的具体方法论支撑。