Loop Engineering 简介 文章目录0.前言1.什么是 Loop Engineering2.核心理念转变3.Loop Engineering 的六大核心模块4.关键设计模式分离“生成者”与“验证者”5.一个典型的Loop工作流示例6.Loop Engineering 的三个层次7.Harness Loop完整的工作流体系8.Loop Engineering 的三个必须警惕的问题9.小结参考文献0.前言最近AI 圈的新概念越来越多Prompt Engineering、Context Engineering、Harness Engineering、Loop Engineering。它们看起来像是在不断造词但背后其实对应着一个很明显的变化AI 的任务单位变了。过去我们更关心“怎么让模型回答好一个问题”所以重点是提示词。后来发现光把 Prompt 写得更长、更细并不能解决可靠性问题。模型还需要正确的历史记录、外部数据、工具权限、记忆状态和任务目标于是有了 Context Engineering。再往后AI 开始真正调用工具、执行代码、访问文件、操作系统工程重点又从“给模型什么信息”转向“如何让模型在真实环境里安全、稳定地行动”。这就是 Harness Engineering 所关注的运行环境、沙箱、权限、评测和可观测性。而 Loop Engineering 又往前走了一步。它关注的已经不是一次 Agent Run 能不能成功而是系统能否在更长时间里持续推进发现任务、制定计划、执行、验证、修复失败、记录状态然后进入下一轮直到满足停止条件。所以这些概念并不是简单的替代关系而是 AI 工程控制范围不断外扩Prompt 是一句话 Context 是一组信息 Harness 是一套运行环境 Loop 是一个持续工作的系统。当然这里面确实存在命名竞争和行业炒作但工程范式的变化也是真实的。未来真正稀缺的可能不只是会写 Prompt 的人而是能把模型、工具、状态、评测、安全和反馈回路连接起来搭建可靠 AI 工作系统的人。1.什么是 Loop EngineeringLoop Engineering循环工程是指设计一套让AI Agent能够自主迭代、自我修正、持续运行直至目标完成的系统。Claude Code负责人Boris Cherny说“我不再给Claude写提示词了。我写好一个个运行着的循环让循环去提示Claude并让它自己搞清楚该做什么。我的工作就是写循环。”2.核心理念转变传统模式Loop Engineering人写提示词 → Agent执行一次 → 人读结果 → 人写下一轮人设计循环 → 循环自动触发Agent → Agent自主多轮迭代 → 循环管理状态全程握住Agent系统自己跑人是“设计师”3.Loop Engineering 的六大核心模块根据 Addy Osmani 的系统梳理一个完整的Loop需要六样东西模块作用在Claude Code/Codex中的体现Automations按计划自动触发独立完成发现和分类/loop定时任务、cron调度、/goal持续运行直到条件成立Worktrees让并行运行的多个Agent互不干扰git worktree、isolation: worktree配置Skills把项目知识写下来避免Agent每次都靠猜SKILL.md定义技能Plugins Connectors把Agent接入真实工具Issue Tracker、数据库、Slack基于MCP协议构建Sub-agents拆分工种一个负责生成另一个负责检查双重Agent架构写代码的和检查代码的分开Memory记录“已完成什么”和“下一步是什么”Markdown文件或Linear看板存在磁盘上不是上下文里4.关键设计模式分离“生成者”与“验证者”Loop 中最有用的结构设计是把写代码的和检查代码的拆成两个Agent。让写代码的Agent评审自己的代码它会对自己“太好说话”一个拿着不同指令、有时甚至是不同模型的第二个Agent能抓住第一个Agent自己没意识到的问题这个你真正信任的验证者是你敢走开的唯一原因这也是/goal命令的核心逻辑每一轮结束后一个独立的小模型检查是否完成而不是让写代码的Agent自己打分。5.一个典型的Loop工作流示例作者展示了自己最常使用的一个Loop每天早上一个定时任务在代码仓库上自动启动。它调用一个“分诊技能”翻查昨天的CI失败记录、Open Issue、最近谁提交了什么代码。发现值得修改的问题后这个Loop会自动开一个独立工作区worktree派一个Sub-agent去起草修复方案派第二个Sub-agent拿着项目技能文档和现有测试去审查方案如果审查通过连接器会自动开PR、更新工单Loop搞不定的东西放到Triage收件箱里等人处理结果从发现、分配、修复、审查到开PR全程无需手动输入一个字。6.Loop Engineering 的三个层次层次描述当前状态第一层单Agent内部的迭代循环社区讨论焦点Boris Cherny描述的场景第二层多Agent之间的协作循环部分技术团队在探索第三层人与Agent网络共同构成的组织级循环明略科技Octo宣称已在生产环境运行7.Harness Loop完整的工作流体系两者的关系可以这样理解概念角色比喻Harness Engineering约束与护栏告诉Agent“你不能越线”确保安全可控Loop Engineering驱动力与自动执行告诉Agent“往那个方向一直跑”持续迭代直到目标完成Harness让AI“套上缰绳”Loop让AI“自己跑起来”——两者结合才是一个完整的生产级AI系统。从技术演进路径来看Prompt Engineering → Context Engineering → Harness Engineering → Loop Engineering 好好说话 提供信息 设规则和约束 让系统自己跑8.Loop Engineering 的三个必须警惕的问题Addy Osmani 明确指出Loop 虽好但要注意三个问题问题说明应对验证还是你的活Loop说“完成了”不证明真完成了你依然是代码质量的最终负责人理解债务会滚雪球Loop产出越快代码和人能理解的差距越大主动去读、去思考Loop产出的东西认知投降Loop跑得太顺你就不再自己判断了同一种行为可能得到相反结果——看你是用Loop辅助思考还是用Loop逃避思考Boris Cherny说“我的工作是写Loop”——这句话没说工作减少说的是工作难点的变化。9.小结维度Harness EngineeringLoop Engineering核心问题如何让Agent安全、可控地运行如何让Agent自动、高效地工作核心手段约束、护栏、反馈回路、检查点自动触发、任务分配、验证机制、状态记忆关键组件上下文工程、架构约束、熵抗机制Automations、Worktrees、Skills、Sub-agents、Memory角色比喻“马具”“自动驾驶系统”企业价值让AI Agent可落地、可审计、可回滚让AI Agent可扩缩、可并行、可长期运行展望未来正如Google Cloud AI总监 Addy Osmani 所言“Loop越强你得越清醒。”设计Loop是大势所趋但要保持思考像一个还要继续做工程师的人一样搭建系统而不是去做只会点“开始键”的人。参考文献Loop Engineering