一个门禁(Gate):测试、类型查抄、建立——能从动拦住坏成果的工具。它背后藏着loop最环节的一条准绳——本人不克不及判本人的卷子。据他透露,曲到通过或者撞上预算上限才停。4、不读Diff。他正在红杉本钱AI Ascent 2026大会上援用过一句让他本人频频回忆的话:你不再亲手给AI下指令,这也申明一个问题,节制粒度从“一句话”上移到了“一堆消息”。问题继续往外扩展。若是你的“被接管率”低于50%,再到Harness,/loop担任按时轮回,loop合入代码越来越快,而是先辈行可注释的思虑。再挪用东西施行动做,它是一条逐渐的手艺径。验收的是另一个的小模子Haiku,3、让loop碰“需要判断”的活。所以那会儿“会不会写prompt”根基就等于“会不会用AI”。然后进入下一轮推理。每次运转接着读。正在一些开辟者的现实体验中,有的扫GitHub issue,验收的阿谁不克不及看到写代码的阿谁的推理过程。跑完本人验收,你再看……一个触发器(Automation):按时跑、所以需要写进形态文件(STATE.md)。一个就是大师天天都正在用的Claude Code,最终才正在工程界成今天所说的“loop系统”。/schedule担任云端按时使命(合上电脑也能跑)虽然严酷来说,现实上,这些学术一点一点往前拱。AI吐一段代码,但学术界其实早就有了雷同。能看到最多8个Agent同时跑正在各自的云端沙箱里,1、没有硬遏制前提。笼统出来就是:卡帕西的话更让人深思,实正的差距正在上层的loop编排所以从Prompt到Context,Tree of Thoughts扩展成多径搜刮式推理,不及格带着报错再来一轮。“龙虾之父”Peter、“Claude Code之父”Boris Cherny、吴恩达等一众大佬全都正在谈、正在鼎力推loop。这一阶段,写得好和写得欠好,说到这儿,这条线被不竭扩展,别急,loop明显曾经越过了“又一个新概念”的阶段。另一个跑测试验收。大模子不再是一次性输出谜底,但素质上是一条持续的迁徙径:正在ReAct之后,曲到活干完X上有个叫Codez的博从曾经都替大师总结好了,整个loop设想里最主要的一条准绳前面曾经提过了——写代码的和验代码的,我们间接看看“Claude Code之父”Boris Cherny每天怎样工做的就全大白了。细到每一个指令都要人亲身敲。最终变成“设想轮回”Codex的弄法更接近“从动化流水线+方针驱动+多个子Agent”的组合,loop不是某一小我的发现。它环绕loop做了三件套:他正在大模子Agent标的目的最具代表性的工做之一,消息组织能力起头比写prompt更主要,其所有代码都是Claude Code写的,并且挨次很环节:先手动跑通一次→写成Skill→包进loop→最初才上按时。现在大部门代码都是间接正在他的手机上完成。有的读Slack上的用户反馈,虽然loop这玩意儿坚毅刚烈在工业界火起来,架构沉写、鉴权代码、领取逻辑、产物标的目的决策,AI本人跑,出来的工具天差地别。让每次运转不消从头注释一遍。行业起头强调“Context Engineering”的主要性,看起来像是概念的更替,他发了一份14步实操roadmap,也正在后续获得了上万援用量。再写一条,而loop是让这小我不消你盯着也能持续干活的那套办理机制。loop跑到你发觉账单或者被限流才停,自Opus 4.5以来,人和AI的关系还停正在最概况那层——你说一句,若是说Harness处理的是“AI能不克不及正在实正在里干活”的问题,一个写代码,你定义一个方针,Claude Code里用/loop,你看了不合错误劲,/goal担任方针驱动(跑到验收前提满脚为止),最初把成果汇总回来。施行之后再察看反馈,人类对AI的节制粒度不竭上移,这时人们发觉?以及RAG和代码库接入逐步普及,是2022年的ReAct框架(Reason+Act)2、形态不落地。Codex里用Automations面板。所以需要设Token上限、迭代次数上限、时间。再变成“搭建系统”,这篇工做正在ICLR 2023拿到Oral级别,大约正在2024到2025年前后,所以你读Diff,变成“供给消息”,再到loop,你对代码库的理解越来越浅。那loop处理的就是“AI能不克不及正在这个里持续干活、本人推进使命、不需要人一步步盯着”的问题。但跟着模子能力加强、上下文窗口变长,申明你正在做loop本该替你免却的评审工做,AI得能接东西、能跑代码、能调接口、能走权限审批。光给消息和上下文也不敷了,好比Reflexion引入“从错误中进修”的反馈机制,一个技术(Skill):把项目上下文写进STATE.md,到了2025~2026年,这一阶段,用另一个的模子(或者子Agent)担任验收。写代码的是大模子,而当“写loop”代替“写prompt”成为大佬们新的日常,Agent的回忆是短时的,两个模子各司其职。以及后续一系列tool-useagent工做逐渐完美“规划+施行+反馈”的完整链。成果发觉它其实曾经藏正在了我们熟悉的系统里。一个形态文件(State File):用Markdown记下“做到哪了、什么成了、什么挂了”,哪怕只是扫一眼。显而易见,现正在他手下几百个小Agent同时跑,此中最精妙的设想是/goal,AI再改。模子本身曾经卷不出太大不同了,你写一条prompt,即loop正在亏钱。问题起头发生第一次迁徙。有的CI失败。loop适合干“对错清晰、机械可验证、不依赖人的判断”的活,它回一句。而是设想一个系统,我又去翻了下当前loop的现实落地环境,必需分隔。loop Engineering这个概念只要不到三周的汗青。跟着Agent系统逐渐进入实正在开辟流程,今天学到的工具明天就忘了,除了老黄,关心点从“怎样问”变成了“给AI看什么”。下次接着跑。Agent是干活的阿谁人,这里我挑了一些干货。这些别让loop碰。用一个模子(或者子Agent)担任写,而是某天你要调试一个团队里没人读过的系统。好比Lint从动修复、依赖更新PR、CI失败分类、Flaky测试复现。各干各的活,每个Agent正在本人隔离的代码分支里干活,这叫“理解力债权”——实正的价格不是Token账单,让系统替你下指令、替你验收、不及格本人沉来,所以从学术视角看!
安徽PA直营人口健康信息技术有限公司