1
不要再亲手写代码了——OpenAI 的“Agent 优先”软件工程实验
OpenAI 仅用 5 个月时间,依靠 7 名工程师驱动 Codex 产出了近百万行代码,并发布了一个真实的 Beta 产品,证明了“Agent 优先”的软件工程核心不在于写代码,而在于设计让 Agent 能够自主工作的“脚手架”。
OpenAI 7 个人用 Codex 写了 100 万行代码,LangChain 不换模型只调脚手架就从 Top 30 冲到 Top 5,还有人造了一个「会思考的编排器」让 Agent 管 Agent。三篇文章从实践、方法论、架构三个层面指向同一个结论:你花在「选更好的模型」上的时间,不如花在「让模型更好地工作」上。对 Neta 来说,这不是技术选型问题,是工程文化问题。
OpenAI 仅用 5 个月时间,依靠 7 名工程师驱动 Codex 产出了近百万行代码,并发布了一个真实的 Beta 产品,证明了“Agent 优先”的软件工程核心不在于写代码,而在于设计让 Agent 能够自主工作的“脚手架”。
模型是原材料,Harness 才是产品——LangChain 团队不换模型、只调"脚手架",在编码基准上暴涨 13.7 个百分点,核心方法论就是 Context Engineering + 自我验证 + Trace 驱动迭代。
AI 编码的瓶颈不是模型能力,是你的注意力带宽——而一个"会思考的编排器"比任何单个 agent 的能力提升都更值钱。
这篇最有价值的不是 17 条技巧,而是把 AI 协作从“临场发挥”升级为“可复用、可审计、可托管”的系统工程。 ### 核心观点
💡 把 AI 协作从临场发挥升级为可复用、可审计、可托管的系统工程
如果 Harness Engineering 的核心是「设计环境而不是写代码」,那 Neta 现在最需要的脚手架是什么——是给 AI 编码用的 repo 规范,还是给业务决策用的上下文结构?两者优先级怎么排?