← 主题阅读
主题阅读

Agent 的智商不等于执行力——记忆、模式与脚手架缺一不可

2026-04-30

这三篇从三个层面回答同一个问题:为什么聪明的模型做不出可靠的事?——缺少决策记忆,Agent 每次都是「失忆天才」;缺少行为模式,Skill 只是格式良好的空壳;缺少脚手架约束,长时任务必然漂移。模型智商只是入场券,执行可靠性才是真正的护城河。

🤖 Agent 🏗 构建 👥 组织
1

智能体真正缺的不是能力,而是决策记忆层

这篇文章对“智能体缺少决策追踪层”这个判断抓得很准,但把行业失败几乎都归因到这一层明显过度,而且对 PlayerZero 的背书带有很强 PR 味道。

💡 诊断层:Agent 真正缺的不是能力,而是决策追踪与记忆层——没有这层,每次调用都是零起点,错误不会被积累和规避。

🤖 Agent 👥 组织 🏗 构建 12 min
2

Agent Skill 设计的五种模式——从格式标准化到行为结构化

Agent 开发的真正瓶颈已从"格式规范"转向"行为设计",通过 Tool Wrapper、Generator、Reviewer、Inversion、Pipeline 五种模式的组合,可以显著提升 Agent 的可靠性和一致性,但这套方法论的通用性和实际效果仍需验证。

💡 行为层:从 Tool Wrapper 到 Pipeline,五种设计模式把 Agent 技能从「写好的提示词」升级为「结构化的行为契约」,解决「知道做什么但不知道怎么做」的问题。

⚡ Prompt 🤖 Agent 💰 投资 22 min
3

面向长时应用开发的 Harness 设计

Anthropic 用"规划者-生成者-评估者"三智能体架构让 Claude 跑出了远超单智能体基线的长时编码成果,但 20 倍成本换来的仍是"勉强可用的 Demo",核心价值不在架构本身,而在"脚手架必须随模型进化做减法"这一工程判断。

💡 约束层:Anthropic 用「规划者-生成者-评估者」三智能体架构跑长时编码任务,20 倍成本换来勉强可用的 Demo——核心价值不在架构炫技,而在证明「脚手架必须随模型进化做减法」这一工程判断。

🤖 Agent 🏗 构建 ⚡ Prompt 47 min

🧵 串联问题

如果你的 Agent 系统只能选一层优先加固——是决策记忆(让 Agent 从错误中积累经验)、行为模式(让 Skill 从文档变成可执行契约)、还是脚手架(让长时任务有规划-执行-评估闭环),你会选哪层?为什么?