过去一个季度,Coding Agent 领域出现了一条清晰的演进脉络:Claude Code 和 CodeX 定义了底座能力,社区项目(如 oh-my-opencode)在此基础上引入 Multi-Agent 协同,验证了底座之上仍有很大的能力释放空间;外围项目(如 OpenClaw)则通过附加通信层和网关降低了使用门槛,推动了下沉市场的大量采用。而在最近的 Opus 4.6 和 CodeX 5.4 中,官方已经把社区和外围验证过的最佳实践重新整合回了模型本身。

底座定义能力边界,社区探索能力上限,外围降低使用门槛,官方回收最佳实践——这个闭环跑通之后,一个趋势变得很明确:后端架构正在快速趋同。当大多数团队都可以借助 Coding Agent 快速达到自己想要的技术目标时,技术底层本身很难再构成护城河。

这就引出了一个我最近持续在思考的问题:如果技术趋同是既定方向,那产品之间的实质差异到底来自哪里?

我目前的思考聚焦在一个具体的产品类别上:个人与组织之间通过 AI 进行协同的产品——不是通用大模型,不是 AI 生成工具,而是那些需要处理"人和 AI 的关系、记忆归谁、约束怎么做、跑在哪里"这类设计问题的产品。这类产品的核心张力始终围绕着一个三角关系:个人、组织、AI。

我试着把这类产品的核心设计决策提炼成了四根轴,每根轴代表一个必须明确立场的维度。先给一个总览:

轴 1:人机关系——人在场,还是人离场

这是最根本的产品假设。一端是人在场的交互式协同:用户主导决策,AI 辅助执行,交互是同步的、对话式的。另一端是人离场的 Agent 持久自主:任务被充分定义后委托给 Agent,Agent 在后台自行闭环,交互是异步的。

Claude Code 站在协同端——人始终在场,逐步引导 Agent 完成任务。Manus 站在自主端——用户提交需求后离场,Agent 自行规划并交付结果。两端各有结构性风险:人在场意味着人是吞吐瓶颈,人离场意味着错误无人兜底、失控成本高。

我观察到的一个问题是:很多团队在这根轴上的位置是模糊的。产品既想让用户深度参与,又想让 Agent 自己跑。这种模糊本身往往就是产品定义不清的第一个信号。

轴 2:记忆范围——用户级记忆,还是组织级知识

用户级记忆指的是个人偏好、单次会话中的上下文、用户主动提供的信息。它的优势是冷启动快、个人使用门槛低。但在协同场景下,真正的问题不是"每次从零开始",而是随着协同深入,上下文不断膨胀,信息开始污染——重要信息被淹没在大量过程性对话中,Agent 的判断质量反而下降。另一个问题是不可复用:Skills 类机制解决了一部分 SOP 层面的复用,但跨 session 的上下文记忆至今没有被很好地解决。

组织级知识库则是跨用户、跨 session 的持久沉淀,理论上越用越聪明,但代价是维护成本高、知识会腐化、隐私边界复杂。

一个值得注意的现象:大多数产品默认沿着「本地运行 → 短期个人记忆」或「云端运行 → 长期组织沉淀」的路线走。但打破这个默认组合的产品往往是更有意思的创新——比如 Claude 的 Memory 机制在本地协同场景中引入了跨 session 的个人记忆,而很多云端 chatbot 反而是无记忆的一次性交互。

轴 3:约束方式——Prompt 软约束,还是编码硬约束

这根轴的本质是 Agent 自主性与控制性之间的取舍。

软约束通过自然语言 Prompt 和 System Instruction 实现,弹性高,模型可以自行解读和泛化,但输出不稳定、行为不可预期。硬约束通过代码脚本、Workflow DAG、规则引擎实现,行为可预测、可审计,但僵化,遇到长尾情况容易失灵。

Claude 的 Project Instructions 是典型的软约束——用自然语言定义行为边界,灵活但不确定。而最近讨论比较多的 Harness Engineering 则代表硬约束的方向——通过 infra 层的代码逻辑(Workflow DAG、执行沙箱、权限边界)从底层约束 Agent 的具体执行,行为可预测、可审计,但灵活性相应降低。

这根轴和轴 1 存在弱关联:人在场时通常倾向软约束以保持灵活,人离场时通常倾向硬约束以确保可控。但这不是绑定关系——用软约束驱动的自主 Agent 和用硬约束搭建的人机协同系统,都是合理的产品形态。

轴 4:运行位置——用户端本地,还是公司端云端

本地运行意味着可以直接触达用户的文件系统和本地环境,数据主权在用户手里,但天然是单人作业,难以组织级协同。云端运行意味着可以连接组织知识库、支持多用户协作和权限管理,但引入了延迟、隐私和供应商锁定等问题。

这根轴本质上是在回答一个问题:个人与组织之间如何协同。Claude Code 是极致的本地端——直接操作用户代码库,但协同能力有限。OpenClaw 则通过 Gateway 将本地 Agent 连接到云端协调层,试图在本地执行和组织协同之间找到平衡。

这根轴与轴 2 强关联。正如前面提到的,「本地 + 短期记忆」和「云端 + 长期沉淀」是两个自然的默认组合,而有意打破这个默认的产品设计往往意味着差异化机会。

如何使用这个框架

对任何一款 AI 协同类产品,在四根轴上各标一个位置,四个位置连起来基本就是这款产品的骨架。

产品 X: 人机关系: ████████░░ 偏协同 记忆范围: ░░░░██████ 偏长期沉淀 约束方式: ░░░░░█████ 偏硬约束 运行位置: ░░░░██████ 偏云端

点位高度重合的产品是直接竞品,必须在执行层拉开差距。点位差异最大的那根轴,才是真正的差异化来源。

以 Claude Code 和 Manus 为例:两者在功能层面有一些重叠,但在轴 1(人机关系)上处于光谱的两端——Claude Code 假设人的判断不可替代,Manus 假设任务可以被充分委托。这才是它们之间最本质的区别,不是功能多少,也不是模型好坏。

如果你正在定义一款涉及个人与组织 AI 协同的产品,可以先拿这四个维度审视一遍:每根轴上你的选择是清晰的,还是模糊的。我自己的经验是,模糊本身往往就是需要解决的第一个问题。