AI 协同产品的真正差异，不在模型而在四轴立场

过去一个季度，Coding Agent 领域出现了一条清晰的演进脉络：Claude Code 和 CodeX 定义了底座能力，社区项目（如 oh-my-opencode）在此基础上引入 Multi-Agent 协同，验证了底座之上仍有很大的能力释放空间；外围项目（如 OpenClaw）则通过附加通信层和网关降低了使用门槛，推动了下沉市场的大量采用。而在最近的 Opus 4.6 和 CodeX 5.4 中，官方已经把社区和外围验证过的最佳实践重新整合回了模型本身。

底座定义能力边界，社区探索能力上限，外围降低使用门槛，官方回收最佳实践——这个闭环跑通之后，一个趋势变得很明确：后端架构正在快速趋同。当大多数团队都可以借助 Coding Agent 快速达到自己想要的技术目标时，技术底层本身很难再构成护城河。

这就引出了一个我最近持续在思考的问题：如果技术趋同是既定方向，那产品之间的实质差异到底来自哪里？

我目前的思考聚焦在一个具体的产品类别上：个人与组织之间通过 AI 进行协同的产品——不是通用大模型，不是 AI 生成工具，而是那些需要处理"人和 AI 的关系、记忆归谁、约束怎么做、跑在哪里"这类设计问题的产品。这类产品的核心张力始终围绕着一个三角关系：个人、组织、AI。

我试着把这类产品的核心设计决策提炼成了四根轴，每根轴代表一个必须明确立场的维度。先给一个总览：

轴 1：人机关系——人在场，还是人离场

这是最根本的产品假设。一端是人在场的交互式协同：用户主导决策，AI 辅助执行，交互是同步的、对话式的。另一端是人离场的 Agent 持久自主：任务被充分定义后委托给 Agent，Agent 在后台自行闭环，交互是异步的。

Claude Code 站在协同端——人始终在场，逐步引导 Agent 完成任务。Manus 站在自主端——用户提交需求后离场，Agent 自行规划并交付结果。两端各有结构性风险：人在场意味着人是吞吐瓶颈，人离场意味着错误无人兜底、失控成本高。

我观察到的一个问题是：很多团队在这根轴上的位置是模糊的。产品既想让用户深度参与，又想让 Agent 自己跑。这种模糊本身往往就是产品定义不清的第一个信号。

轴 2：记忆范围——用户级记忆，还是组织级知识

用户级记忆指的是个人偏好、单次会话中的上下文、用户主动提供的信息。它的优势是冷启动快、个人使用门槛低。但在协同场景下，真正的问题不是"每次从零开始"，而是随着协同深入，上下文不断膨胀，信息开始污染——重要信息被淹没在大量过程性对话中，Agent 的判断质量反而下降。另一个问题是不可复用：Skills 类机制解决了一部分 SOP 层面的复用，但跨 session 的上下文记忆至今没有被很好地解决。

组织级知识库则是跨用户、跨 session 的持久沉淀，理论上越用越聪明，但代价是维护成本高、知识会腐化、隐私边界复杂。

一个值得注意的现象：大多数产品默认沿着「本地运行 → 短期个人记忆」或「云端运行 → 长期组织沉淀」的路线走。但打破这个默认组合的产品往往是更有意思的创新——比如 Claude 的 Memory 机制在本地协同场景中引入了跨 session 的个人记忆，而很多云端 chatbot 反而是无记忆的一次性交互。

轴 3：约束方式——Prompt 软约束，还是编码硬约束

这根轴的本质是 Agent 自主性与控制性之间的取舍。

软约束通过自然语言 Prompt 和 System Instruction 实现，弹性高，模型可以自行解读和泛化，但输出不稳定、行为不可预期。硬约束通过代码脚本、Workflow DAG、规则引擎实现，行为可预测、可审计，但僵化，遇到长尾情况容易失灵。

Claude 的 Project Instructions 是典型的软约束——用自然语言定义行为边界，灵活但不确定。而最近讨论比较多的 Harness Engineering 则代表硬约束的方向——通过 infra 层的代码逻辑（Workflow DAG、执行沙箱、权限边界）从底层约束 Agent 的具体执行，行为可预测、可审计，但灵活性相应降低。

这根轴和轴 1 存在弱关联：人在场时通常倾向软约束以保持灵活，人离场时通常倾向硬约束以确保可控。但这不是绑定关系——用软约束驱动的自主 Agent 和用硬约束搭建的人机协同系统，都是合理的产品形态。

轴 4：运行位置——用户端本地，还是公司端云端

本地运行意味着可以直接触达用户的文件系统和本地环境，数据主权在用户手里，但天然是单人作业，难以组织级协同。云端运行意味着可以连接组织知识库、支持多用户协作和权限管理，但引入了延迟、隐私和供应商锁定等问题。

这根轴本质上是在回答一个问题：个人与组织之间如何协同。Claude Code 是极致的本地端——直接操作用户代码库，但协同能力有限。OpenClaw 则通过 Gateway 将本地 Agent 连接到云端协调层，试图在本地执行和组织协同之间找到平衡。

这根轴与轴 2 强关联。正如前面提到的，「本地 + 短期记忆」和「云端 + 长期沉淀」是两个自然的默认组合，而有意打破这个默认的产品设计往往意味着差异化机会。

如何使用这个框架

对任何一款 AI 协同类产品，在四根轴上各标一个位置，四个位置连起来基本就是这款产品的骨架。

产品 X: 人机关系: ████████░░ 偏协同记忆范围: ░░░░██████ 偏长期沉淀约束方式: ░░░░░█████ 偏硬约束运行位置: ░░░░██████ 偏云端

点位高度重合的产品是直接竞品，必须在执行层拉开差距。点位差异最大的那根轴，才是真正的差异化来源。

以 Claude Code 和 Manus 为例：两者在功能层面有一些重叠，但在轴 1（人机关系）上处于光谱的两端——Claude Code 假设人的判断不可替代，Manus 假设任务可以被充分委托。这才是它们之间最本质的区别，不是功能多少，也不是模型好坏。

如果你正在定义一款涉及个人与组织 AI 协同的产品，可以先拿这四个维度审视一遍：每根轴上你的选择是清晰的，还是模糊的。我自己的经验是，模糊本身往往就是需要解决的第一个问题。

AI 协同产品的真正差异，不在模型而在四轴立场

核心观点

跟我们的关联

讨论引子

轴 1：人机关系——人在场，还是人离场

轴 2：记忆范围——用户级记忆，还是组织级知识

轴 3：约束方式——Prompt 软约束，还是编码硬约束

轴 4：运行位置——用户端本地，还是公司端云端

如何使用这个框架

📋 讨论归档