本期导读

过去两周 Cursor 的更新集中在两个方向:安全治理(Auto-review)和云端执行架构(Cloud Subagents + v3.7)。两条线看起来独立,但本质上都在解决同一个核心矛盾——如何让 AI Agent 在高自主性和高可靠性之间取得平衡。本文重点分析这两篇更新的技术实现思路。


Auto-review:用分类器 Agent 替代"是否授权"二元判断

传统的 AI 编程工具在安全控制上普遍采用二元授权:危险操作弹窗询问用户,用户反复面对弹窗后选择"总是允许",安全机制名存实亡。

Cursor 的 Auto-review 给出了另一种思路——在 Agent 执行路径中嵌入一个专用的风险分类器 Agent,在每次工具调用前做上下文感知的安全判断。

技术实现的关键决策

1. 小模型优先,而非大模型 这是一个违反直觉的发现:低推理能力的模型反而可能更慢、更贵。因为当模型无法理解策略或工具调用时,它会在错误方向上消耗更多 token。所以选择的是"有足够推理能力但体型小"的专用分类模型,在速度和判断质量之间取最优解。

2. 分类器是 Agentic 的 单靠命令字符串无法判断风险——python script.py 可能是无害脚本,也可能是恶意程序。分类器因此被设计为 Agentic 的,可以主动使用 ReadFile、Grep、Glob 等工具来检查工作区上下文。这比单纯依赖规则匹配要灵活得多。

3. 放在 RPC Stream 里,而非单独端点 如果做成独立服务调用,每次工具执行前都多一次网络往返,延迟直接翻倍。Cursor 选择让分类器与父 Agent 共用同一个 RPC 流,类似 subagent 的架构,既保证了实时性,又实现了逻辑解耦。

4. Block 时返回解释,而非强制中断 分类器 block 一个操作后,会把判断理由反馈给父 Agent,父 Agent 往往能找到一条等效但更安全的路径。这让用户不用频繁介入,同时也保留了用户意图的最终决定权。

观点

Auto-review 的设计思路本质上是把 AI 安全从"人工审核"变成"系统策略执行"。这比竞品(如 Copilot 的仅警告模式)更进了一步。值得注意的是,这个分类器是 Cursor 自研的专用模型,而非直接调用通用 LLM——这说明他们认为通用模型在这个场景下的延迟和成本都不可接受。


Cloud Subagents in Agents Window(v3.7):把云端 Agent 做彻底

v3.7 的核心更新是把 Cloud Agent 的能力进一步整合到桌面端的 Agents Window 里,并新增了三个关键能力:Cloud Environment Setup/in-cloudLocal-Cloud Handoff

Cloud Environment Setup:重建本地开发体验

Cloud Agent 的第一年经验证明了一个反直觉结论:模型能力越强,开发环境就越重要。当模型足够聪明时,它的输出质量直接由是否能访问完整开发环境决定——但"环境不完整"往往不会报错,而是表现为输出质量悄无声息地下降,很容易被误认为是模型变差了。

Cursor 的解决方案是:让 Cloud Agent 的环境可以快照化(snapshot),未来启动时可以快速恢复,同时环境定义可以提交到 .cursor/environment.json 供团队复用。这本质上是在云端重建"本地开发环境即开即用"的体验。

/in-cloud:在独立 VM 里跑 Subagent

/in-cloud 命令允许你在自己的本地工作区里,临时启动一个云端 Subagent 处理独立任务。它有独立 VM、独立分支,不干扰本地状态。这解决了两个痛点:

  • 隔离长任务:修 CI bug、调查问题、探索代码库时,不需要停掉手里的活
  • PR babysitting:点击 quick-action pill 或用 /babysit 让云端 Agent 帮你准备 PR,直到可以 merge

这实际上是并行化 Agent 执行的基础能力。用户可以在本地继续开发,同时云端同时跑多个 Subagent 处理不同任务。

Local-Cloud Handoff:计算资源按需调度

这个能力补全了 Cloud Agent 架构的最后一环——按需在本地和云端之间迁移工作。可以把长任务从本地 offload 到云端,也可以把云端结果拉回本地验证。在资源消耗和响应速度之间有了灵活切换的可能。

观点

Cloud Agent Lessons 那篇文章里提到,他们最初用"work-stealing 架构"实现云端 Agent,结果可靠性只有 1 nine(90%)。后来迁移到 Temporal(一个分布式任务编排引擎)来处理持久化执行、重试和节点故障,才突破到 2 nine 以上。v3.7 的 Cloud Subagents 正是这个架构的产物。

这意味着 Cursor 的云端 Agent 基础设施已经远远超出了"把本地 Agent 搬到服务器"——他们在构建一套面向 AI 编程场景的分布式持久化执行层。这个方向的竞争门槛极高,竞品很难靠简单迭代追上。


总结

更新核心价值技术亮点
Auto-review安全治理从人工到系统专用分类 Agent、RPC 流内嵌、Agentic 审查
Cloud Subagents v3.7云端执行架构完善快照化环境、Temporal 持久化层、Local-Cloud Handoff

两条更新合在一起,说明 Cursor 正在同时打两场仗:安全可靠性和执行规模化。Auto-review 对应的是"让 Agent 更可信",Cloud Subagents 对应的是"让 Agent 能做更大的事"。这两条线最终会汇合——一个高自主性、高可靠性、高执行规模的 AI 编程基础设施,才是 Cursor 真正在构建的东西。


相关链接: