Cursor 双周｜安全不是开关：Auto-review 的架构逻辑与 90% 成本压缩的秘密

过去两周 Cursor 的更新里，有两件事值得放在一起看：一件是 Auto-review 的技术架构，另一件是 Wayfair 的客户案例。表面上它们是不同维度——一个是安全机制，一个是生产效果——但背后指向同一个核心问题：AI 编程工具如何在 agent 越来越自主的同时，不失控？

Auto-review：把安全从"开关"变成"旋钮"

Auto-review 解决的是一个真实的 UX 困境：agent 越强，用户越不想被打断；但 agent 能做的事越多，出错的代价也越大。传统解法是"每一步都要用户确认"，Cursor 认为这是伪命题——确认提示太多，人就不看了，安全检查反而形同虚设。

Cursor 的解法是引入一个分类器 agent 嵌入 agent 执行路径。这个分类器在每个工具调用执行前评估风险，但它不是简单返回"允许/阻止"，而是把判断结果连同解释返回给父 agent，让父 agent 自己决定怎么绕过去。

这个设计有几个值得注意的工程决策：

1. 小模型 + 推理，而非大模型硬判断

Cursor 踩过一个反直觉的坑：低推理模型不一定更快。当模型对任务理解不足时，它会用更多 token 搜索，最终得到更差的结果。结论是分类器需要一个"够用就好"的小模型，加上足够的推理能力来做出干净判断。这是资源与准确率之间的实际工程权衡，而不是盲目追大模型。

2. 同 RPC 流执行，避免额外延迟

分类器跑在父 agent 同一 RPC 流里，类似 subagent 架构，不需要独立 endpoint。这意味着分类检查不会给每个工具调用增加网络往返的延迟。延迟是 agent 流式体验的死敌，这个选择是正确优先级。

3. 解释驱动，而非阻止驱动

最关键的设计原则：分类器不直接弹出用户确认。它阻止约 4% 的动作，但其中大部分父 agent 能用反馈自行调整路径。最终只有约 7% 的对话产生用户中断，而企业客户此前自行实现的安全方案这个数字高达 40%。这个数字对比很能说明问题——好的安全机制不应该用打扰来证明自己的存在。

这整套设计思路值得其他做 agent 工具的团队参考。安全不是加一道墙，而是让 agent 在风险边界有自我感知能力。

Wayfair 团队用 Cursor 做 ML 实验自动化的案例，有几个数字值得单独拿出来：

这些数字背后真正有意思的是工作方式的转变：研究员不再需要等工程师实现他们的想法，而是对 Cursor 描述思路（包括用语音模式），Cursor 自动构建实验、接入评估框架、跑分、汇报结果。

这意味着研究瓶颈从"实现速度"转移到了"下一个值得测什么的判断力"。这是一个非常根本的变化——在 ML 领域，工程资源历来是研究速度的天花板；Cursor 把这道墙去掉了。

Wayfair 还提到一个细节值得注意：2026 年 3 月的 sprint，没有接触过 tag validation 业务的初级工程师在第一天就能交付新模型变体。这说明当实验框架搭好之后，Cursor 的自动化掩盖了业务领域的复杂性，让更广泛的人可以参与实验设计。

把这两件事放在一起看，能看到 Cursor 正在构建一个统一的能力：agent 的"感知与自我约束"和"规模化执行"是同一套架构在不同层次的表现。

Auto-review 是低层次的安全感知——让 agent 知道什么不该做；Wayfair 案例是高层次的执行规模——让人类研究者可以同时驾驭 20+ 并行 agent。它们都依赖同一个前提：人类定义意图和边界，AI 负责在大模型空间中高效探索。

Cursor 和竞品的路线差异在这里开始清晰：GitHub Copilot 走的是"人在回路中、建议为主"的路线；Cursor 越来越像"人在目标中、执行靠 agent"。Auto-review 是这个路线的安全基础设施，Wayfair 的数字是这个路线生产价值的证明。

这两周没有发布新模型或新 UI，但这两件事加在一起，是 Cursor 工具链逻辑最完整的一次表达。