Cursor 双周综述|iOS 公测、Notion 集成与 SWE-bench 的信任危机
本期导读 2026 年 6 月底这期 Cursor 更新有三个值得深入聊聊的进展:iOS 版公测意味着 Cursor 正式迈向"云优先"架构;Notion 采用 Cursor SDK 嵌入代理,是 B2B 基础设施战略的里程碑;而那篇关于 Reward Hacking 的研究,则揭示了 AI 编程评估体系正在经历一场信任危机。 Cursor for iOS:接口与执行分离,云才是本体 Cursor 的 iOS 应用终于来了,但它的意义不只是"在手机上写代码"。 仔细看产品设计:iOS 版并不能在本地跑 Agent——它要么连接你电脑上的 Cursor(Remote Control),要么把任务交给云端虚拟机。这意味着移动端的定位是远程操控台,而非真正的移动开发环境。 这个选择背后的逻辑很清晰:AI 编程 Agent 的计算消耗远超手机处理器的能力边界,把执行层放在云端是唯一可行的方案。Cursor 的赌注是:未来用户关心的不是 Agent 跑在哪台机器上,而是任务有没有完成、PR 有没有合并。 这种"接口与执行分离"的架构,实际上是把桌面端积累的云端基础设施(隔离虚拟机、网络代理、持久化上下文)直接复用到了移动场景。对 Cursor 来说,iOS 不是新市场,而是把现有云端能力导出到更多接触点的分发渠道。 有意思的是他们描述的一个工作流:健身时收到用户反馈,截图标注后直接发给 Agent,Agent 拿截图当上下文开始改 UI。这说明 Cursor 在推动一种新的产品反馈闭环——用户体验反馈不再需要排队等工程师打开 IDE,可以在任何碎片时间触发一个异步的编码任务。这对传统开发团队的响应模式是一个冲击。 Notion 选择 Cursor:看不见的那一层 Notion 用 Cursor SDK 在几周内完成集成,嵌入了自己的产品——这则客户案例的看点不在集成本身,而在于它验证了 Cursor 的战略定位:做别人的 Agent 引擎。 Notion 的工程师说得直白:"构建和运行一个自主编码 Agent 是一个庞大、专业的系统,Cursor 做这个比我们好。"这不是客气话。Notion 的核心资产是协作层和文档上下文,它不需要自己造 Agent 基础设施。同样的逻辑也适用于 GitHub(Jira、Linear 等工具也有类似的集成需求)。 ...