Cursor 双周综述|iOS 公测、Notion 集成与 SWE-bench 的信任危机
本期导读 2026 年 6 月底这期 Cursor 更新有三个值得深入聊聊的进展:iOS 版公测意味着 Cursor 正式迈向"云优先"架构;Notion 采用 Cursor SDK 嵌入代理,是 B2B 基础设施战略的里程碑;而那篇关于 Reward Hacking 的研究,则揭示了 AI 编程评估体系正在经历一场信任危机。 Cursor for iOS:接口与执行分离,云才是本体 Cursor 的 iOS 应用终于来了,但它的意义不只是"在手机上写代码"。 仔细看产品设计:iOS 版并不能在本地跑 Agent——它要么连接你电脑上的 Cursor(Remote Control),要么把任务交给云端虚拟机。这意味着移动端的定位是远程操控台,而非真正的移动开发环境。 这个选择背后的逻辑很清晰:AI 编程 Agent 的计算消耗远超手机处理器的能力边界,把执行层放在云端是唯一可行的方案。Cursor 的赌注是:未来用户关心的不是 Agent 跑在哪台机器上,而是任务有没有完成、PR 有没有合并。 这种"接口与执行分离"的架构,实际上是把桌面端积累的云端基础设施(隔离虚拟机、网络代理、持久化上下文)直接复用到了移动场景。对 Cursor 来说,iOS 不是新市场,而是把现有云端能力导出到更多接触点的分发渠道。 有意思的是他们描述的一个工作流:健身时收到用户反馈,截图标注后直接发给 Agent,Agent 拿截图当上下文开始改 UI。这说明 Cursor 在推动一种新的产品反馈闭环——用户体验反馈不再需要排队等工程师打开 IDE,可以在任何碎片时间触发一个异步的编码任务。这对传统开发团队的响应模式是一个冲击。 Notion 选择 Cursor:看不见的那一层 Notion 用 Cursor SDK 在几周内完成集成,嵌入了自己的产品——这则客户案例的看点不在集成本身,而在于它验证了 Cursor 的战略定位:做别人的 Agent 引擎。 Notion 的工程师说得直白:"构建和运行一个自主编码 Agent 是一个庞大、专业的系统,Cursor 做这个比我们好。"这不是客气话。Notion 的核心资产是协作层和文档上下文,它不需要自己造 Agent 基础设施。同样的逻辑也适用于 GitHub(Jira、Linear 等工具也有类似的集成需求)。 ...
Cursor 双周综述:移动端突破、可视提示与 Notion 集成
1. 产品定位分析 移动端(iOS)全新突破 Cursor 终于推出了第一个官方移动客户端——Cursor for iOS,标志着它从桌面AI编辑器向真正的“随身编码”平台迈进。相比传统的代码编辑器,Cursor on iOS 将 AI 代码补全、即时错误修复、上下文感知的重构等功能完整搬到了手机上,并通过触控手势与快捷键实现了“一瞬间完成一段函数”的体验。这对于移动开发者而言,尤其是在现场演示、快速原型或在休闲时间调试小脚本时,极大降低了进入门槛。 可视提示(Design Mode)重新定义交互 另一个重点是 Design Mode 中的可视提示功能。用户现在可以在浏览器界面上直接绘制 UI 修改、拖拽组件或甚至用语音描述变更,Cursor 会把这些可视指令转化为对应的代码 diff。相比传统的“在编辑器里敲指令”,这种“所见即所得”的方式让非程序员也能参与到软件迭代,加速了产品设计与开发的协同循环。 Notion SDK 集成展示开放生态 最后,Notion 利用 Cursor SDK 在其文档系统中嵌入了 AI 编码代理,让用户可以在笔记中直接触发代码生成、自动化脚本或批处理任务。这标志着 Cursor 不仅把 AI 编辑器提供给个人开发者,还把能力扩展到了整个 SaaS 生态系统,形成了“编辑器即平台”的新范式。 2. 技术实现解读 iOS 客户端的技术挑战 跨平台渲染与性能:Cursor 必须在 iOS 的沙盒环境中实现与桌面端相同的 AI 模型推理引擎。通过将模型轻量化(例如量化到 INT8)并使用 Core ML 加速,Cursor 在手机上保持了 ~30ms 的响应延迟,足以满足实时补全需求。 离线模式与同步:为了应对网络不稳定,Cursor 引入了本地缓存机制,让用户在无网络时仍可进行基本的编辑和补全。所有操作会在恢复网络后自动同步到云端,保证跨设备的无缝体验。 安全与权限:移动端对文件系统的访问受到 iOS sandbox 的限制,Cursor 必须通过 Files 共享或云端存储进行文件读写,并提供细粒度的权限请求,确保用户数据不被泄露。 可视提示背后的 Prompt 工程 Design Mode 的可视提示本质上是把 UI 操作映射为自然语言指令,再交给大语言模型生成对应的代码。实现步骤如下: ...
语音替代键盘:我的vibe coding实践与Handy语音输入方案
语音替代键盘:我的vibe coding实践与Handy语音输入方案 键盘打字是程序员最传统的操作方式,但它的效率瓶颈在AI辅助编程时代越来越明显——我们和AI对话时需要大量输入上下文,而打字速度远远跟不上思维速度。本文分享我如何用语音彻底替代键盘,实现80%以上的coding指令下发。 为什么放弃键盘打字 传统的键盘输入有几个显著的效率问题: 速度瓶颈:说话速度远快于打字速度,尤其在描述复杂逻辑时 打断思维:打字需要同时关注拼写和内容,容易打断思路 上下文不足:打字时容易省略细节,而AI需要更丰富的描述才能准确理解意图 隐私顾虑:涉及密钥等敏感信息时,联网模型存在数据泄露风险 用语音输入时,我可以一口气说完整个需求,包括各种细节和废话,AI能获得的上下文远比打字丰富。这在实际项目中大大提升了沟通效率。 Handy语音输入方案 Handy是我在本地Mac上部署的语音输入模型,完全开源免费,支持全球各种语言的实时翻译。 核心优势 完全本地运行:所有数据不经过云端,隐私安全有保障 多语言实时翻译:说普通话、粤语、四川话还是英文、德语、法语,自动识别并翻译 无网络延迟:本地运行,翻译速度稳定不波动 模型选择建议 Handy提供针对不同语言优化的专用模型。如果你的母语或常用语言有对应模型,建议下载专用版本,速度更快、翻译质量更高。 通用模型约1.5GB,对机器内存和存储都有一定要求。如果你不确定要翻译的目标语言种类,可以用通用模型覆盖。 快捷键配置 建议提前绑定一个快捷键来触发语音输入。我使用F4键:按一下开始讲话,再按一下结束并立刻输出翻译内容。这个流程非常自然,几乎感觉不到工具的存在。 实际使用体验 在实际和AI配合coding的过程中,语音输入的优势体现得淋漓尽致: 时间成本更低:说话比打字快3-5倍,尤其适合长句和复杂描述 细节更丰富:不会因为懒得打字而省略细节,AI理解的上下文更完整 思维更流畅:不需要分心于拼写,可以完全沉浸在问题本身 当然,语音输入也有其适用场景。对于简短的命令、变量名修改等精确操作,键盘依然更高效。我目前大概是80%语音 + 20%键盘的配比。 未来展望 我认为语音交流终将取代键盘这种传统的机械式输入方式,尤其是在和AI协作的场景下。AI需要更丰富的输入才能提供更准确的输出,而语音天然比打字更能传递完整的思维过程。 当AI不再需要人类"喂料",而是自己理解、自己决策、自己执行——这条路的起点,是让人类用最自然的方式表达意图。语音,就是最自然的方式。 本文全部通过麦克风语音交流,AI辅助完成撰写。
CC-Switch 接入国产大模型:Codex 路由配置与御三家实战
CC-Switch 接入国产大模型:Codex 路由配置与御三家实战 当 Codex 能自由切换 DeepSeek、GLM、Kimik 等国产模型,Cursor/Windsurf 的使用成本和场景适配都将重构。 背景 CC-Switch(Codex Command Switch)是一款专为 Codex 命令行工具设计的模型路由插件,支持在多种大模型之间快速切换。近日发布的 v3.16.0 带来了重磅更新:全面支持国产大模型接入,涵盖 DeepSeek、智谱 GLM、Kimi、MiniMax、StepFun、百度千帆、阿里百炼、ModelScope 等近二十家路由服务。 这意味着什么?Codex 不再是 GPT 系模型的专属工具,开发者可以用更低的成本、更低的延迟,调用针对中文场景优化的国产模型完成编程任务。 核心功能:路由配置 CC-Switch 内置了丰富的路由预设,覆盖了国内主流模型服务商: 类别 支持的路由 第一梯队 DeepSeek、智谱 GLM、Kimi、MiniMax 云厂商 百度千帆、阿里百炼、ModelScope、字节豆包 长上下文 Longcat、百灵 端侧/端云 小米 MiMo、火山 Agentplan、Nvidia 配置过程非常直接:在 CC-Switch 中启用路由功能后,选择对应的路由预设,填入 API Key 即可。关键提醒:务必开启路由功能,否则 Codex 只会使用默认的 GPT 系列模型。 另一个实用的细节是用量查询——开启右侧的用量跟踪面板后,可以实时监控各模型的 token 消耗和配额剩余,避免在不知不觉中耗尽免费额度。 御三家:集齐三大国产编程模型 根据作者的实测,目前主流的"御三家"国产 AI Coding 套餐已基本成型: DeepSeek:以极低的 API 价格和出色的代码推理能力著称,长上下文窗口达 128K,适合大型项目的上下文分析 智谱 GLM:基于 ChatGLM 演进而来,对中文代码注释和文档场景优化较好 Kimi/MiniMax:长上下文能力突出,适合需要理解整个代码库结构的场景 三者的定位差异意味着实际项目中可以按任务类型分配——简单 CRUD 用 DeepSeek,复杂架构分析用 Kimi,文档生成用 GLM——成本和效果的平衡点比纯 GPT 方案更优。 ...
我的编程套餐尝试:对大多数个人开发者,OpenCode Go 套餐值得试
我的编程套餐尝试:对大多数个人开发者,OpenCode Go 套餐值得试 尤其是像我这种经常折腾 Docker、后端服务、AI 工具、UI 页面、脚本排错的人,$5 首月 / $10 每月的价格很有性价比。 OpenCode 官方说明:Go 是低成本订阅,首月 $5,之后 $10/月,可用于 OpenCode 或其他 agent,并支持充值兜底;它包含 GLM、Kimi、Qwen、DeepSeek、MiniMax、MiMo 等开放模型。(开源代码) 为什么值得 1. 价格低,但额度不算小 官方文档写得比较清楚:Go 套餐不是简单按"请求次数"限制,而是按等价用量限制: 限制周期 用量额度 5 小时 $12 usage 每周 $30 usage 每月 $60 usage 实际请求次数取决于你选的模型。比如官方估算,DeepSeek V4 Flash 每月可到 158,150 次请求,Qwen3.7 Plus 每月约 21,600 次,GLM-5.2 每月约 4,300 次。(开源代码) 这对日常 coding、改 bug、解释报错、生成脚本、写 Dockerfile、分析日志,已经非常够用。 2. 很适合作为"日常编码副驾驶" Go 套餐的定位不是替代最强闭源模型,而是提供稳定、便宜、可大量使用的开放 coding 模型。官方也说它主要解决的是开放模型访问不稳定、不同 provider 质量不一致的问题,OpenCode 会筛选和 benchmark 适合 coding agent 的模型组合。(开源代码) ...
同仁堂(600085) A股医药红利分析 | 2026-06-10
同仁堂(600085) A股医药红利分析 | 2026-06-10 数据来源:东方财富、同花顺、新浪财经 | 分析时间:2026-06-10 📌 关键数据速览 指标 数值 股价 ~24.54元 总市值 336亿元 市盈率(PE-2025) 约28倍 市净率(PB) 2.39倍 股息率 3.4% ROE(2025) 8.4% 每股收益(2025) 0.8672元 每股净资产 10.27元 每股经营现金流 1.96元 52周区间 24.25 ~ 37.60元 📈 财务健康度 盈利能力: 2025年全年EPS 0.8672元,同比增长稳健 Q1 2026 EPS 0.3436元,维持正增长 ROE 8.4%,在中药行业中处于中等水平 毛利率预计在50%以上(老字号中药品牌溢价能力强) 现金流: 每股经营现金流1.96元,显著高于EPS 0.8672元 现金流质量优秀,利润含真金白银 分红 payout ratio 约12%,现金利用空间大 资产负债表: 无有息负债,财务结构稳健 账面现金充裕,支持持续分红和战略投资 🏭 主营业务分析 核心业务: 北京同仁堂是中国最老牌的中药品牌之一,主营: 中成药研发、生产与销售 涵盖心脑血管、补益、消化、妇科等多个治疗领域 旗下拥有多个国家中药保护品种 主要产品: 安宫牛黄丸(急救神药,知名度极高) 大活络丹、牛黄清心丸等传统经典品种 持续受益于中药振兴政策 近期动态(2026年): 养阴清肺丸、时疫清瘟丸获加拿大上市批准 同仁堂制药厂获加拿大境外生产场地认证 终止对红惠医药投资(市场解读偏负面) 南京同仁堂股权被转让(影响有限) 核心优势(护城河): ...
从 OpenClaw 切到 Hermes:一篇面向 AI Agent 日常使用的 Hermes 实战教程
从 OpenClaw 切到 Hermes:一篇面向 AI Agent 日常使用的 Hermes 实战教程 最近我把自己的 AI Agent 工作流从 OpenClaw 切到了 Hermes。切换之后最大的感受是:OpenClaw 更像一个 Agent 控制台,而 Hermes 更像一个会越用越顺手的个人自动化运行时。 如果你之前用 OpenClaw 的重点是多渠道接入、Agent 编排、团队协作,那么 Hermes 一开始可能会显得更"轻"。但如果你的核心需求是:每天让 Agent 帮你处理重复任务、跑命令、查资料、写代码、做总结、记住上下文、沉淀技能,那么 Hermes 的体验会更贴近个人长期使用。 Hermes Agent 是 Nous Research 推出的自改进型 AI Agent,官方文档把它描述为带有内置学习循环的 Agent:它可以从经验中创建 skills,在使用过程中改进 skills,并通过记忆和历史会话搜索来形成跨会话上下文。(Hermes Agent) 一、Hermes 适合什么人? 我建议把 Hermes 理解成一个「个人 AI 工具执行器」,而不是单纯聊天机器人。 它比较适合这些场景: 个人开发者日常工作流 比如读项目、改代码、写脚本、查日志、生成 PR 描述、总结报错原因。 长期重复任务自动化 比如每天生成日报、定时检查服务、每周整理资料、定期做项目审计。Hermes 官方 GitHub 页面提到它支持内置 cron scheduler,可以把定时任务投递到不同平台。(GitHub) ...
Harness工程:把AI的错误控制在有限范围内
Harness工程不能保证AI永远不走偏,但它能把AI从'自由发挥的概率模型',变成一个'有边界、可验证、可审计、可恢复的工程系统'。
Harness Engineering:让 AI 可靠执行长任务的系统工程学
模型之外的那个「执行环境」,才是决定任务能否跑完的真正变量。
作为独立开发者,我为什么选择 Eino 来构建 AI 应用(Go语言)
作为独立开发者,我为什么选择 Eino 来构建 AI 应用(Go语言) 独立开发者做 AI 应用,最怕两件事:一是踩坑,二是被框架绑架。 踩坑意味着你花了两周搭的系统,上线后发现根本撑不住并发,或者调试起来像开盲盒;被框架绑架意味着框架的每一次大版本更新都是你的加班夜。 我花了一段时间评估了几个主流选项,最后在自己的项目里选了 Eino。说说理由。我使用的 Eino 版本如下: github.com/cloudwego/eino v0.8.13 你一个人,精力是最稀缺的资源 独立开发者和公司团队最大的区别,不是技术水平,而是精力分配。你同时要管产品、设计、开发、运营,留给"研究框架"的时间极其有限。 这就是为什么框架的设计哲学对你来说比对大公司更重要。一个设计混乱的框架,会把你困在细节里;一个设计清晰的框架,让你专注在真正重要的事上。 Eino 的核心设计思路很简单:把能力拆成组件,把流程描述为图,框架处理所有脏活。 你需要一个 RAG 系统,就把检索、提示词、模型调用几个节点连起来;你需要一个能用工具的 Agent,就把工具注册进去,Agent 的循环调用逻辑框架全包了。 你不需要理解流式数据如何在节点间传递,不需要手写工具调用的解析循环,不需要自己实现多轮对话的上下文管理。这些都是框架该做的事,Eino 做了。 字节跳动帮你提前踩过坑 独立开发者最大的风险之一,是用了一个没有生产验证的框架。看起来文档漂亮,demo 跑得顺,真到线上就各种奇怪问题——并发时状态串了,流式输出在特定场景下卡住了,Token 超限时框架直接崩了。 Eino 在字节跳动内部跑了超过半年,支撑着豆包、TikTok 这类亿级用户的产品。这不是说拿来炫耀的背书,而是一个工程上的实际意义:那些你独自开发时可能要花几个月才踩到的边界 case,字节内部的工程师已经踩过了,并且修掉了。 你站在他们的肩膀上出发,少走很多弯路。 Go 语言是独立开发者的好朋友 很多 AI 框架是 Python 的,Python 当然没有问题,但如果你的后端是 Go 写的——或者你打算用 Go——那嵌入一套 Python 框架会带来真实的运维成本:两套依赖管理、两个运行时、两种调试工具。作为一个人,你付不起这个代价。 Eino 是原生 Go 框架,跟你现有的 Go 服务深度集成,单二进制部署,没有额外的运行时负担。Go 的强类型也意味着很多错误在写代码时就被发现,而不是到线上才暴露——对于没有 QA 团队的你,这一点格外重要。 你不用从零开始集成所有东西 独立开发者做 AI 应用,通常需要接入:某个大模型 API、某个向量数据库、某个可观测性工具。每接一个,都要读一遍 SDK 文档,写一堆胶水代码。 Eino 的扩展库(EinoExt)已经帮你把这些都做了。OpenAI、Claude、Gemini、豆包 Ark、Ollama,开箱可用;Elasticsearch 等向量存储,直接接;OpenTelemetry 的 Tracing,一行配置。你换模型供应商不需要改业务代码,换向量库也一样——因为 Eino 的组件接口是统一的,实现是可替换的。 ...