技术日报 2026-05-22:Agent 语言、A股数据工具包、隐身浏览器
今日技术日报精选 10 条:Vercel 推出 Agent 专用语言 zerolang、A股全栈数据工具包 a-stock-data、隐身版 Playwright invisible_playwright 等。
使用 ChatGPT 修复 QNAP QuMagie 相册不显示照片的问题
使用 ChatGPT 修复 QNAP QuMagie 相册不显示照片的问题 最近处理了一次 QNAP NAS 上 QuMagie 相册无法显示照片的问题。表面现象很迷惑:照片和视频明明在 File Station 里能看到,Multimedia Console 也显示已经完成索引,但 QuMagie 页面里却始终是空的。 这篇文章记录完整排查和修复过程。为了保护隐私,文中的 NAS 地址、账号、真实共享目录、家庭成员姓名、照片路径都做了替换。示例目录和账号仅用于说明问题,不对应真实环境。 问题现象 NAS 上有一个用于存放家庭照片的共享目录,本文用下面这个名字代替: 家庭照片/ QuMagie 的内容来源也已经添加了这个目录。登录 QuMagie 后,页面提示: 此内容源文件夹中没有可用的照片或视频。 此内容源文件夹可能为空,您的访问权限不足,或文件当前仍在处理中。 但其他地方看起来都正常: File Station 可以看到照片和视频。 使用同一个 NAS 账号可以进入目录。 Multimedia Console 里显示照片、视频、缩略图、人物识别、物品识别等任务都已有索引。 QuMagie 内容管理里也能看到这个来源目录。 这类问题很容易让人以为是“权限不足”或“索引还没跑完”。但这次真正的问题并不是文件不存在,也不是普通意义上的权限不足,而是 QuMagie 的共享目录权限路径和 Multimedia Console 的索引路径不一致。 为什么请 ChatGPT 参与排查 这次我没有把 ChatGPT 当成一个简单问答工具,而是把它当作一个排障协作伙伴来用。 整个过程里,ChatGPT 帮我做了几件事: 把现象拆成 File Station、Multimedia Console、QuMagie UI、QuMagie API、底层路径几个层面。 避免直接做破坏性操作,先验证再处理。 设计迁移方案,确保照片和视频不丢。 识别 NAS 自动生成的缩略图、回收站、快照目录,避免污染新相册。 最后通过数量校验和 QuMagie API 确认修复有效。 对 NAS 这类“UI 看起来正常,但底层路径很绕”的问题,单靠界面判断经常不够。ChatGPT 的价值主要是帮助我把排查流程变得更系统。 ...
数字生产实践Codex:AI 编程助手进化到桌面办公智能体
数字生产实践Codex:AI 编程助手进化到桌面办公智能体 AI 编程工具正在从代码生成器,进化为能够操作环境、验证结果、持续协作的软件开发智能体。 在过去,很多人对 AI 编程工具的理解还停留在"帮我补全代码""生成一段函数""解释一段报错"。但 OpenAI 最新版 Codex 的能力已经不止于此。 根据 OpenAI 官方对新版 Codex 的介绍,Codex 正在从一个单纯的代码助手,升级为贯穿软件开发生命周期的智能协作伙伴。它不仅能写代码、理解代码库、处理 PR 评审,还开始具备两类更接近真实开发者工作方式的能力: Computer Use,也就是操作系统级控制能力; 内置浏览器,也就是在 Codex 应用中直接打开、观察和操作网页的能力。 这两项能力的出现,意味着 Codex 不再只是"回答怎么写代码",而是开始进入真实开发环境,帮助开发者完成更完整的任务链路。 一、Codex 正在从代码助手变成开发智能体 传统 AI 编程工具的核心能力是生成代码。用户提出需求,AI 给出代码片段,开发者再自己复制、运行、调试和验证。 而新版 Codex 的方向更接近 开发智能体。 所谓开发智能体,不只是会生成代码,而是能够围绕一个开发目标,主动完成多个连续动作: 读取项目文件; 理解代码结构; 修改代码; 运行终端命令; 打开页面; 复现问题; 检查界面; 验证修复结果; 根据反馈继续调整。 也就是说,Codex 的价值正在从"生成代码"扩展为"完成开发任务"。 这背后最关键的变化,就是它开始具备 操作电脑 和 观察网页 的能力。 二、什么是 Computer Use? Computer Use 可以理解为一种让 AI 像人一样使用电脑界面的技术。 它不是简单调用 API,也不是只在编辑器里生成文本,而是让模型通过屏幕画面理解当前环境,并通过鼠标、键盘等方式执行操作。 它的基本能力包括: 看屏幕:识别当前界面中的按钮、输入框、菜单、弹窗和错误提示; 理解任务:根据用户目标判断下一步应该做什么; 执行操作:点击、输入、滚动、切换窗口、打开应用; 观察反馈:根据界面变化判断任务是否完成; 持续迭代:如果没有完成,就继续调整下一步操作。 可以用一句话概括: ...
数据采集日报 2026年05月21日
数据采集日报 — 2026年05月21日 自动生成于 2026-05-21 00:30 📊 今日市场概览 资产 价格 涨跌幅 BTC $77,198 -0.35% 黄金 $4,518.30/oz -0.37% WTI原油 $100.40/桶 +2.18% 布伦特原油 $106.76/桶 +1.66% 上证指数 4,077.28 -2.04% 深成指 15,247.27 -2.07% 创业板指 3,829.78 -2.35% 恒生指数 25,386.52 -1.03% USD/CNY 6.8020 +0.02% ₿ 加密货币 BTC:$77,198(↓0.35%) 市值:1.55万亿美元 24h成交量:$260.56亿 流通供应量:2,003.24万枚 其他加密货币: ETH:$2,131.20(+0.18%) LTC:$53.72(-0.35%) DOGE:$0.1046(+0.97%) ADA:$0.2485(-0.20%) 🥇 贵金属 黄金:$4,518.30/oz(↓0.37%) 开盘价:$4,548.00 日内最高:$4,572.40 日内最低:$4,488.30 成交量:118.24k手 黄金价格小幅回落,在美元走强和美债收益率攀升的背景下承压。市场关注伊朗对美方和平提议的回应,地缘政治风险仍为金价提供底部支撑。 🛢️ 原油 WTI原油:$100.40/桶(↑2.18%) 布伦特原油:$106.76/桶(↑1.66%) 国际原油价格全线走高,WTI重回$100上方。地缘政治紧张局势持续支撑油价,供应端不确定性仍为市场主旋律。 📈 A股市场 上证指数:4,077.28(↓2.04%) 深成指:15,247.27(↓2.07%) 创业板指:3,829.78(↓2.35%) A股三大指数集体下挫,创业板跌幅最大达2.35%。市场整体呈现调整态势,风险偏好下降。 港股方面: ...
当写代码不再是瓶颈:AI 原生工程组织该如何运转?
当写代码不再是瓶颈:AI 原生工程组织该如何运转? AI团队实践的分水岭:谁更会提出问题,谁更会验证方向,谁更会设计系统,谁更能保持产品品味,谁更能在速度和责任之间找到平衡。 最近听到一期小宇宙播客《Anthropic 如何运营一个 AI 原生工程组织》,内容来自 Anthropic 内部分享的中文版复刻。主讲人 Fiona Fung 是 Claude Code 和 Cowork 的产品与工程负责人,她讨论的不是"AI 能不能帮程序员写代码"这种入门问题,而是一个更深层的问题:当 AI 真的把写代码这件事大幅加速之后,工程组织本身应该怎么变? (小宇宙) 这其实是一个被很多团队低估的问题。 过去几十年,软件团队的组织方式、流程制度、管理方法,几乎都建立在一个默认前提上:工程师时间很贵,写代码是稀缺资源。 所以我们发明了需求评审、排期会、设计文档、技术方案评审、代码所有权、敏捷迭代、瀑布流程、代码审查、发布审批……这些机制的核心目的,都是为了避免把昂贵的工程时间浪费在错误方向上。 但如果 AI 让写代码变得便宜、快速,甚至可以同时生成多个可运行方案,那么原来的瓶颈就会转移。 真正稀缺的,可能不再是"谁来写代码",而是: 谁能判断什么值得做;谁能定义好的产品体验;谁能做出架构取舍;谁能识别安全、法务和业务风险;谁能让团队持续保持高质量决策。 这意味着,AI 原生工程组织不是简单地"给每个工程师配一个 AI 工具",而是要重新审视整个组织系统。 一、旧流程不是错了,而是它服务的假设变了 Fiona 提到一个非常关键的判断:随着 Claude 等 AI 工具把代码编写成本大幅拉低,过去围绕"工程带宽最贵"建立的一整套流程,都可能开始失效。播客简介里也直接点出,从敏捷到瀑布,从设计文档到代码所有权,都需要被重新审视。(小宇宙) 这句话值得每个技术团队反复咀嚼。 很多流程并不是天然低效。它们曾经是合理的,因为它们解决的是当时最重要的问题:如何避免昂贵的开发资源被浪费。 比如,在 AI 之前,一个复杂重构方案可能需要几名工程师投入数周才能验证。于是团队必须先写设计文档、开评审会、讨论边界条件、评估下游影响。因为一旦写错,返工成本很高。 但现在,如果 AI 可以在短时间内生成三种不同实现方案,甚至直接形成可运行 PR,那么"先写很长文档再决定是否动手"的价值就会下降。团队可以用更低成本直接看到代码、运行结果和影响范围。 这不是说设计文档会消失,而是说它的角色变了。 ...
Superpowers 14 个 Skills 全解读:AI 编程纪律框架的完整拆解
Superpowers 14 个 Skills 全解读:AI 编程纪律框架的完整拆解 最核心的价值不是某个单独 skill,而是这条链路: 需求澄清 → 设计确认 → 计划拆解 → 隔离开发 → TDD → review → 验证 → 收尾 这条链路正好针对 AI coding 最常见的失败模式:过早实现、缺少测试、猜测修复、跳过验证、过早宣布成功。 注意:要经常更新 skills 的代码版本和自己结合实际使用,将自己的经验和要求增加到 skills,以便更好的编程和业务准确性,最好是将自身业务的要求单独作为 skills 引入到编程工具里。 Superpowers 是一个给 AI 编程 Agent 的完整软件开发方法论,由一组可组合 skills 和初始指令组成。它的基本工作流是:先澄清需求、写设计、写实施计划、TDD 实现、代码审查、验证、最后合并/PR/清理。 该不该装?三层判断 层面 判断 技术层面 不必须。没有它,AI coding agent 也能写代码。 工程质量层面 对复杂项目,强烈建议。它强制 TDD、审查、验证,能减少"AI 自信但没验证"的问题。 Superpowers 自身规则层面 一旦安装并启用,它的 using-superpowers 明确要求:只要有 1% 可能适用,就必须先调用相关 skill;README 也说这些是 mandatory workflows, not suggestions。 我的建议:重项目安装,轻任务选择性使用;团队协作/生产代码建议默认启用;纯探索、一次性原型可以不用或显式绕开。 1. using-superpowers — 入口规则 这个 skill 不是某个开发动作,而是**"调度所有 skills 的总开关"**。它要求 agent 在任何任务开始前先判断是否有相关 skill;只要有一点可能适用,就要先调用 skill,而不是凭经验直接干。它还规定了优先级:用户明确指令最高,Superpowers skills 其次,默认系统行为最低。 ...
我用 Superpowers 治好了 AI 写代码的'急躁症'
我用 Superpowers 治好了 AI 写代码的"急躁症" 你有没有这种经历? 跟 AI 说一句"帮我加个登录功能",它三秒钟就开始生成代码了。你还没来得及说"我要 OAuth 不要密码登录",它已经把整个 auth 模块写完了。跑一下,报错。让它修,改了三处引入两个新 bug。再改,需求理解全歪了。 折腾一小时,还不如自己写。 问题不在 AI 笨——现在的 Claude、GPT 编程能力已经很强了。问题是它太急了。还没搞清楚你要什么,就急着动手。没有设计,没有测试,没有验证,凭着"感觉"改代码,改完说一句"看起来没问题"就算完成。 我最近发现了一个开源项目,专门治这个毛病。 Superpowers 是什么 Superpowers 是一个给 AI 编程 Agent 装的插件。它不改变模型能力,而是给 Agent 加了一套强制执行的开发流程。 你可以把它理解为:一个严厉但好心的技术 Lead,站在 AI 后面盯着它—— "停,先搞清楚需求再写代码。" "计划呢?计划写好再动手。" "测试呢?测试先写,代码后写。" "代码审查过了吗?没过不许继续。" 它由 Jesse Vincent(Prime Radiant 公司)开发,目前版本 v5.1.0,MIT 协议。支持 Claude Code、Codex CLI、Gemini CLI、Cursor、GitHub Copilot CLI 等主流 AI 编程工具。 实际用起来是什么体验 装上 Superpowers 之后,你和 AI 的交互模式会完全不一样。我用一个实际场景走一遍。 场景:让 AI 帮你做一个用户通知系统 没有 Superpowers 时,对话通常是这样的: 你:帮我做一个通知系统 AI:(立刻开始写代码)我创建了一个 NotificationService…… 你:等一下,我要邮件通知,不是站内信 AI:好的,我重新写…… 你:还需要支持批量发送 AI:我再加一个…… ...
OpenClaw 升级实战:我如何把 2026.5.7 平滑升级到生产环境(macOS + npm)
OpenClaw 升级实战:我如何把 2026.5.7 平滑升级到生产环境 适用环境:OpenClaw 通过 npm -g 安装,Gateway 由 launchd 托管,配置目录在 ~/.openclaw。 实测时间:2026-05-14,目标版本 2026.5.7。 写作目的:不只想记录「怎么做」,更想把整个升级过程中我的思考、犹豫、判断写出来,方便有类似需求的朋友参考。 前言:为什么要升级? 事情是这样的。 那天我像往常一样打开 Telegram,准备和我的 OpenClaw 助手聊几句,突然收到一条来自社区频道的推送——OpenClaw 新版 2026.5.7 发布了。看了一眼更新内容,我愣了一下: KV 缓存压缩比从 4:1 变成 1/128,内存占用直接降 90%? 训练收敛速度提升 3-5 倍? 缓存命中率从 70% 到 92%? 单 token 延迟从 1.8s 砍到 0.7s? 说实话,换做以前一些小版本更新,我可能就忽略掉了。但这几个数字太扎眼了。尤其是缓存命中率和响应延迟这两项,直接影响我每天的使用体验。 我的 OpenClaw 跑了有一段时间了,配置、记忆、定时任务、消息通道都配齐了。说实话,换机器重装一次很麻烦,所以每次升级我都比较谨慎——备份做没做?Gateway 会不会崩?定时任务会不会丢? 但这次数字太香了,我决定动手。 动手之前,我给自己定了几条原则: 先搞清楚现状:本地什么版本,npm 最新什么版本 先备份,再动刀:万一出问题,要有退路 升级完必须验收:Gateway 状态、定时任务、消息通道,一个都不能漏 遇到问题不慌:npm 报错、launchctl 报错,都是有解法的 整个过程下来,确实踩了几个坑,但也验证了一套可复用的流程。写这篇文章,一来是给自己留个记录,二来希望帮到有类似需求的朋友。 第一部分:升级前,先搞清楚值不值得动手 1.1 新版本到底更新了什么? 说实话,我不是一个「追新」的人。我的原则是:如果新版本没有解决我的痛点,或者新特性我用不上,那升级就是徒增风险。所以在决定升级之前,我把 2026.5.7 的 Release Notes 仔细看了一遍。 ...
AI Agent 时代,为什么我放弃 Markdown 全面转向 HTML
AI Agent 时代,为什么我放弃 Markdown 全面转向 HTML 原文作者:Thariq(@trq212),Claude Code 团队工程师 原文发布于 2026 年 5 月 9 日 背景 Markdown 已经成为 AI Agent 与我们沟通时的主流文件格式。它简洁、可移植,具备一定的富文本能力,并且便于编辑。Claude 甚至已经擅长在 Markdown 文件中用 ASCII 字符绘制图表。 但随着 Agent 能力越来越强,我开始觉得 Markdown 成了一种束缚。 Markdown 的局限性 信息密度低 超过 100 行的 Markdown 文件读起来就很吃力。当 Claude 需要表达: 表格数据 设计系统(颜色、组件) 图表和插图 交互效果 Markdown 只能: 画丑丑的 ASCII 图 用 unicode 字符近似呈现颜色(如 🟣🟢🔴) 贴截图或图片链接 视觉体验差 Markdown 扁平化了一切。代码 diff、流程图、模块关系——这些空间信息在 Markdown 里全部被压成一维文字。 当方案的复杂度超过一屏时,Markdown 从"文档"变成了"阅读障碍"。 分享不便 大多数浏览器不能原生渲染 Markdown 文件。你只能: 作为邮件附件发送 粘贴到 GitHub 评论里 上传到某个平台(Notion、飞书等) 而 HTML?上传到 S3 或任何静态托管,一个链接就能分享。 ...
我的AI模型使用情况分享:从云厂商到编程Agent的实战体验
我的AI模型使用情况分享 首先,大多数国内云厂商和模型服务商的模型我都接入和使用过,以下是根据实际体验得出的算力服务上自测评价,排序靠前说明体验感和实际使用效果很好; 我的模型体感(云厂商和模型商) 主要以稳定性、模型质量、使用体验为主的主观描述,国外模型不在表单里,因为属于算力能力和模型能力双领先; 排名 平台 我的推荐理由 我的使用劣势感受 1 火山引擎 / 火山方舟 我会把它作为线上生产环境的首选,尤其适合需要低延迟、高稳定性和持续调用的业务。 我觉得它的优势主要集中在生产稳定性上,如果追求极限低价,可能不是最便宜的选择。 2 阿里云百炼 我会把它作为企业级 AI 应用和多模型生态的主力平台,尤其适合需要工具链、Batch、长上下文和模型管理的场景。 我觉得它的产品体系比较完整,但也相对复杂,上手和配置成本会比单一 API 平台高一些。 3 DeepSeek 官方 我会把它作为低成本、高性价比调用 DeepSeek 模型的首选,适合大批量、成本敏感的任务。 我在高峰期可能会担心它的稳定性和响应速度,所以不一定会把它单独作为核心生产依赖。 4 腾讯云 我会把它作为腾讯云生态内项目的补充选择,尤其适合已经在腾讯云上部署业务的场景。 我觉得它在价格和综合体验上不算最突出,如果没有腾讯云生态绑定,吸引力会弱一些。 5 硅基流动 我会把它作为模型试验和多模型切换的平台,适合快速测试不同开源模型和低成本方案。 我觉得它更适合测试和非实时任务,强实时生产场景下我会更谨慎。 6 MiniMax 官方 我会在长上下文、多模态、语音或特定 MiniMax 模型能力上优先考虑它。 我不会把它作为通用推理 API 的第一主力,因为平台综合稳定性和生态证据不如火山、阿里这类云厂商充分。 7 智谱 GLM 官方 我会在中文场景、长上下文、工具调用和国产模型适配上考虑 GLM。 我觉得它的模型能力有特色,但公开的第三方平台级压测资料相对不足,所以生产主力选择上我会保守一些。 8 天翼云息壤 我会在政企、国产化、合规、央国企或电信体系项目里优先考虑它。 我觉得它更偏政企交付和合规场景,作为个人开发者或互联网产品的主力 API,体验和灵活度可能不是最优,当前缺失缓存机制,成本很高且模型上下文窗口阉割和算力不足。 我的主力模型 gpt + glm5.1 企业使用: 火山放在线上实时调用、Agent 后端、需要稳定低延迟的任务;阿里放企业生态、Qwen、百炼工作流、Batch、长上下文和多模型兜底 个人使用: Claude/Codex 更像"会干活的工程师" 或智谱的coding plans 政企客户: 尤其是电信、政务、金融、央国企场景,息壤价值在合规、国产算力、专网和交付,但个人开发者不推荐 国内模型 模型自测排行 GLM5.1(推荐,中等难度编程 或 自主任务执行) DeepSeek v4(可以赶上GLM5.1) MiniMax 2.7(在复杂任务执行,效果欠佳,比如openclaw的agent自主任务) Seedance 2.0(推荐,视频质量还可以,够用) MiniMax 2.5 和 GLM5(仅适合简单任务) 豆包 = 千问 > 元宝(网页使用推荐前2个) 模型用量数据 我的智谱AI,开通的是季度lite套餐,月度使用量截止到现在是31亿tokens; ...