当写代码不再是瓶颈:AI 原生工程组织该如何运转?
当写代码不再是瓶颈:AI 原生工程组织该如何运转? AI团队实践的分水岭:谁更会提出问题,谁更会验证方向,谁更会设计系统,谁更能保持产品品味,谁更能在速度和责任之间找到平衡。 最近听到一期小宇宙播客《Anthropic 如何运营一个 AI 原生工程组织》,内容来自 Anthropic 内部分享的中文版复刻。主讲人 Fiona Fung 是 Claude Code 和 Cowork 的产品与工程负责人,她讨论的不是"AI 能不能帮程序员写代码"这种入门问题,而是一个更深层的问题:当 AI 真的把写代码这件事大幅加速之后,工程组织本身应该怎么变? (小宇宙) 这其实是一个被很多团队低估的问题。 过去几十年,软件团队的组织方式、流程制度、管理方法,几乎都建立在一个默认前提上:工程师时间很贵,写代码是稀缺资源。 所以我们发明了需求评审、排期会、设计文档、技术方案评审、代码所有权、敏捷迭代、瀑布流程、代码审查、发布审批……这些机制的核心目的,都是为了避免把昂贵的工程时间浪费在错误方向上。 但如果 AI 让写代码变得便宜、快速,甚至可以同时生成多个可运行方案,那么原来的瓶颈就会转移。 真正稀缺的,可能不再是"谁来写代码",而是: 谁能判断什么值得做;谁能定义好的产品体验;谁能做出架构取舍;谁能识别安全、法务和业务风险;谁能让团队持续保持高质量决策。 这意味着,AI 原生工程组织不是简单地"给每个工程师配一个 AI 工具",而是要重新审视整个组织系统。 一、旧流程不是错了,而是它服务的假设变了 Fiona 提到一个非常关键的判断:随着 Claude 等 AI 工具把代码编写成本大幅拉低,过去围绕"工程带宽最贵"建立的一整套流程,都可能开始失效。播客简介里也直接点出,从敏捷到瀑布,从设计文档到代码所有权,都需要被重新审视。(小宇宙) 这句话值得每个技术团队反复咀嚼。 很多流程并不是天然低效。它们曾经是合理的,因为它们解决的是当时最重要的问题:如何避免昂贵的开发资源被浪费。 比如,在 AI 之前,一个复杂重构方案可能需要几名工程师投入数周才能验证。于是团队必须先写设计文档、开评审会、讨论边界条件、评估下游影响。因为一旦写错,返工成本很高。 但现在,如果 AI 可以在短时间内生成三种不同实现方案,甚至直接形成可运行 PR,那么"先写很长文档再决定是否动手"的价值就会下降。团队可以用更低成本直接看到代码、运行结果和影响范围。 这不是说设计文档会消失,而是说它的角色变了。 ...
技术日报 2026-05-19
每日技术精选:AI Agent、本地推理、金融交易、RAG引擎等10条热门技术资讯
技术日报 2026-05-18:AI Agent技能生态爆发
今日技术日报聚焦AI Agent生态:技能注册表、代码知识图谱、Agent原生接口、白盒渗透测试。GitHub Trending多款AI工具集中爆发。
数据采集日报 2026年05月18日
数据采集日报 — 2026年05月18日 自动生成于 2026-05-18 00:30 📊 今日市场概览 资产 价格 涨跌幅 BTC $76,402 ↓2.2% 黄金 $4,540/oz ↓1.42% WTI原油 $105.4/桶 ↑4.20% 布伦特原油 $109.3/桶 — 上证指数 4,131.53 ↓0.09% 深成指 15,530.23 ↓0.20% 创业板指 3,914.88 ↓0.36% USD/CNY 6.82 — ₿ 加密货币 BTC:$76,402(↓2.2%) 24h最高:$78,419 24h最低:$76,055 24h成交量:$426.3亿 市值:$1.53万亿 BTC市占率:58.2% ETH:$2,096(↓4.1%) 加密市场整体回调,BTC连续第7日下跌,较ATH $126,080(2025年10月)已回落39.4%。BTC ETF连续6周净流入后首次出现资金外流,加密基金单周流出**$10.7亿**。 🥇 贵金属 黄金:$4,540/oz(↓1.42%) 30日跌幅:5.24% 6个月涨幅:+11.66% 1年涨幅:保持上涨 黄金在连续上涨后出现获利了结,但地缘政治风险(中东局势、美伊冲突)继续支撑避险需求。上海金价格维持高位。 🛢️ 原油 WTI原油:$105.4/桶(↑4.20%) 布伦特原油:$109.3/桶 油价触及两周高位。主要驱动因素: 阿联酋巴拉卡核电站遭无人机袭击,引发火灾 沙特拦截3架来自伊拉克方向无人机 霍尔木兹海峡通行风险上升,市场担忧石油供应中断 布伦特原油月度涨幅达15.47%,年涨幅68.22% 📈 A股市场 上证指数:4,131.53(↓0.09%) 开盘:4,120.14 最高:4,145.66 最低:4,108.60 深成指:15,530.23(↓0.20%) ...
Superpowers 14 个 Skills 全解读:AI 编程纪律框架的完整拆解
Superpowers 14 个 Skills 全解读:AI 编程纪律框架的完整拆解 最核心的价值不是某个单独 skill,而是这条链路: 需求澄清 → 设计确认 → 计划拆解 → 隔离开发 → TDD → review → 验证 → 收尾 这条链路正好针对 AI coding 最常见的失败模式:过早实现、缺少测试、猜测修复、跳过验证、过早宣布成功。 注意:要经常更新 skills 的代码版本和自己结合实际使用,将自己的经验和要求增加到 skills,以便更好的编程和业务准确性,最好是将自身业务的要求单独作为 skills 引入到编程工具里。 Superpowers 是一个给 AI 编程 Agent 的完整软件开发方法论,由一组可组合 skills 和初始指令组成。它的基本工作流是:先澄清需求、写设计、写实施计划、TDD 实现、代码审查、验证、最后合并/PR/清理。 该不该装?三层判断 层面 判断 技术层面 不必须。没有它,AI coding agent 也能写代码。 工程质量层面 对复杂项目,强烈建议。它强制 TDD、审查、验证,能减少"AI 自信但没验证"的问题。 Superpowers 自身规则层面 一旦安装并启用,它的 using-superpowers 明确要求:只要有 1% 可能适用,就必须先调用相关 skill;README 也说这些是 mandatory workflows, not suggestions。 我的建议:重项目安装,轻任务选择性使用;团队协作/生产代码建议默认启用;纯探索、一次性原型可以不用或显式绕开。 1. using-superpowers — 入口规则 这个 skill 不是某个开发动作,而是**"调度所有 skills 的总开关"**。它要求 agent 在任何任务开始前先判断是否有相关 skill;只要有一点可能适用,就要先调用 skill,而不是凭经验直接干。它还规定了优先级:用户明确指令最高,Superpowers skills 其次,默认系统行为最低。 ...
数据采集日报 2026年05月17日
数据采集日报 — 2026年05月17日 自动生成于 2026-05-17 00:30 📊 今日市场概览 资产 价格 涨跌幅 BTC $78,106 -0.05% 黄金 $4,540/oz -2.40% WTI原油 $105.42/桶 +4.20% 布伦特原油 $109.26/桶 — 上证指数 4,135.39 -1.02% 深成指 15,561.37 -1.17% 创业板指 3,928.80 -0.56% USD/CNY 6.83 — ₿ 加密货币 BTC:$78,106.08(↓0.05%) 24h变化:-$36.14 24h成交量:$174.49亿 市值:1.56万亿美元 流通供应量:2,003.05万枚 ETH:$2,185.09(↑0.23%) LTC:$55.99(↓0.33%) DOGE:$0.1105(↑1.00%) ADA:$0.2577(↑0.84%) BTC在$78,000附近窄幅震荡,市场成交量温和,整体处于盘整状态。 🥇 贵金属 黄金:$4,540.49/oz(↓2.40%,跌$111.80) 上海金:约¥1,459/g 本周累计跌幅约4% 黄金周五加速下跌,受美国通胀数据加速影响,市场对美联储降息预期降温,金价承压。 🛢️ 原油 WTI原油:$105.42/桶(↑4.20%,+$4.25) 布伦特原油:$109.26/桶 原油价格大幅上涨,WTI周涨幅达11%。主要受霍尔木兹海峡局势紧张影响,市场对供应中断的担忧加剧。 📈 A股市场 2026年5月16日(周六)为非交易日,以下为5月15日(周五)收盘数据。 上证指数:4,135.39(↓1.02%) 成交额:1.52万亿 深成指:15,561.37(↓1.17%) 成交额:1.83万亿 创业板指:3,928.80(↓0.56%) ...
我用 Superpowers 治好了 AI 写代码的'急躁症'
我用 Superpowers 治好了 AI 写代码的"急躁症" 你有没有这种经历? 跟 AI 说一句"帮我加个登录功能",它三秒钟就开始生成代码了。你还没来得及说"我要 OAuth 不要密码登录",它已经把整个 auth 模块写完了。跑一下,报错。让它修,改了三处引入两个新 bug。再改,需求理解全歪了。 折腾一小时,还不如自己写。 问题不在 AI 笨——现在的 Claude、GPT 编程能力已经很强了。问题是它太急了。还没搞清楚你要什么,就急着动手。没有设计,没有测试,没有验证,凭着"感觉"改代码,改完说一句"看起来没问题"就算完成。 我最近发现了一个开源项目,专门治这个毛病。 Superpowers 是什么 Superpowers 是一个给 AI 编程 Agent 装的插件。它不改变模型能力,而是给 Agent 加了一套强制执行的开发流程。 你可以把它理解为:一个严厉但好心的技术 Lead,站在 AI 后面盯着它—— "停,先搞清楚需求再写代码。" "计划呢?计划写好再动手。" "测试呢?测试先写,代码后写。" "代码审查过了吗?没过不许继续。" 它由 Jesse Vincent(Prime Radiant 公司)开发,目前版本 v5.1.0,MIT 协议。支持 Claude Code、Codex CLI、Gemini CLI、Cursor、GitHub Copilot CLI 等主流 AI 编程工具。 实际用起来是什么体验 装上 Superpowers 之后,你和 AI 的交互模式会完全不一样。我用一个实际场景走一遍。 场景:让 AI 帮你做一个用户通知系统 没有 Superpowers 时,对话通常是这样的: 你:帮我做一个通知系统 AI:(立刻开始写代码)我创建了一个 NotificationService…… 你:等一下,我要邮件通知,不是站内信 AI:好的,我重新写…… 你:还需要支持批量发送 AI:我再加一个…… ...
OpenClaw 升级实战:我如何把 2026.5.7 平滑升级到生产环境(macOS + npm)
OpenClaw 升级实战:我如何把 2026.5.7 平滑升级到生产环境 适用环境:OpenClaw 通过 npm -g 安装,Gateway 由 launchd 托管,配置目录在 ~/.openclaw。 实测时间:2026-05-14,目标版本 2026.5.7。 写作目的:不只想记录「怎么做」,更想把整个升级过程中我的思考、犹豫、判断写出来,方便有类似需求的朋友参考。 前言:为什么要升级? 事情是这样的。 那天我像往常一样打开 Telegram,准备和我的 OpenClaw 助手聊几句,突然收到一条来自社区频道的推送——OpenClaw 新版 2026.5.7 发布了。看了一眼更新内容,我愣了一下: KV 缓存压缩比从 4:1 变成 1/128,内存占用直接降 90%? 训练收敛速度提升 3-5 倍? 缓存命中率从 70% 到 92%? 单 token 延迟从 1.8s 砍到 0.7s? 说实话,换做以前一些小版本更新,我可能就忽略掉了。但这几个数字太扎眼了。尤其是缓存命中率和响应延迟这两项,直接影响我每天的使用体验。 我的 OpenClaw 跑了有一段时间了,配置、记忆、定时任务、消息通道都配齐了。说实话,换机器重装一次很麻烦,所以每次升级我都比较谨慎——备份做没做?Gateway 会不会崩?定时任务会不会丢? 但这次数字太香了,我决定动手。 动手之前,我给自己定了几条原则: 先搞清楚现状:本地什么版本,npm 最新什么版本 先备份,再动刀:万一出问题,要有退路 升级完必须验收:Gateway 状态、定时任务、消息通道,一个都不能漏 遇到问题不慌:npm 报错、launchctl 报错,都是有解法的 整个过程下来,确实踩了几个坑,但也验证了一套可复用的流程。写这篇文章,一来是给自己留个记录,二来希望帮到有类似需求的朋友。 第一部分:升级前,先搞清楚值不值得动手 1.1 新版本到底更新了什么? 说实话,我不是一个「追新」的人。我的原则是:如果新版本没有解决我的痛点,或者新特性我用不上,那升级就是徒增风险。所以在决定升级之前,我把 2026.5.7 的 Release Notes 仔细看了一遍。 ...
AI Agent 时代,为什么我放弃 Markdown 全面转向 HTML
AI Agent 时代,为什么我放弃 Markdown 全面转向 HTML 原文作者:Thariq(@trq212),Claude Code 团队工程师 原文发布于 2026 年 5 月 9 日 背景 Markdown 已经成为 AI Agent 与我们沟通时的主流文件格式。它简洁、可移植,具备一定的富文本能力,并且便于编辑。Claude 甚至已经擅长在 Markdown 文件中用 ASCII 字符绘制图表。 但随着 Agent 能力越来越强,我开始觉得 Markdown 成了一种束缚。 Markdown 的局限性 信息密度低 超过 100 行的 Markdown 文件读起来就很吃力。当 Claude 需要表达: 表格数据 设计系统(颜色、组件) 图表和插图 交互效果 Markdown 只能: 画丑丑的 ASCII 图 用 unicode 字符近似呈现颜色(如 🟣🟢🔴) 贴截图或图片链接 视觉体验差 Markdown 扁平化了一切。代码 diff、流程图、模块关系——这些空间信息在 Markdown 里全部被压成一维文字。 当方案的复杂度超过一屏时,Markdown 从"文档"变成了"阅读障碍"。 分享不便 大多数浏览器不能原生渲染 Markdown 文件。你只能: 作为邮件附件发送 粘贴到 GitHub 评论里 上传到某个平台(Notion、飞书等) 而 HTML?上传到 S3 或任何静态托管,一个链接就能分享。 ...
我的AI模型使用情况分享:从云厂商到编程Agent的实战体验
我的AI模型使用情况分享 首先,大多数国内云厂商和模型服务商的模型我都接入和使用过,以下是根据实际体验得出的算力服务上自测评价,排序靠前说明体验感和实际使用效果很好; 我的模型体感(云厂商和模型商) 主要以稳定性、模型质量、使用体验为主的主观描述,国外模型不在表单里,因为属于算力能力和模型能力双领先; 排名 平台 我的推荐理由 我的使用劣势感受 1 火山引擎 / 火山方舟 我会把它作为线上生产环境的首选,尤其适合需要低延迟、高稳定性和持续调用的业务。 我觉得它的优势主要集中在生产稳定性上,如果追求极限低价,可能不是最便宜的选择。 2 阿里云百炼 我会把它作为企业级 AI 应用和多模型生态的主力平台,尤其适合需要工具链、Batch、长上下文和模型管理的场景。 我觉得它的产品体系比较完整,但也相对复杂,上手和配置成本会比单一 API 平台高一些。 3 DeepSeek 官方 我会把它作为低成本、高性价比调用 DeepSeek 模型的首选,适合大批量、成本敏感的任务。 我在高峰期可能会担心它的稳定性和响应速度,所以不一定会把它单独作为核心生产依赖。 4 腾讯云 我会把它作为腾讯云生态内项目的补充选择,尤其适合已经在腾讯云上部署业务的场景。 我觉得它在价格和综合体验上不算最突出,如果没有腾讯云生态绑定,吸引力会弱一些。 5 硅基流动 我会把它作为模型试验和多模型切换的平台,适合快速测试不同开源模型和低成本方案。 我觉得它更适合测试和非实时任务,强实时生产场景下我会更谨慎。 6 MiniMax 官方 我会在长上下文、多模态、语音或特定 MiniMax 模型能力上优先考虑它。 我不会把它作为通用推理 API 的第一主力,因为平台综合稳定性和生态证据不如火山、阿里这类云厂商充分。 7 智谱 GLM 官方 我会在中文场景、长上下文、工具调用和国产模型适配上考虑 GLM。 我觉得它的模型能力有特色,但公开的第三方平台级压测资料相对不足,所以生产主力选择上我会保守一些。 8 天翼云息壤 我会在政企、国产化、合规、央国企或电信体系项目里优先考虑它。 我觉得它更偏政企交付和合规场景,作为个人开发者或互联网产品的主力 API,体验和灵活度可能不是最优,当前缺失缓存机制,成本很高且模型上下文窗口阉割和算力不足。 我的主力模型 gpt + glm5.1 企业使用: 火山放在线上实时调用、Agent 后端、需要稳定低延迟的任务;阿里放企业生态、Qwen、百炼工作流、Batch、长上下文和多模型兜底 个人使用: Claude/Codex 更像"会干活的工程师" 或智谱的coding plans 政企客户: 尤其是电信、政务、金融、央国企场景,息壤价值在合规、国产算力、专网和交付,但个人开发者不推荐 国内模型 模型自测排行 GLM5.1(推荐,中等难度编程 或 自主任务执行) DeepSeek v4(可以赶上GLM5.1) MiniMax 2.7(在复杂任务执行,效果欠佳,比如openclaw的agent自主任务) Seedance 2.0(推荐,视频质量还可以,够用) MiniMax 2.5 和 GLM5(仅适合简单任务) 豆包 = 千问 > 元宝(网页使用推荐前2个) 模型用量数据 我的智谱AI,开通的是季度lite套餐,月度使用量截止到现在是31亿tokens; ...