受够了 OpenClaw 的失忆,我本周爱上了 Hermes Agent

受够了 OpenClaw 的失忆,我本周爱上了 Hermes Agent 大多数人以为 Hermes 只是一个 AI 聊天框架。但它实际上是一个可长期运行、多角色协作、多入口接入的 Agent Runtime,已经非常接近真正意义上的 AI Operating System。 Hermes Agent 在不到三个月内突破 14 万 GitHub Star,并根据 OpenRouter 的数据成为目前全球使用量最大的 Agent。在折腾了 2 个月,受够了 OpenClaw 的失忆后,我尝试用业界火热的 Hermes Agent,效果居然出奇的好,因此写下这篇安利文章。 关键词:#openclaw #Hermes 能力标签:多Agent协作 · 长期记忆隔离 · 子代理并行 · 多用户隔离 · 任务编排 · Agent Runtime 为什么这么火?三个根本原因 1. 解决了 Agent 领域最痛的问题——失忆 Hermes 要解决的正是这个问题,不是用 prompt 技巧,而是在架构层面内置了一个闭环学习机制——运行时间越长,它就越了解你。 2. 自我进化的技能系统 Hermes 有四个核心差异化能力,其中最突出的是"自进化技能"——它会自己编写并优化 skill 文档。每当 Hermes 解决一个困难问题,它就会写下一份可复用的 skill 文档,之后永远不会忘记这个解法。这些 skill 可搜索、可共享,并兼容 agentskills.io 开放标准。 ...

2026-05-25 · 2 min · 369 words · FunkyGod

【AI前沿观察】2026-05-23 日报|Gartner认证OpenAI编程Agent领导者,人形机器人集体爆发

【AI前沿观察】2026-05-23 日报|Gartner认证OpenAI编程Agent领导者,人形机器人集体爆发 自动生成于 2026-05-23 23:00 📊 今日推送概览 共推送 6 条 重要资讯,涵盖 AI 编程 Agent、人形机器人量产突破、自动驾驶商业化三大方向。今日的主旋律异常清晰——具身智能从概念走向落地,多个玩家同时在制造、部署、商业化三个维度取得了实质性进展。 🔵 AI 领域 OpenAI named a Leader in enterprise coding agents by Gartner 事实:Gartner 在 2026 年企业编程 Agent 魔力象限中,将 OpenAI(Codex)评为「领导者」象限。这是编程 Agent 作为独立品类首次被 Gartner 纳入评估。 思考:Gartner 的认可意味着「AI 编程 Agent」不再只是开发者玩具,而是企业 IT 采购清单上的正式品类。OpenAI 在这个赛道的布局——从 Codex CLI 到与 Dell 的混合云合作——正在构建一条从个人开发者到大型企业的完整商业化路径。对 GitHub Copilot、Cursor、Windsurf 等竞品而言,这是一个不能忽视的信号:品类已经被定义,竞争将围绕企业级能力展开。 🟣 具身智能 Figure AI 直播引爆全网:人形机器人连续工作 48 小时无故障 事实:Figure AI 进行了一场持续直播,展示其搭载 Helix 02 模型的人形机器人连续 48 小时无故障运行,执行包裹分拣任务。直播在全网引发大量关注。 思考:48 小时连续无故障——这个数字的意义远超技术演示本身。工业客户最关心的从来不是机器人能做什么花哨动作,而是「它能稳定干多久」。Figure AI 选择了最朴素的展示方式(直播不剪辑),恰好击中了市场信任的核心痛点。结合其 4 个月产能提升 24 倍的消息,Figure AI 正在从「融资明星」转向「交付型公司」。 Humanoid 签下舍弗勒大单:数千台轮式人形机器人将部署德国工厂 事实:德国 Humanoid 公司与全球汽车零部件巨头舍弗勒(Schaeffler)签署协议,将部署数千台轮式人形机器人到德国工厂中,采用 RaaS(机器人即服务)模式。 思考:这是一笔标志性订单。数千台的量级已经不再是「试点」或「概念验证」,而是正式的工业部署。RaaS 模式降低了客户的采纳门槛——不需要一次性购买,按使用付费。如果舍弗勒的部署效果达到预期,将为整个欧洲制造业的人形机器人采纳打开闸门。 Tesla Fremont 工厂停产 Model S/X,产线转产 Optimus 人形机器人 事实:Tesla 已正式停止 Fremont 工厂的 Model S/X 生产,将产线改造用于 Optimus 人形机器人的制造。Model S/X 作为 Tesla 最悠久的车型系列,至此画上句号。 思考:这条消息的象征意义大于实际产能意义。Musk 正在用行动告诉市场:Tesla 的未来不是更多的车,而是机器人。停产旗舰车型来造机器人,这种赌注在汽车工业史上几乎没有先例。但也要看到,Model S/X 本身销量已大幅下滑,停产的商业逻辑并不亏。真正值得追踪的是:Optimus 的实际产能爬坡速度,以及 Tesla 自用 vs 外卖的占比。 🚗 自动驾驶 Tesla 在达拉斯和休斯顿推出完全无人监督 Robotaxi 服务:573 辆车已上路 事实:Tesla 已在达拉斯和休斯顿两个城市启动完全无人监督的 Robotaxi 服务,目前共有 573 辆运营车辆。 思考:573 辆是一个务实的起步数字。Tesla 选择德克萨斯州并不意外——监管环境相对宽松,且是自家后院。关键问题是安全数据:完全无人监督意味着没有安全员兜底,任何一次严重事故都可能让整个项目倒退数月。与 Waymo 相比,Tesla 的路径更激进(纯视觉方案、无激光雷达),但规模化潜力更大。 全球 Robotaxi 行业 2026 大爆发:Tesla、Waymo、中国 AI 车企重塑交通格局 事实:行业分析指出,2026 年是全球 Robotaxi 行业爆发元年,Tesla、Waymo、以及中国多家 AI 车企(百度 Apollo、小马智行等)正在同时扩大无人出租车服务覆盖范围。 思考:2026 年确实是 Robotaxi 的关键转折年——不再是「技术验证」,而是「商业验证」阶段。三个阵营各有优势:Waymo 有技术和安全记录、Tesla 有规模和成本优势、中国车企有政策支持和密集城市测试场景。最终决定胜负的可能是运营效率和单位经济模型,而非单纯的技术参数。 📌 今日核心洞察 人形机器人进入「订单驱动」阶段:Figure AI 的 48 小时直播、Humanoid 的舍弗勒大单、Tesla 的产线转型——三条消息在同一周汇聚,说明人形机器人正在从「技术秀」转向「商业交付」。2026 年下半年,关注点将从「能做什么」转向「卖了多少台」。 ...

2026-05-23 · 1 min · 202 words · FunkyGod

我为什么推荐 new-api:从“能调用模型”到“能运营 AI 业务”的工程答案

很多团队做 AI 产品,第一阶段都很顺利: 调通一个模型; 写几个 API; 跑出一个 demo。 但到了第二阶段,问题会集中爆发: 客户要稳定,单一上游不稳定; 成本要可控,调用量上来后账就乱了; 用户要分层,个人、团队、管理员权限都不一样; 运营要可视,出了问题要知道是谁、哪个 key、哪个渠道、哪个模型; 商业要闭环,充值、订阅、额度、结算要打通。 这时你会发现,真正难的不是“会调模型”,而是“把模型能力做成一个能长期运营的系统”。 我这几天把 new-api 关键代码路径完整过了一遍,结论是:它的价值不在于“支持 40+ 上游”这句话本身,而在于它把 AI 网关最难的工程问题做成了一整套闭环。 这篇文章我不做功能清单,而是按“工程决策”的视角,讲我为什么推荐它。 典型请求链路 客户端 ↓ /v1/chat/completions 或 /v1/messages ↓ 认证 TokenAuth / UserAuth ↓ 限流 ModelRequestRateLimit ↓ 分发 Distribute ↓ Relay 进行请求校验、token 估算、预扣费 ↓ Adaptor 转换上游格式并请求 provider ↓ DoResponse 解析 usage 与流式结果 ↓ Settle / Refund 完成结算或退款 先说结论:new-api 适合什么团队? 如果你符合下面两条以上,我建议认真评估 new-api: ...

2026-05-23 · 3 min · 542 words · FunkyGod

AI时代,信任基础设施正在成为刚需

在AIGC爆发之后,社会需要的不只是更强的生成模型,也需要更可靠的鉴伪系统。 过去两年,AI 生成内容从“新奇玩具”变成了基础能力,也开始从“效率工具”变成“风险放大器”。 它可以帮你生成海报、头像、视频、广告、PPT,也可以帮你生成谣言、诈骗、伪证、假合同、假客服、假高管发言,甚至直接攻击一个人的尊严和一个机构的信任。 这就是为什么我越来越相信一件事:AI 时代真正稀缺的,不只是生成能力,而是验证能力。 换句话说,未来的核心竞争力不只是“能不能做出内容”,而是“能不能证明内容是真的”。 一、两个事件,把“信任问题”讲得很清楚 最近我把两个新闻放在一起看,一个是意大利总理梅洛尼遭遇 AI 假照片事件,另一个是伯克希尔哈萨维公开提醒公众警惕冒充巴菲特的 AI 伪造视频。 这两个事件看起来分属不同领域,一个偏社会舆论,一个偏金融传播,但它们都指向同一个问题:AI 伪造正在攻击信任本身。 1. 梅洛尼假照片:伪造开始攻击个人尊严 梅洛尼事件提醒我们,AI 伪造不只是“看起来像不像”的娱乐问题,而是会实打实伤害一个人的人格、声誉和安全。 这类伪造有几个明显特征: 伪造门槛很低。 传播速度远高于澄清速度。 普通人比公众人物更难自证清白。 以前,合成一张假图需要技术、设备和时间。现在,只要有足够的公开照片、公开视频和生成工具,普通人就可能被伪造成不雅图、涉政图、诈骗头像或虚假证据。 更麻烦的是,伪造内容一旦进入社交平台,传播链条往往比事实链条快得多。等当事人澄清时,截图、转发和二次传播已经让伤害完成了。 2. 假巴菲特视频:伪造开始攻击金融信任 如果说梅洛尼事件攻击的是个人尊严,那么“假巴菲特”视频攻击的就是金融信任。 巴菲特不是普通名人,他的发言天然带有市场权威。一个“看起来像他、听起来像他、说话方式也像他”的 AI 视频,本质上是在借用权威身份做信任劫持。 这件事的危险不在于“有多像”,而在于“有多少人会信”。 在金融场景里,信任本身就是资产。伪造可能带来至少四类风险: 诱导投资者购买虚假产品。 制造市场情绪,让用户误判权威来源。 损害品牌和机构声誉,让辟谣成本激增。 让公众对真实信息也开始怀疑,形成“什么都可能是假的”的信任疲劳。 所以,AI 伪造不是单纯的内容问题,而是交易、传播和身份验证的底层问题。 二、为什么“信任基础设施”会变成新刚需 过去互联网最擅长解决的是“信息如何传播”。 现在 AI 时代最需要解决的是“信息如何被信任”。 这就是我理解的“信任基础设施”: 图片是否被篡改。 视频是否被合成。 文档是否被修改。 身份是否被冒充。 来源是否可追溯。 证据是否可审计。 如果没有这层基础设施,AI 只会把整个数字世界推向一种更低成本、更高频率、更难验证的混乱。 所以我越来越倾向于把鉴伪、溯源、身份验证、数字水印、可信认证、风控规则看作同一类能力:它们共同构成了 AI 时代的新底座。 三、C 端为什么需要鉴伪:每个人都需要“验真权” 对于普通用户来说,AI 最大的变化不是“模型更聪明了”,而是“你看到的东西未必可信了”。 我们过去默认“照片是证据”,现在这个默认前提正在失效。 C 端的典型场景 社交平台验图。 收到可疑图片时先检测,再决定是否转发。 被冒用头像、被合成不雅图、被伪造聊天记录时,能快速出具检测结果。 家庭反诈,尤其是老人、孩子面对“熟人照片 + 伪造语音 + 假视频”的组合欺骗。 内容创作者保护,避免被冒充、被造谣、被恶意拼接。 我把这种能力称为“验真权”,意思是普通人也应该拥有一个低成本、可理解、可分享的方式去判断: ...

2026-05-23 · 2 min · 229 words · FunkyGod

【AI前沿观察】2026-05-21 日报

【AI前沿观察】2026-05-21 日报 自动生成于 2026-05-21 23:00 📊 今日推送概览 共推送 5 条重要资讯,覆盖 AI 推理突破、英伟达财报、云计算 Capex、半导体代工、内容溯源等方向。 🔵 AI 领域 OpenAI 推理模型自主推翻80年离散几何猜想 事实:OpenAI 宣布其内部通用推理模型自主证明了组合几何领域最著名的问题之一——Erdős 1946年提出的平面单位距离问题(unit distance problem)中的一个核心猜想为假。该模型提供了一个无穷族的反例构造,实现了对已知最优构造的多项式级改进。证明已由外部数学家团队验证,Fields 奖得主 Tim Gowers 称之为"AI 数学的里程碑"。 思考:这是 AI 第一次自主解决一个数学子领域的核心开放问题——不是人类引导下的证明助手,而是一个通用推理模型独立完成从构思到严格证明的全过程。更值得注意的是,证明方法本身引入了代数数论中的高级工具来解决一个初等几何问题,说明模型不只是穷举搜索,而是具备了某种"数学直觉"。这为 AI 在基础科学研究中的角色提供了迄今为止最有力的证据。 OpenAI 与 Google 合作推进 AI 内容溯源 事实:OpenAI 宣布成为 C2PA(内容溯源与真实性联盟)认证生成器,并与 Google DeepMind 合作将 SynthID 不可见水印集成到 ChatGPT、Codex 和 API 生成的图片中。C2PA 元数据提供详细的内容来源信息,SynthID 水印则在元数据被剥离后仍可追踪,两者互补构建多层溯源体系。 思考:AI 生成内容的可信度问题正从"该不该标记"的讨论阶段进入"怎么标记"的工程落地阶段。OpenAI + Google 的组合几乎覆盖了主流 AI 图片生成的全部场景,SynthID 在截图、格式转换等变换下的鲁棒性是关键卖点。不过,这套体系的有效性最终取决于社交媒体平台是否愿意接入验证——这不仅是技术问题,更是商业博弈。 🟠 半导体 英伟达 FY27Q1 全面超预期:营收 816 亿美元同比+85% 事实:英伟达 2027 财年 Q1 营收 816.15 亿美元(同比+85%),GAAP 净利润 583.21 亿美元(同比+211%)。数据中心营收 752 亿美元(同比+92%),贡献 92% 总收入。超大规模客户营收 378.69 亿美元(同比+115%),企业/消费互联网营收 373.77 亿美元(同比+74%)。下一代 Vera Rubin 芯片确认下半年发货,供应持续紧张。但值得注意的是,英伟达高端 AI 芯片市场份额可能从 80%+ 回落至 70% 以下。 思考:单季 816 亿美元的营收意味着英伟达一年化营收已超 3200 亿美元——这个数字在五年前几乎不可想象。但信号不全是利好:增速从三位数回落至 85%、高端份额开始被蚕食,都暗示"英伟达独大"的格局正在松动。AMD、华为昇腾、Cerebras 等替代方案的崛起是结构性趋势。Vera Rubin 能否维持定价权,是下一个关键观察点。 华泰:AI 需求外溢推动代工扩产,硅光+CoPoS 成新增长极 事实:华泰证券分析 16 家全球代工封测企业 Q1 业绩,发现台积电、三星、海力士均加大设备投资。硅光技术成为新增长极,POET 获得 5000 万美元光引擎订单。光模块板块 Q1 营收增速 99%,毛利率 42%。AI 需求正从 GPU 向光互连、先进封装等上游环节加速外溢。 思考:硅光是 AI 算力基建的下一个瓶颈——当 GPU 集群规模扩展到十万卡级别,铜互连的物理极限迫使产业向光互连转型。光模块 99% 的增速和 42% 的毛利率说明市场正在用脚投票。这个赛道的确定性甚至可能高于 GPU 本身,因为它是跨供应商的共性需求。 🟡 AI 货币化 北美五大云厂商 Q1 Capex 合计 1393 亿美元,全年 AI 投资上修至 7250 亿 事实:Q1 单季北美五大云厂商合计资本开支达 1393 亿美元。四大云厂全年 AI Capex 从预期 6700 亿上修至 7250 亿美元。云增速方面:Google Cloud 63% 领跑,Azure 40%,AWS 28%,AWS 利润率 37.7%。分析指出,AI Capex 投入到 Token 需求放量的传导周期约两年,国内 2026-2027 年进入收入兑现期。 思考:单季 1393 亿美元的 Capex 是一个令人眩晕的数字——这几乎等于某些中等国家一年的 GDP。更关键的是全年 7250 亿的指引还在上修,说明市场对 AI 基础设施的需求远未见顶。但隐患同样明显:Token 需求的传导周期长达两年,意味着当前投入的回报要在 2027-2028 年才能真正验证。如果届时需求不及预期,这将是人类历史上最大的资本错配之一。 📌 今日核心洞察 AI 推理能力的质变:OpenAI 推理模型自主解决 Erdős 猜想,标志着 AI 从"工具"向"研究伙伴"的跃迁。通用推理模型在无定向提示下完成原创数学证明,这是 AI 科学能力的标志性事件。 ...

2026-05-21 · 2 min · 231 words · FunkyGod

数字生产实践Codex:AI 编程助手进化到桌面办公智能体

数字生产实践Codex:AI 编程助手进化到桌面办公智能体 AI 编程工具正在从代码生成器,进化为能够操作环境、验证结果、持续协作的软件开发智能体。 在过去,很多人对 AI 编程工具的理解还停留在"帮我补全代码""生成一段函数""解释一段报错"。但 OpenAI 最新版 Codex 的能力已经不止于此。 根据 OpenAI 官方对新版 Codex 的介绍,Codex 正在从一个单纯的代码助手,升级为贯穿软件开发生命周期的智能协作伙伴。它不仅能写代码、理解代码库、处理 PR 评审,还开始具备两类更接近真实开发者工作方式的能力: Computer Use,也就是操作系统级控制能力; 内置浏览器,也就是在 Codex 应用中直接打开、观察和操作网页的能力。 这两项能力的出现,意味着 Codex 不再只是"回答怎么写代码",而是开始进入真实开发环境,帮助开发者完成更完整的任务链路。 一、Codex 正在从代码助手变成开发智能体 传统 AI 编程工具的核心能力是生成代码。用户提出需求,AI 给出代码片段,开发者再自己复制、运行、调试和验证。 而新版 Codex 的方向更接近 开发智能体。 所谓开发智能体,不只是会生成代码,而是能够围绕一个开发目标,主动完成多个连续动作: 读取项目文件; 理解代码结构; 修改代码; 运行终端命令; 打开页面; 复现问题; 检查界面; 验证修复结果; 根据反馈继续调整。 也就是说,Codex 的价值正在从"生成代码"扩展为"完成开发任务"。 这背后最关键的变化,就是它开始具备 操作电脑 和 观察网页 的能力。 二、什么是 Computer Use? Computer Use 可以理解为一种让 AI 像人一样使用电脑界面的技术。 它不是简单调用 API,也不是只在编辑器里生成文本,而是让模型通过屏幕画面理解当前环境,并通过鼠标、键盘等方式执行操作。 它的基本能力包括: 看屏幕:识别当前界面中的按钮、输入框、菜单、弹窗和错误提示; 理解任务:根据用户目标判断下一步应该做什么; 执行操作:点击、输入、滚动、切换窗口、打开应用; 观察反馈:根据界面变化判断任务是否完成; 持续迭代:如果没有完成,就继续调整下一步操作。 可以用一句话概括: ...

2026-05-21 · 3 min · 617 words · FunkyGod

【AI前沿观察】2026-05-20 日报

【AI前沿观察】2026-05-20 日报 自动生成于 2026-05-20 23:01 📊 今日推送概览 共推送 1 条重要资讯。今日 AI 行业动态相对平静,但 OpenAI 在内容溯源安全领域放了一个大招——多层验证体系正式落地,标志着 AI 生成内容可追溯性从"行业标准讨论"进入"工程实践"阶段。 🔵 AI 领域 OpenAI 推出多层内容溯源体系:C2PA 合规 + Google SynthID 水印 + 公开验证工具 事实: OpenAI 正式宣布成为 C2PA(内容溯源与真实性联盟)合规生成产品,其生成的图像内容将携带符合 C2PA 标准的加密元数据,包含生成来源、创建方式和签名信息 与 Google DeepMind 合作,在 ChatGPT、Codex 和 API 生成的图像中嵌入 SynthID 不可见水印。这种水印能够抵抗截图、裁剪、格式转换等常见变换操作 同步推出公开验证工具预览版(openai.com/verify),用户可上传图片检测是否包含 OpenAI 的溯源信号(包括 Content Credentials 和 SynthID) 该体系覆盖 DALL·E 3、ImageGen 和 Sora 的图像/视频生成产品线 思考: 这是 AI 行业在"可信赖内容"方向上迄今最完整的技术方案。三句话概括其意义: C2PA 元数据 + SynthID 水印的双层架构是务实选择——元数据提供丰富上下文但易被剥离,水印更持久但信息量有限,两者互补形成纵深防御 OpenAI 与 Google 的合作本身就是信号:内容溯源不是某家公司的护城河,而是行业基础设施。SynthID 是 Google 的技术,OpenAI 选择采用而非自建,说明在安全层面巨头愿意跨越商业边界 公开验证工具是关键一步——技术再好,如果只有平台内部能用,就失去意义。让普通用户能验证"这张图是不是 AI 生成的",是把信任交还给公众 但也要清醒:这套体系目前只覆盖 OpenAI 自家的内容,且明确承认"没有任何检测方法是万无一失的"。真正的影响力取决于其他生成式 AI 厂商是否跟进,以及社交媒体平台是否集成本地验证。如果 Midjourney、Stability AI、字节跳动等不加入,溯源生态就会有巨大缺口。 ...

2026-05-20 · 1 min · 119 words · FunkyGod

【AI前沿观察】2026-05-19 日报

【AI前沿观察】2026-05-19 日报 自动生成于 2026-05-19 23:00 📊 今日推送概览 共推送 1 条核心资讯,补充信息流 AI/半导体相关动态 6 条,覆盖企业 AI 部署、半导体制造、AI 治理与地缘政治、数据中心能源争议等方向。 🔵 AI 领域 OpenAI 与 Dell 合作:Codex 进入混合云和本地部署企业环境 事实:OpenAI 宣布与 Dell Technologies 达成战略合作伙伴关系,将 Codex(OpenAI 的 AI 编程 Agent)引入混合云和本地部署的企业环境。这标志着 OpenAI 的 Agent 产品首次大规模进入传统 IT 基础设施。 思考:这是 OpenAI 企业化战略的重大一步。Codex 之前主要在云端运行,而大型企业(金融、医疗、政务)出于数据安全和合规考虑,对本地部署有强烈需求。Dell 在全球企业 IT 基础设施中的渗透率极高,这次合作相当于为 Codex 打开了通往财富 500 强的大门。值得关注的是,OpenAI 此前成立了专门的 Deployment Company(DeployCo),这次与 Dell 的合作很可能是该战略的首次重大落地。Agent 从云端走向边缘,2026 年企业 AI 的竞争主战场正在从模型能力转向部署方式。 Intel 与 NVIDIA 宣布深度合作 事实:NVIDIA 和 Intel 联合宣布将共同开发多代定制数据中心和 PC 产品,涵盖 AI 基础设施和个人计算领域。 思考:这桩合作出乎不少人意料。NVIDIA 一直与 TSMC 深度绑定,如今转身与 Intel 合作,背后是地缘政治风险分散和产能多元化的考量。Intel 的代工业务(IFS)虽然仍在爬坡,但在美国政府推动本土半导体制造的背景下,NVIDIA 需要 Intel 作为"美国制造"的备份产能。对 Intel 而言,拿下 NVIDIA 这个客户是其代工业务的重要背书。双方各取所需,但最终产品能否达到性能预期,仍需时间验证。 🟠 半导体 TSMC 公布工艺路线图至 2029 年:A12、A13、N2U 等新节点亮相 事实:台积电公布了延伸至 2029 年的先进工艺路线图,正式宣布 A12、A13、N2U 等新工艺节点。这标志着半导体制造工艺将继续向更小节点推进。 思考:台积电这份路线图传递了明确信号:摩尔定律远未终结。A12(约 1.2nm)和 A13(约 1.3nm)节点的规划意味着未来 3 年内,AI 芯片的晶体管密度还将大幅提升。值得注意的是,N2U(N2 的增强版)可能成为性价比最高的节点,类似于当年 N5P 的角色。对芯片设计公司来说,选择哪个节点不再是单纯的工艺参数问题,还要考虑产能分配和成本结构——台积电的先进产能永远是供不应求的稀缺资源。 🟢 AI 治理与地缘政治 中美元首同意开展人工智能政府间对话 事实:外交部发言人确认,特朗普总统访华期间,两国元首就人工智能问题进行了建设性交流,同意开展人工智能政府间对话。中方表示作为两个人工智能大国,中美应携手促进 AI 发展和治理。 思考:AI 首次成为中美元首级会谈的核心议题之一,这是一个里程碑事件。这意味着 AI 治理已经从技术层面上升到国家安全和外交战略层面。政府间对话机制的建立,可能涉及 AI 安全标准、芯片出口管控、AI 军事应用限制等敏感话题。但从实际效果来看,中美在 AI 领域的合作更像是一种"管控分歧"而非"深度融合"——双方都会在对话中争取自身利益最大化。 🔴 数据中心与能源 IEA 报告:AI 数据中心电力需求到 2030 年可能接近翻倍 事实:国际能源署发布报告指出,AI 数据中心的电力需求到 2030 年可能接近翻倍,将对全球能源供给体系构成巨大挑战。 思考:IEA 的这份报告将 AI 算力的能源问题推到了政策讨论的中心。翻倍的电力需求意味着新的发电厂、新的输电线路、新的冷却系统——这不是技术问题,而是基础设施和公共政策问题。特别是在美国,数据中心已经占据了部分地区 20% 以上的电力消耗。如果 AI 推理成本持续下降导致使用量激增,能源瓶颈可能成为 AI 发展的天花板。 Gallup 民调:美国民众反对在本地建设 AI 数据中心 事实:Gallup 最新民调显示,越来越多的美国民众反对在其居住区域附近建设 AI 数据中心,NIMBY 情绪正在成为算力基建扩张的重要障碍。 思考:技术乐观主义者经常忽视社会接受度这个变量。数据中心的噪音、水资源消耗、对当地电网的压力,都是真实的社区关切。叠加 IEA 的能源报告来看,AI 产业正面临一个结构性矛盾:算力需求指数级增长,但社会对数据中心的容忍度在下降。这可能导致数据中心向偏远地区、海上平台甚至太空迁移的加速。 美参议员 Schiff 提出法案:保护消费者免受 AI 数据中心能源成本转嫁 事实:加州民主党参议员 Adam Schiff 提出能源成本公平与可靠性法案,防止 AI 数据中心的能源成本被转嫁给普通消费者。 思考:Schiff 的法案反映了一个新兴的政策趋势:AI 的社会成本谁来承担?数据中心消耗巨量电力,推高电价,但利润被科技公司拿走——这种不对等正在引发政治反弹。如果法案通过,将迫使 AI 公司承担更多基础设施成本,可能推高 AI 服务的价格。这也可能催生新的商业模式,比如 AI 公司投资可再生能源来对冲能源成本。 📌 今日核心洞察 Agent 从云端走向企业机房:OpenAI 与 Dell 合作标志着 AI Agent 进入混合云/本地部署时代。企业 AI 的竞争主战场正在从"谁的模型更强"转向"谁能更好地部署到现有 IT 基础设施中"。Dell、HPE 等传统 IT 巨商在 Agent 时代可能迎来第二春。 ...

2026-05-19 · 2 min · 224 words · FunkyGod

当写代码不再是瓶颈:AI 原生工程组织该如何运转?

当写代码不再是瓶颈:AI 原生工程组织该如何运转? AI团队实践的分水岭:谁更会提出问题,谁更会验证方向,谁更会设计系统,谁更能保持产品品味,谁更能在速度和责任之间找到平衡。 最近听到一期小宇宙播客《Anthropic 如何运营一个 AI 原生工程组织》,内容来自 Anthropic 内部分享的中文版复刻。主讲人 Fiona Fung 是 Claude Code 和 Cowork 的产品与工程负责人,她讨论的不是"AI 能不能帮程序员写代码"这种入门问题,而是一个更深层的问题:当 AI 真的把写代码这件事大幅加速之后,工程组织本身应该怎么变? (小宇宙) 这其实是一个被很多团队低估的问题。 过去几十年,软件团队的组织方式、流程制度、管理方法,几乎都建立在一个默认前提上:工程师时间很贵,写代码是稀缺资源。 所以我们发明了需求评审、排期会、设计文档、技术方案评审、代码所有权、敏捷迭代、瀑布流程、代码审查、发布审批……这些机制的核心目的,都是为了避免把昂贵的工程时间浪费在错误方向上。 但如果 AI 让写代码变得便宜、快速,甚至可以同时生成多个可运行方案,那么原来的瓶颈就会转移。 真正稀缺的,可能不再是"谁来写代码",而是: 谁能判断什么值得做;谁能定义好的产品体验;谁能做出架构取舍;谁能识别安全、法务和业务风险;谁能让团队持续保持高质量决策。 这意味着,AI 原生工程组织不是简单地"给每个工程师配一个 AI 工具",而是要重新审视整个组织系统。 一、旧流程不是错了,而是它服务的假设变了 Fiona 提到一个非常关键的判断:随着 Claude 等 AI 工具把代码编写成本大幅拉低,过去围绕"工程带宽最贵"建立的一整套流程,都可能开始失效。播客简介里也直接点出,从敏捷到瀑布,从设计文档到代码所有权,都需要被重新审视。(小宇宙) 这句话值得每个技术团队反复咀嚼。 很多流程并不是天然低效。它们曾经是合理的,因为它们解决的是当时最重要的问题:如何避免昂贵的开发资源被浪费。 比如,在 AI 之前,一个复杂重构方案可能需要几名工程师投入数周才能验证。于是团队必须先写设计文档、开评审会、讨论边界条件、评估下游影响。因为一旦写错,返工成本很高。 但现在,如果 AI 可以在短时间内生成三种不同实现方案,甚至直接形成可运行 PR,那么"先写很长文档再决定是否动手"的价值就会下降。团队可以用更低成本直接看到代码、运行结果和影响范围。 这不是说设计文档会消失,而是说它的角色变了。 ...

2026-05-19 · 2 min · 217 words · FunkyGod

【AI前沿观察】2026-05-17 日报

【AI前沿观察】2026-05-17 日报 自动生成于 2026-05-17 23:00 📊 今日推送概览 今日共覆盖 AI 领域、半导体、具身智能、AI 货币化 四大板块。核心主题:Cerebras 千亿市值 IPO 标志 AI 芯片多元化格局确立,AI Agent 基础设施迎来爆发,具身智能从实验室走向量产线。 🔵 AI 领域 Cerebras 登陆纳斯达克首日市值破千亿,AI 芯片领域标志性 IPO 事实:Cerebras Systems 于 5 月 14 日登陆纳斯达克,发行价 185 美元,首日股价翻倍突破 350 美元,市值突破 1000 亿美元,融资 55.5 亿美元。这是 2019 年 Uber 以来最大规模的科技 IPO,也是半导体领域近年最重要的上市事件。 思考:Cerebras 用晶圆级芯片(Wafer-Scale Engine)的差异化路线证明了 NVIDIA 并非不可挑战。但对行业而言,更重要的是千亿市值释放的信号——资本市场愿意为 AI 算力多元化买单。这将为更多 AI 芯片初创公司打开融资和退出通道。 Greg Brockman 接管 OpenAI 产品战略,ChatGPT + Codex 合体 事实:OpenAI 联合创始人 Greg Brockman 回归后接管产品战略,主导 ChatGPT 与 Codex 的深度融合。两大产品线的合并意味着 AI 编程助手将直接嵌入 ChatGPT 的日常使用场景。 思考:Brockman 的回归不仅仅是人事变动,更是 OpenAI 产品哲学的转向——从分散的产品线回归统一平台。ChatGPT + Codex 合体的背后是对开发者用户的深度锁定策略。 Runway 赌世界模型挑战 Google — 从视频生成到 AGI 的野心 事实:Runway 将战略重心转向世界模型(World Model),不再局限于视频生成工具,而是构建能理解物理世界动态的通用 AI 系统。 思考:Runway 的转型方向值得关注。世界模型是具身智能和机器人领域的技术基础,如果 Runway 在此方向取得突破,将从「创意工具公司」跃升为「AGI 基础设施公司」。 AI Agent 基础设施爆发:GitHub 5 个热门项目全部围绕 Agent 事实:GitHub Trending 榜单上,AI Agent 相关项目占据主导:CLI-Anything(通用命令行 Agent)、Shannon(Agent 框架)、codegraph(代码理解 Agent)、agent-skills(Agent 技能集)等。 思考:这不是偶然。2026 年是 AI Agent 从概念走向工程化的关键一年。开发者社区正以惊人的速度构建 Agent 基础设施——通信协议、技能编排、代码理解,每一层都在快速成熟。 🟠 半导体 Cerebras 成全球最大估值半导体公司之一:晶圆级芯片从实验室到千亿市值 事实:Cerebras 的 WSE-3 芯片面积达到整片晶圆大小,集成 4 万亿晶体管,单芯片算力远超 NVIDIA H100。IPO 后市值逼近全球半导体前十。 思考:晶圆级芯片长期被视为「实验室概念」,Cerebras 的商业化成功打破了这一认知。但其商业模式依赖超大规模客户的定制化需求,能否持续盈利仍需观察。 全球 AI 算力 Capex 首次突破万亿美元:四大巨头合计 $725B 事实:2026 年 Google、Microsoft、Meta、Amazon 四大科技巨头 AI 资本开支合计达 7250 亿美元,较上年增长超过 60%。全球 AI 算力总投资首次突破万亿美元。 思考:万亿美元级别的 Capex 投入正在重塑整个半导体供应链——从芯片设计、晶圆代工、封装测试到数据中心建设。每一层都面临前所未有的需求压力和产能扩张。 AMD Q1 数据中心营收 $57.8 亿同比 +57%,AI 基础设施需求加速 事实:AMD 数据中心业务 Q1 营收同比增长 57%,MI300X 系列 AI 加速器出货量持续攀升。 思考:AMD 在 AI 芯片市场的份额增长是行业健康度的重要指标。NVIDIA 一家独大对整个生态不利,AMD 的竞争正在推动价格下降和技术加速迭代。 🟣 具身智能 宇树科技发布全球首款量产载人变形机甲 GD01,售价 $650,000 事实:宇树科技发布 GD01 载人变形机甲,售价 65 万美元,标志着人形机器人从工业场景向消费/特种场景延伸。 思考:65 万美元的定价仍然过高,但宇树科技展示了从四足机器人到人形机器人再到载人机甲的技术跃迁路径。中国具身智能公司的产品迭代速度正在超越预期。 Figure 03 连续 8 小时直播,吞吐速度达 2.6 秒/次 事实:Figure AI 的 Figure 03 人形机器人在未经编辑的 8 小时直播中,任务执行吞吐速度稳定在 2.6 秒/次。 思考:连续 8 小时稳定运行且保持 2.6 秒的响应速度,说明 Figure 03 的可靠性已接近工业部署标准。这比单纯的 demos 或精心剪辑的宣传视频有说服力得多。 智元机器人营收破十亿、量产上万台,具身智能进入上岗时代 事实:智元机器人(AGIBot)2025 年营收突破 10 亿元人民币,量产规模超万台,产品已部署在多个制造业场景。 思考:「万台级」量产是具身智能从 demo 到商业化的关键里程碑。智元机器人的路径——从工厂场景切入,积累数据后扩展——可能是中国具身智能公司最务实的发展模式。 🟡 AI 货币化 Cisco CEO 称 AI 需求驱动「网络超级周期」 事实:Cisco CEO 表示 AI 数据中心的建设需求正在驱动网络设备进入前所未有的超级周期,交换机和光模块需求激增。 思考:AI Capex 的溢出效应正在从 GPU 扩展到网络基础设施。GPU 是显性的算力瓶颈,但数据中心的网络带宽正在成为下一个隐性瓶颈。 DRAM ETF 创纪录:AI 基础设施瓶颈推升存储需求 事实:DRAM 相关 ETF 创历史新高,HBM(高带宽内存)产能持续紧张,SK 海力士和三星均在扩产。 思考:存储芯片是 AI 算力链中容易被忽视的一环。大模型的推理和训练对内存带宽的需求增长速度甚至快于对算力的需求,HBM 供不应求的格局短期内难以缓解。 Amazon CEO Jassy 重写 AI 时代战略手册:60 万岗位自动化计划 事实:Amazon CEO Andy Jassy 宣布将在未来数年内通过 AI 自动化 60 万个岗位,同时大幅增加 AI 工程师招聘。 思考:Amazon 的声明是迄今为止大型科技公司对 AI 替代人力的最大胆承诺。60 万岗位的自动化将深刻影响物流、客服、中层管理等白领岗位。但 Amazon 的策略不是「裁员」而是「替代+升级」——用更少的人做更多的事。 📌 今日核心洞察 Cerebras 千亿 IPO 确立 AI 芯片多元化格局:不再只有 NVIDIA 一条路。晶圆级芯片的商业化成功证明,资本市场愿意为差异化算力方案买单。这将激励更多 AI 芯片初创公司冲击 IPO。 ...

2026-05-17 · 2 min · 328 words · FunkyGod