AI | FunkyGod - 投资与AI实践笔记

AI日报｜三大内存巨头破万亿市值，可灵AI年化收入近5亿，DuckDuckGo反AI搜索暴涨

AI日报｜三大内存巨头破万亿市值，可灵AI年化收入近5亿，DuckDuckGo反AI搜索暴涨自动生成于 2026-05-28 23:00 📊 今日推送概览共推送 17 条 AI / 半导体 / 具身智能相关资讯，涵盖 AI 应用层融资、半导体市值里程碑、AI 编程工具演进、具身智能出海等方向。 🟠 半导体三大内存巨头集体突破万亿美元市值事实：SK Hynix、Micron、Samsung 三大 DRAM 制造商本周全部突破万亿美元市值大关。全球内存短缺已持续数月，AI 数据中心对 HBM 和高带宽内存的爆发式需求推动价格飙升，从手机到游戏机全面受影响。思考：这是 AI 基础设施投资热潮最直接的受益信号。HBM（高带宽内存）作为 GPU 训练和推理的必需品，正在从「配角」变成「主角」。内存巨头市值破万亿，说明市场已经把 AI 算力需求视为长期结构性趋势而非短期波动。值得关注的是，内存短缺正在向上游传导——设备制造商和材料供应商也将受益。美股科技股盘前：美光科技涨超6% 事实：美光科技盘前涨超6%，特斯拉涨超2%，英伟达微涨，微软和 Meta 微跌。思考：美光的强势表现与万亿美元市值突破形成正反馈。市场对内存供需紧张格局的定价仍在加速。 🔵 AI 领域 Resolve AI 完成1.25亿美元A轮融资，估值达10亿美元事实：Resolve AI 获 Greylock 和 Lightspeed 领投的 1.25 亿美元 A 轮融资，估值 10 亿美元。新平台推出多 Agent 协作系统，可并行调查多个假设、互相验证结论，根因分析准确率提升 2 倍以上。DoorDash 等客户 MTTR 降低 87%。思考：AI 编程热潮之后，下一代运维基础设施正成为资本新宠。多 Agent 协作而不是单一 Agent「全能化」，是更务实的工程路线。Resolve AI 的定位精准——不是替代工程师，而是将故障排查从小时级压缩到分钟级。 ElevenLabs 发布 Music v2 模型，AI 音乐生成进入跨风格时代事实：ElevenLabs 推出 Music v2 模型，可在单首歌曲中实现从歌剧到重金属的风格切换，同时支持更快的说唱节奏和非音乐音效。模型基于全授权数据训练，已开放商业使用。思考：ElevenLabs 正在从「语音合成公司」进化为「全栈音频 AI 公司」。跨风格生成能力的突破意味着 AI 音乐不再是单一流派的模仿，而是真正具备了创作自由度。全授权数据训练也是对版权争议的正面回应。 Google I/O 引发反 AI 搜索浪潮，DuckDuckGo 安装量暴涨 33% 事实：Google 在 I/O 大会发布 AI Search 全面改造后，DuckDuckGo 的 iOS 安装量周环比增长 33%，其 No AI 版本访问量跳涨 27.7%。同时 Google AI Overviews 出现将「disregard」词当作指令忽略的 bug。思考：这是一个值得深思的信号——当科技巨头激进地 AI 化所有产品时，相当数量的用户选择「用脚投票」。搜索引擎市场正在分化为 AI-first 和 No-AI 两个阵营。Google 的风险在于，如果 AI 搜索体验不够好，它可能同时失去「搜索引擎」和「AI 助手」两个定位。 xAI 持续消耗 SpaceX 资金，成果甚微事实：SpaceX IPO 文件披露 xAI 正在大量消耗 SpaceX 现金但回报甚微。SpaceX 向 xAI 投入 20 亿美元，Anthropic 每年支付 150 亿美元使用马斯克的数据中心。同时 Bloomberg 报道 xAI 内部通知员工限制与 AI 编程工具 Cursor 员工的接触。思考：xAI 的「烧钱换模型能力」策略正受到越来越大的质疑。20 亿美元投入未见显著成果，而 Anthropic 反而是马斯克数据中心的大客户——这种竞争关系中的商业依赖关系颇为讽刺。限制与 Cursor 接触则暴露了 AI 工具赛道日趋激烈的护城河焦虑。 Claude Code 实战指南：Claude.md、Skills、子代理、插件与 MCP 详解事实：一篇深度实战文章全面介绍 Claude Code 作为日常开发驱动力，涵盖 Claude.md 配置、Skills 技能系统、子代理编排、插件机制及 MCP 协议，在 Hacker News 获得 245 票。思考：Claude Code 正在成为 AI 编程工具中的「深度用户之选」。与 Cursor 的 GUI 优先不同，Claude Code 面向终端，更灵活但也更需要工程能力。245 票的热度说明开发者社区对 AI 编程工作流的探索已从「能用」进入「好用」阶段。 The VibeSec Reckoning：AI 编程的安全危机反思事实：Martin Fowler 网站发表深度文章，探讨 AI 辅助编程（Vibe Coding）带来的安全隐患。随着 AI 生成代码比例急剧上升，安全审计和代码审查面临全新挑战。思考：Martin Fowler 的背书让这个问题不容忽视。当 AI 生成代码占比超过 50% 时，传统的代码审查流程已经失效——审查者实际上在审查 AI 的输出而非人类的意图。安全工具链必须适配 Vibe Coding 时代。 AutoResearchClaw：从想法到论文的全自动 AI 研究系统事实：AutoResearchClaw 实现从研究构想到完成论文的全自动化流程，支持自我进化。用户只需输入想法，系统自动完成文献检索、实验设计、论文撰写等全部环节，已获 12.8K 星。思考：AI for Science 正在从「辅助工具」升级为「自主研究系统」。当一个 AI 可以独立完成从假设到论文的全流程时，科研生产力的量级跃升已经可见。但学术诚信和论文质量的把关机制还没有跟上。 PostHog 宣布将用用户数据训练 AI 模型（默认 opted-in）事实：开源产品分析平台 PostHog 宣布将使用用户数据训练 AI 模型，且默认为 opted-in 状态，在 Hacker News 引发热议。思考：开源产品的数据使用边界再次成为焦点。默认 opted-in 是一个大胆的决定——PostHog 赌的是大多数用户不会主动 opt-out，但这也可能损害其开源品牌信任。这也是一个趋势信号：越来越多的 SaaS 公司把用户数据视为 AI 训练的战略资产。 Supertonic：基于 ONNX 的端侧多语言 TTS 引擎事实：Supertonic 是基于 ONNX 的极速端侧多语言 TTS 引擎，支持多语言、本地运行、无需云端，周增 1944 星，Swift 编写。思考：端侧 AI 推理的又一切实进展。当 TTS 可以在设备上实时运行时，隐私优先和离线场景的应用空间被大幅打开。这也呼应了 Apple Intelligence 的设备端优先策略。 oh-my-pi：终端 AI 编程 Agent 事实：面向终端的 AI 编程 Agent，支持锚定编辑、LSP 集成、浏览器控制和子代理架构，周增 2508 星。思考：终端优先的 AI 编程工具赛道正在快速膨胀。oh-my-pi 的锚定编辑（hash-anchored edits）是一个有趣的工程创新，解决了 AI 编辑代码时定位不准确的痛点。 ECC：AI Agent 性能优化系统事实：ECC 提供 Skills、Instincts、Memory、Security 四维优化框架，支持 Claude Code、Codex、Cursor 等主流 AI 编程工具。思考：当 AI Agent 从 demo 走向 production，性能工程成为刚需。ECC 的「本能」概念很有意思——让 Agent 在特定场景下自动触发最优策略，类似人类的肌肉记忆。 🟣 具身智能 AGIBOT 智元机器人亮相 GSMA 越南峰会，加速拓展亚太市场事实：AGIBOT 参加 GSMA Digital Nation Summit Hanoi 2026，展示具身智能机器人解决方案，覆盖工业制造、物流、零售、安防等场景，积极构建越南本地合作伙伴生态。思考：中国具身智能机器人出海的又一个信号。AGIBOT 选择越南作为亚太扩张切入点，看中的是东南亚制造业升级带来的自动化需求。从实验室到国际展会，具身智能的商业化正在加速。 🟡 AI 货币化可灵 AI 年化收入近 5 亿美元，同比增长 4 倍事实：快手 2026 年 Q1 财报显示可灵 AI 3 月 ARR 近 5 亿美元，较去年增长 4 倍。思考：可灵 AI 是中国 AI 应用货币化的标杆案例。5 亿美元 ARR 在全球 AI 视频生成赛道中也属于头部水平。快手的短视频基因和可灵的 AI 视频生成能力形成了天然协同，这比纯技术公司做 AI 产品更有落地优势。增长 4 倍说明市场对 AI 视频生成的付费意愿已经验证。金仕达与华为联合发布 AI 风控一体机事实：金仕达与华为联合发布 AI 风控一体机，同时与玻色量子合作。思考：AI + 金融基础设施的组合，量子计算的加入则增加了长期想象空间。华为提供算力底座，金仕达提供金融场景，这种「硬件+软件+场景」的一体机模式在 B 端市场有天然优势。 ARK Invest 新建仓 Amazon，增持 Tempus AI 事实：ARK Invest 5 月 27 日交易数据显示战略调整投资组合：新买入 Amazon，同时增持 Tempus AI，反映向 AI 应用层和云计算基础设施方向倾斜。思考：木头姐的调仓方向值得参考——从 AI 芯片（减持台积电）转向 AI 应用层（Amazon、Tempus AI），说明资本正在从基础设施向应用场景迁移。这可能是 AI 投资的下一阶段主线。 📌 今日核心洞察 AI 算力需求的「内存时刻」已至：三大内存巨头同时突破万亿美元市值，HBM 和高带宽内存正在成为 AI 供应链中与 GPU 同等重要的瓶颈资源。内存短缺的涟漪效应将波及消费电子和汽车等多个行业。 ...

【AI前沿观察】2026-05-27 华为发布Her Law绕过EUV，可灵AI年化ARR逼近5亿美元

【AI前沿观察】2026-05-27 日报自动生成于 2026-05-27 23:02 今日推送概览共推送 11 条重要资讯，覆盖 AI 商业化、半导体制造突破、自动驾驶、AI 基础设施、AI 政策等多个维度。今日最大看点：华为在中科院学术会议上发布"Her Law"，以 3D 堆叠技术绕过 EUV 制裁，这是中国半导体自主路线的重要里程碑。 AI 领域快手Q1财报：可灵AI收入大增300%，年化ARR逼近5亿美元事实：快手2026年Q1营收337.2亿元，同比增长3%。最大亮点来自可灵AI——单季收入突破6.5亿元，同比暴增300%，年化ARR逼近5亿美元。不过AI投入也拖累了利润端，经调整净利润下滑26.3%，毛利率降至51.2%。思考：可灵AI是中国AI视频生成领域商业化最成功的案例之一。5亿美元ARR在AI应用层属于头部水平，但快手为AI付出的代价也显而易见——利润承压、毛利率下滑。AI应用层的"增长与盈利"悖论仍在持续，谁能率先跑通盈利模型，谁就是下一阶段赢家。 Google搜索AI化引发用户强烈反弹，DuckDuckGo安装量飙升33% 事实：Google I/O 大会后推出的搜索框AI改造遭遇大量负面反馈。DuckDuckGo iOS端安装量周环比增长33%，"No AI"版本搜索引擎访问量激增27.7%。AI Search甚至出现了基本事实错误。思考：Google强制将AI嵌入搜索的核心体验，本质上是在用数十亿用户的搜索流量为AI产品做冷启动。用户的反弹说明：AI在信息检索场景的价值尚未被广泛认可，反而被视为"噪音"。这对所有试图AI化核心产品的公司都是一个警示——不是所有产品都适合AI-first。特朗普因AI巨头CEO拒出席，取消AI安全行政命令签署事实：特朗普原计划签署AI安全测试行政命令，但在多家顶级AI公司CEO拒绝出席后突然取消。特朗普称该命令将成为创新阻碍。思考：AI行业对监管的态度一直是"口头上支持，行动上抵制"。CEO们拒绝出席说明行业不愿接受任何可能减缓发布节奏的约束。美国AI监管陷入僵局，与欧盟的《AI法案》形成鲜明对比。监管真空期可能持续到2027年。 Anthropic网络安全技能框架开源：754个结构化技能映射五大安全框架事实：Anthropic开源了一套包含754个结构化网络安全技能的框架，映射MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS、D3FEND和NIST AI RMF五大安全框架。覆盖26个安全域，支持Claude Code、GitHub Copilot、Codex CLI等20+平台。思考：Anthropic在安全领域的布局一直领先竞对。开源网络安全技能框架既降低了安全从业者使用AI的门槛，也强化了Claude在企业安全场景的生态绑定。Apache 2.0协议意味着社区可以自由扩展，这是典型的"开源做护城河"策略。半导体华为发布Her Law：3D堆叠替代EUV，P核能效提升41% 事实：华为芯片负责人何庭波在中科院ISCAS 2026学术会议上发布"Her Law"，提出以LogicFolding 3D堆叠技术绕过EUV光刻机制裁。混合键合间距达到2μm，P核能效提升41%。这是华为首次公开完整的技术路线图。思考：这是今日最重要的新闻。华为的思路很清晰——既然拿不到EUV，就在架构层面做创新。3D堆叠不是新概念，但华为是第一个将其作为"替代EUV路线"系统化推进的公司。2μm混合键合间距已经接近实用化门槛。如果五年内能兑现承诺，全球半导体格局将被重塑。这不是技术追赶，而是技术路线的分叉。华为宣布芯片设计重大突破，五年内用新技术制造行业领先半导体事实：华为宣布将在五年内使用新技术制造行业领先的半导体芯片。华为芯片部门负责人何庭波被视为中国科技自主的标志性人物。Reuters确认这是北京应对美国制裁、突破芯片制造瓶颈的重要进展。思考：与上面的Her Law是同一系列发布的两个维度——技术路线（Her Law）和时间表（五年目标）。Reuters的独立报道增加了可信度。五年期限设定在2031年，与全球2nm量产时间线基本同步，如果华为的3D堆叠路线成功，意味着中国可以在没有EUV的情况下达到同等性能水平。 GUC与VSORA展出Jotunn8 AI推理处理器：TSMC 5nm+CoWoS+HBM3E 事实：GUC在TSMC欧洲技术研讨会上展示VSORA的Jotunn8 AI推理处理器，采用TSMC 5nm工艺、CoWoS-S先进封装、HBM3E内存，专为数据中心AI推理设计。思考：AI推理芯片正在成为一个独立的、快速增长的细分市场。不同于训练芯片追求极致算力，推理芯片更看重能效比和成本。Jotunn8采用TSMC 5nm而非最先进的2nm，说明推理场景对制程节点的敏感度低于训练——这对中国半导体产业是个好消息，成熟制程同样可以做出有竞争力的推理芯片。白宫申请90亿美元为CIA/NSA采购AI芯片事实：白宫批准90亿美元预算申请，为CIA和NSA采购Nvidia Grace Blackwell超算芯片，解决情报机构算力不足无法运行最新AI模型的问题。需国会批准。思考：情报机构正在成为AI算力的超级买家。90亿美元只是开始——当CIA和NSA都"算力不足"时，说明AI对算力的需求已经从商业领域渗透到国家安全领域。Nvidia是最大受益者，Grace Blackwell的政府订单将进一步加剧AI芯片的产能紧张。 Tesla与SpaceX启动Terafab 1190亿美元芯片超级工厂事实：Tesla与SpaceX联合在奥斯汀启动Terafab芯片超级工厂项目，投资规模达1190亿美元。马斯克将Tesla和SpaceX人才调配至该芯片项目及xAI。Cybertruck销量暴跌，马斯克旗下公司购买了约20%的Cybertruck产量。分析师质疑人才流动是否影响Tesla核心业务。思考：1190亿美元是什么概念？Intel的全球资本开支年约250-300亿美元，TSMC约400亿美元。Terafab一期的投资规模相当于全球前三半导体厂商资本开支的总和。马斯克显然不满足于"买芯片"——他想自造芯片，打通从设计到制造的AI算力全链条。但人才从Tesla抽调、Cybertruck销量暴跌、内部公司互相采购……这些都暴露出马斯克帝国内部的资源紧张。 AI 基础设施 xAI数据中心依赖天然气供电，SpaceX豪掷28亿美元采购燃气轮机事实：SpaceX IPO文件显示，xAI数据中心大量依赖天然气供电。SpaceX花费28亿美元采购燃气轮机为AI数据中心供电。与此同时，Anthropic即将每月支付12.5亿美元租用xAI数据中心空间。思考：这是一组很有意思的矛盾：Tesla的使命是加速世界向可持续能源转型，而xAI的数据中心却在大量烧天然气。28亿美元的燃气轮机采购说明AI算力的能耗规模已经超出了电网的供电能力。Anthropic每月12.5亿美元租用xAI数据中心，年化就是150亿美元——这意味着Anthropic的AI基础设施成本极其惊人。自动驾驶 Tesla Robotaxi车队不增反减，无人驾驶车辆降至仅20辆事实：Tesla无人监督Robotaxi车队活跃车辆从4月底的25辆降至仅20辆，总车队从165辆骤降至34辆。旧金山湾区车队从107辆崩溃至9辆。安全瓶颈是主因：Tesla无人驾驶车辆事故率约为人类驾驶员的4倍。Musk表示要等FSD v15重写后才大规模扩展，推迟至2026年底或2027年初。竞争对手Waymo已运营约3000辆Robotaxi。思考：Tesla Robotaxi的"缩编"与SpaceX IPO的宏大叙事形成鲜明对比。20辆 vs Waymo的3000辆，这不是竞争差距，而是量级差距。事故率是人类4倍的数据更是致命——安全是自动驾驶的生死线。Musk把希望寄托在FSD v15，但"重写"在软件工程中往往意味着推翻重来，时间表大概率还要再推迟。今日核心洞察华为Her Law是中国半导体自主路线的里程碑。3D堆叠替代EUV不是临时方案，而是系统性的技术路线分叉。如果五年内兑现，全球半导体将形成两条并行路线：一条是ASML驱动的极紫外光刻路线，一条是华为驱动的3D堆叠路线。这对全球芯片供应链格局的影响将极为深远。 ...

受够了 OpenClaw 的失忆，我本周爱上了 Hermes Agent

受够了 OpenClaw 的失忆，我本周爱上了 Hermes Agent 大多数人以为 Hermes 只是一个 AI 聊天框架。但它实际上是一个可长期运行、多角色协作、多入口接入的 Agent Runtime，已经非常接近真正意义上的 AI Operating System。 Hermes Agent 在不到三个月内突破 14 万 GitHub Star，并根据 OpenRouter 的数据成为目前全球使用量最大的 Agent。在折腾了 2 个月，受够了 OpenClaw 的失忆后，我尝试用业界火热的 Hermes Agent，效果居然出奇的好，因此写下这篇安利文章。关键词：#openclaw #Hermes 能力标签：多Agent协作 · 长期记忆隔离 · 子代理并行 · 多用户隔离 · 任务编排 · Agent Runtime 为什么这么火？三个根本原因 1. 解决了 Agent 领域最痛的问题——失忆 Hermes 要解决的正是这个问题，不是用 prompt 技巧，而是在架构层面内置了一个闭环学习机制——运行时间越长，它就越了解你。 2. 自我进化的技能系统 Hermes 有四个核心差异化能力，其中最突出的是"自进化技能"——它会自己编写并优化 skill 文档。每当 Hermes 解决一个困难问题，它就会写下一份可复用的 skill 文档，之后永远不会忘记这个解法。这些 skill 可搜索、可共享，并兼容 agentskills.io 开放标准。 ...

【AI前沿观察】2026-05-23 日报｜Gartner认证OpenAI编程Agent领导者，人形机器人集体爆发

【AI前沿观察】2026-05-23 日报｜Gartner认证OpenAI编程Agent领导者，人形机器人集体爆发自动生成于 2026-05-23 23:00 📊 今日推送概览共推送 6 条重要资讯，涵盖 AI 编程 Agent、人形机器人量产突破、自动驾驶商业化三大方向。今日的主旋律异常清晰——具身智能从概念走向落地，多个玩家同时在制造、部署、商业化三个维度取得了实质性进展。 🔵 AI 领域 OpenAI named a Leader in enterprise coding agents by Gartner 事实：Gartner 在 2026 年企业编程 Agent 魔力象限中，将 OpenAI（Codex）评为「领导者」象限。这是编程 Agent 作为独立品类首次被 Gartner 纳入评估。思考：Gartner 的认可意味着「AI 编程 Agent」不再只是开发者玩具，而是企业 IT 采购清单上的正式品类。OpenAI 在这个赛道的布局——从 Codex CLI 到与 Dell 的混合云合作——正在构建一条从个人开发者到大型企业的完整商业化路径。对 GitHub Copilot、Cursor、Windsurf 等竞品而言，这是一个不能忽视的信号：品类已经被定义，竞争将围绕企业级能力展开。 🟣 具身智能 Figure AI 直播引爆全网：人形机器人连续工作 48 小时无故障事实：Figure AI 进行了一场持续直播，展示其搭载 Helix 02 模型的人形机器人连续 48 小时无故障运行，执行包裹分拣任务。直播在全网引发大量关注。思考：48 小时连续无故障——这个数字的意义远超技术演示本身。工业客户最关心的从来不是机器人能做什么花哨动作，而是「它能稳定干多久」。Figure AI 选择了最朴素的展示方式（直播不剪辑），恰好击中了市场信任的核心痛点。结合其 4 个月产能提升 24 倍的消息，Figure AI 正在从「融资明星」转向「交付型公司」。 Humanoid 签下舍弗勒大单：数千台轮式人形机器人将部署德国工厂事实：德国 Humanoid 公司与全球汽车零部件巨头舍弗勒（Schaeffler）签署协议，将部署数千台轮式人形机器人到德国工厂中，采用 RaaS（机器人即服务）模式。思考：这是一笔标志性订单。数千台的量级已经不再是「试点」或「概念验证」，而是正式的工业部署。RaaS 模式降低了客户的采纳门槛——不需要一次性购买，按使用付费。如果舍弗勒的部署效果达到预期，将为整个欧洲制造业的人形机器人采纳打开闸门。 Tesla Fremont 工厂停产 Model S/X，产线转产 Optimus 人形机器人事实：Tesla 已正式停止 Fremont 工厂的 Model S/X 生产，将产线改造用于 Optimus 人形机器人的制造。Model S/X 作为 Tesla 最悠久的车型系列，至此画上句号。思考：这条消息的象征意义大于实际产能意义。Musk 正在用行动告诉市场：Tesla 的未来不是更多的车，而是机器人。停产旗舰车型来造机器人，这种赌注在汽车工业史上几乎没有先例。但也要看到，Model S/X 本身销量已大幅下滑，停产的商业逻辑并不亏。真正值得追踪的是：Optimus 的实际产能爬坡速度，以及 Tesla 自用 vs 外卖的占比。 🚗 自动驾驶 Tesla 在达拉斯和休斯顿推出完全无人监督 Robotaxi 服务：573 辆车已上路事实：Tesla 已在达拉斯和休斯顿两个城市启动完全无人监督的 Robotaxi 服务，目前共有 573 辆运营车辆。思考：573 辆是一个务实的起步数字。Tesla 选择德克萨斯州并不意外——监管环境相对宽松，且是自家后院。关键问题是安全数据：完全无人监督意味着没有安全员兜底，任何一次严重事故都可能让整个项目倒退数月。与 Waymo 相比，Tesla 的路径更激进（纯视觉方案、无激光雷达），但规模化潜力更大。全球 Robotaxi 行业 2026 大爆发：Tesla、Waymo、中国 AI 车企重塑交通格局事实：行业分析指出，2026 年是全球 Robotaxi 行业爆发元年，Tesla、Waymo、以及中国多家 AI 车企（百度 Apollo、小马智行等）正在同时扩大无人出租车服务覆盖范围。思考：2026 年确实是 Robotaxi 的关键转折年——不再是「技术验证」，而是「商业验证」阶段。三个阵营各有优势：Waymo 有技术和安全记录、Tesla 有规模和成本优势、中国车企有政策支持和密集城市测试场景。最终决定胜负的可能是运营效率和单位经济模型，而非单纯的技术参数。 📌 今日核心洞察人形机器人进入「订单驱动」阶段：Figure AI 的 48 小时直播、Humanoid 的舍弗勒大单、Tesla 的产线转型——三条消息在同一周汇聚，说明人形机器人正在从「技术秀」转向「商业交付」。2026 年下半年，关注点将从「能做什么」转向「卖了多少台」。 ...

我为什么推荐 new-api：从「能调用模型」到「能运营 AI 业务」的工程答案

很多团队做 AI 产品，第一阶段都很顺利：调通一个模型；写几个 API；跑出一个 demo。但到了第二阶段，问题会集中爆发：客户要稳定，单一上游不稳定；成本要可控，调用量上来后账就乱了；用户要分层，个人、团队、管理员权限都不一样；运营要可视，出了问题要知道是谁、哪个 key、哪个渠道、哪个模型；商业要闭环，充值、订阅、额度、结算要打通。这时你会发现，真正难的不是“会调模型”，而是“把模型能力做成一个能长期运营的系统”。我这几天把 new-api 关键代码路径完整过了一遍，结论是：它的价值不在于“支持 40+ 上游”这句话本身，而在于它把 AI 网关最难的工程问题做成了一整套闭环。这篇文章我不做功能清单，而是按“工程决策”的视角，讲我为什么推荐它。典型请求链路客户端 ↓ /v1/chat/completions 或 /v1/messages ↓ 认证 TokenAuth / UserAuth ↓ 限流 ModelRequestRateLimit ↓ 分发 Distribute ↓ Relay 进行请求校验、token 估算、预扣费 ↓ Adaptor 转换上游格式并请求 provider ↓ DoResponse 解析 usage 与流式结果 ↓ Settle / Refund 完成结算或退款先说结论：new-api 适合什么团队？如果你符合下面两条以上，我建议认真评估 new-api： ...

AI时代，信任基础设施正在成为刚需

在AIGC爆发之后，社会需要的不只是更强的生成模型，也需要更可靠的鉴伪系统。过去两年，AI 生成内容从“新奇玩具”变成了基础能力，也开始从“效率工具”变成“风险放大器”。它可以帮你生成海报、头像、视频、广告、PPT，也可以帮你生成谣言、诈骗、伪证、假合同、假客服、假高管发言，甚至直接攻击一个人的尊严和一个机构的信任。这就是为什么我越来越相信一件事：AI 时代真正稀缺的，不只是生成能力，而是验证能力。换句话说，未来的核心竞争力不只是“能不能做出内容”，而是“能不能证明内容是真的”。一、两个事件，把“信任问题”讲得很清楚最近我把两个新闻放在一起看，一个是意大利总理梅洛尼遭遇 AI 假照片事件，另一个是伯克希尔哈萨维公开提醒公众警惕冒充巴菲特的 AI 伪造视频。这两个事件看起来分属不同领域，一个偏社会舆论，一个偏金融传播，但它们都指向同一个问题：AI 伪造正在攻击信任本身。 1. 梅洛尼假照片：伪造开始攻击个人尊严梅洛尼事件提醒我们，AI 伪造不只是“看起来像不像”的娱乐问题，而是会实打实伤害一个人的人格、声誉和安全。这类伪造有几个明显特征：伪造门槛很低。传播速度远高于澄清速度。普通人比公众人物更难自证清白。以前，合成一张假图需要技术、设备和时间。现在，只要有足够的公开照片、公开视频和生成工具，普通人就可能被伪造成不雅图、涉政图、诈骗头像或虚假证据。更麻烦的是，伪造内容一旦进入社交平台，传播链条往往比事实链条快得多。等当事人澄清时，截图、转发和二次传播已经让伤害完成了。 2. 假巴菲特视频：伪造开始攻击金融信任如果说梅洛尼事件攻击的是个人尊严，那么“假巴菲特”视频攻击的就是金融信任。巴菲特不是普通名人，他的发言天然带有市场权威。一个“看起来像他、听起来像他、说话方式也像他”的 AI 视频，本质上是在借用权威身份做信任劫持。这件事的危险不在于“有多像”，而在于“有多少人会信”。在金融场景里，信任本身就是资产。伪造可能带来至少四类风险：诱导投资者购买虚假产品。制造市场情绪，让用户误判权威来源。损害品牌和机构声誉，让辟谣成本激增。让公众对真实信息也开始怀疑，形成“什么都可能是假的”的信任疲劳。所以，AI 伪造不是单纯的内容问题，而是交易、传播和身份验证的底层问题。二、为什么“信任基础设施”会变成新刚需过去互联网最擅长解决的是“信息如何传播”。现在 AI 时代最需要解决的是“信息如何被信任”。这就是我理解的“信任基础设施”：图片是否被篡改。视频是否被合成。文档是否被修改。身份是否被冒充。来源是否可追溯。证据是否可审计。如果没有这层基础设施，AI 只会把整个数字世界推向一种更低成本、更高频率、更难验证的混乱。所以我越来越倾向于把鉴伪、溯源、身份验证、数字水印、可信认证、风控规则看作同一类能力：它们共同构成了 AI 时代的新底座。三、C 端为什么需要鉴伪：每个人都需要“验真权” 对于普通用户来说，AI 最大的变化不是“模型更聪明了”，而是“你看到的东西未必可信了”。我们过去默认“照片是证据”，现在这个默认前提正在失效。 C 端的典型场景社交平台验图。收到可疑图片时先检测，再决定是否转发。被冒用头像、被合成不雅图、被伪造聊天记录时，能快速出具检测结果。家庭反诈，尤其是老人、孩子面对“熟人照片 + 伪造语音 + 假视频”的组合欺骗。内容创作者保护，避免被冒充、被造谣、被恶意拼接。我把这种能力称为“验真权”，意思是普通人也应该拥有一个低成本、可理解、可分享的方式去判断： ...

【AI前沿观察】2026-05-21 日报

【AI前沿观察】2026-05-21 日报自动生成于 2026-05-21 23:00 📊 今日推送概览共推送 5 条重要资讯，覆盖 AI 推理突破、英伟达财报、云计算 Capex、半导体代工、内容溯源等方向。 🔵 AI 领域 OpenAI 推理模型自主推翻80年离散几何猜想事实：OpenAI 宣布其内部通用推理模型自主证明了组合几何领域最著名的问题之一——Erdős 1946年提出的平面单位距离问题（unit distance problem）中的一个核心猜想为假。该模型提供了一个无穷族的反例构造，实现了对已知最优构造的多项式级改进。证明已由外部数学家团队验证，Fields 奖得主 Tim Gowers 称之为"AI 数学的里程碑"。思考：这是 AI 第一次自主解决一个数学子领域的核心开放问题——不是人类引导下的证明助手，而是一个通用推理模型独立完成从构思到严格证明的全过程。更值得注意的是，证明方法本身引入了代数数论中的高级工具来解决一个初等几何问题，说明模型不只是穷举搜索，而是具备了某种"数学直觉"。这为 AI 在基础科学研究中的角色提供了迄今为止最有力的证据。 OpenAI 与 Google 合作推进 AI 内容溯源事实：OpenAI 宣布成为 C2PA（内容溯源与真实性联盟）认证生成器，并与 Google DeepMind 合作将 SynthID 不可见水印集成到 ChatGPT、Codex 和 API 生成的图片中。C2PA 元数据提供详细的内容来源信息，SynthID 水印则在元数据被剥离后仍可追踪，两者互补构建多层溯源体系。思考：AI 生成内容的可信度问题正从"该不该标记"的讨论阶段进入"怎么标记"的工程落地阶段。OpenAI + Google 的组合几乎覆盖了主流 AI 图片生成的全部场景，SynthID 在截图、格式转换等变换下的鲁棒性是关键卖点。不过，这套体系的有效性最终取决于社交媒体平台是否愿意接入验证——这不仅是技术问题，更是商业博弈。 🟠 半导体英伟达 FY27Q1 全面超预期：营收 816 亿美元同比+85% 事实：英伟达 2027 财年 Q1 营收 816.15 亿美元（同比+85%），GAAP 净利润 583.21 亿美元（同比+211%）。数据中心营收 752 亿美元（同比+92%），贡献 92% 总收入。超大规模客户营收 378.69 亿美元（同比+115%），企业/消费互联网营收 373.77 亿美元（同比+74%）。下一代 Vera Rubin 芯片确认下半年发货，供应持续紧张。但值得注意的是，英伟达高端 AI 芯片市场份额可能从 80%+ 回落至 70% 以下。思考：单季 816 亿美元的营收意味着英伟达一年化营收已超 3200 亿美元——这个数字在五年前几乎不可想象。但信号不全是利好：增速从三位数回落至 85%、高端份额开始被蚕食，都暗示"英伟达独大"的格局正在松动。AMD、华为昇腾、Cerebras 等替代方案的崛起是结构性趋势。Vera Rubin 能否维持定价权，是下一个关键观察点。华泰：AI 需求外溢推动代工扩产，硅光+CoPoS 成新增长极事实：华泰证券分析 16 家全球代工封测企业 Q1 业绩，发现台积电、三星、海力士均加大设备投资。硅光技术成为新增长极，POET 获得 5000 万美元光引擎订单。光模块板块 Q1 营收增速 99%，毛利率 42%。AI 需求正从 GPU 向光互连、先进封装等上游环节加速外溢。思考：硅光是 AI 算力基建的下一个瓶颈——当 GPU 集群规模扩展到十万卡级别，铜互连的物理极限迫使产业向光互连转型。光模块 99% 的增速和 42% 的毛利率说明市场正在用脚投票。这个赛道的确定性甚至可能高于 GPU 本身，因为它是跨供应商的共性需求。 🟡 AI 货币化北美五大云厂商 Q1 Capex 合计 1393 亿美元，全年 AI 投资上修至 7250 亿事实：Q1 单季北美五大云厂商合计资本开支达 1393 亿美元。四大云厂全年 AI Capex 从预期 6700 亿上修至 7250 亿美元。云增速方面：Google Cloud 63% 领跑，Azure 40%，AWS 28%，AWS 利润率 37.7%。分析指出，AI Capex 投入到 Token 需求放量的传导周期约两年，国内 2026-2027 年进入收入兑现期。思考：单季 1393 亿美元的 Capex 是一个令人眩晕的数字——这几乎等于某些中等国家一年的 GDP。更关键的是全年 7250 亿的指引还在上修，说明市场对 AI 基础设施的需求远未见顶。但隐患同样明显：Token 需求的传导周期长达两年，意味着当前投入的回报要在 2027-2028 年才能真正验证。如果届时需求不及预期，这将是人类历史上最大的资本错配之一。 📌 今日核心洞察 AI 推理能力的质变：OpenAI 推理模型自主解决 Erdős 猜想，标志着 AI 从"工具"向"研究伙伴"的跃迁。通用推理模型在无定向提示下完成原创数学证明，这是 AI 科学能力的标志性事件。 ...

数字生产实践Codex：AI 编程助手进化到桌面办公智能体

数字生产实践Codex：AI 编程助手进化到桌面办公智能体 AI 编程工具正在从代码生成器，进化为能够操作环境、验证结果、持续协作的软件开发智能体。在过去，很多人对 AI 编程工具的理解还停留在"帮我补全代码""生成一段函数""解释一段报错"。但 OpenAI 最新版 Codex 的能力已经不止于此。根据 OpenAI 官方对新版 Codex 的介绍，Codex 正在从一个单纯的代码助手，升级为贯穿软件开发生命周期的智能协作伙伴。它不仅能写代码、理解代码库、处理 PR 评审，还开始具备两类更接近真实开发者工作方式的能力： Computer Use，也就是操作系统级控制能力；内置浏览器，也就是在 Codex 应用中直接打开、观察和操作网页的能力。这两项能力的出现，意味着 Codex 不再只是"回答怎么写代码"，而是开始进入真实开发环境，帮助开发者完成更完整的任务链路。一、Codex 正在从代码助手变成开发智能体传统 AI 编程工具的核心能力是生成代码。用户提出需求，AI 给出代码片段，开发者再自己复制、运行、调试和验证。而新版 Codex 的方向更接近开发智能体。所谓开发智能体，不只是会生成代码，而是能够围绕一个开发目标，主动完成多个连续动作：读取项目文件；理解代码结构；修改代码；运行终端命令；打开页面；复现问题；检查界面；验证修复结果；根据反馈继续调整。也就是说，Codex 的价值正在从"生成代码"扩展为"完成开发任务"。这背后最关键的变化，就是它开始具备操作电脑和观察网页的能力。二、什么是 Computer Use？ Computer Use 可以理解为一种让 AI 像人一样使用电脑界面的技术。它不是简单调用 API，也不是只在编辑器里生成文本，而是让模型通过屏幕画面理解当前环境，并通过鼠标、键盘等方式执行操作。它的基本能力包括：看屏幕：识别当前界面中的按钮、输入框、菜单、弹窗和错误提示；理解任务：根据用户目标判断下一步应该做什么；执行操作：点击、输入、滚动、切换窗口、打开应用；观察反馈：根据界面变化判断任务是否完成；持续迭代：如果没有完成，就继续调整下一步操作。可以用一句话概括： ...

【AI前沿观察】2026-05-20 日报

【AI前沿观察】2026-05-20 日报自动生成于 2026-05-20 23:01 📊 今日推送概览共推送 1 条重要资讯。今日 AI 行业动态相对平静，但 OpenAI 在内容溯源安全领域放了一个大招——多层验证体系正式落地，标志着 AI 生成内容可追溯性从"行业标准讨论"进入"工程实践"阶段。 🔵 AI 领域 OpenAI 推出多层内容溯源体系：C2PA 合规 + Google SynthID 水印 + 公开验证工具事实： OpenAI 正式宣布成为 C2PA（内容溯源与真实性联盟）合规生成产品，其生成的图像内容将携带符合 C2PA 标准的加密元数据，包含生成来源、创建方式和签名信息与 Google DeepMind 合作，在 ChatGPT、Codex 和 API 生成的图像中嵌入 SynthID 不可见水印。这种水印能够抵抗截图、裁剪、格式转换等常见变换操作同步推出公开验证工具预览版（openai.com/verify），用户可上传图片检测是否包含 OpenAI 的溯源信号（包括 Content Credentials 和 SynthID）该体系覆盖 DALL·E 3、ImageGen 和 Sora 的图像/视频生成产品线思考：这是 AI 行业在"可信赖内容"方向上迄今最完整的技术方案。三句话概括其意义： C2PA 元数据 + SynthID 水印的双层架构是务实选择——元数据提供丰富上下文但易被剥离，水印更持久但信息量有限，两者互补形成纵深防御 OpenAI 与 Google 的合作本身就是信号：内容溯源不是某家公司的护城河，而是行业基础设施。SynthID 是 Google 的技术，OpenAI 选择采用而非自建，说明在安全层面巨头愿意跨越商业边界公开验证工具是关键一步——技术再好，如果只有平台内部能用，就失去意义。让普通用户能验证"这张图是不是 AI 生成的"，是把信任交还给公众但也要清醒：这套体系目前只覆盖 OpenAI 自家的内容，且明确承认"没有任何检测方法是万无一失的"。真正的影响力取决于其他生成式 AI 厂商是否跟进，以及社交媒体平台是否集成本地验证。如果 Midjourney、Stability AI、字节跳动等不加入，溯源生态就会有巨大缺口。 ...

【AI前沿观察】2026-05-19 日报

【AI前沿观察】2026-05-19 日报自动生成于 2026-05-19 23:00 📊 今日推送概览共推送 1 条核心资讯，补充信息流 AI/半导体相关动态 6 条，覆盖企业 AI 部署、半导体制造、AI 治理与地缘政治、数据中心能源争议等方向。 🔵 AI 领域 OpenAI 与 Dell 合作：Codex 进入混合云和本地部署企业环境事实：OpenAI 宣布与 Dell Technologies 达成战略合作伙伴关系，将 Codex（OpenAI 的 AI 编程 Agent）引入混合云和本地部署的企业环境。这标志着 OpenAI 的 Agent 产品首次大规模进入传统 IT 基础设施。思考：这是 OpenAI 企业化战略的重大一步。Codex 之前主要在云端运行，而大型企业（金融、医疗、政务）出于数据安全和合规考虑，对本地部署有强烈需求。Dell 在全球企业 IT 基础设施中的渗透率极高，这次合作相当于为 Codex 打开了通往财富 500 强的大门。值得关注的是，OpenAI 此前成立了专门的 Deployment Company（DeployCo），这次与 Dell 的合作很可能是该战略的首次重大落地。Agent 从云端走向边缘，2026 年企业 AI 的竞争主战场正在从模型能力转向部署方式。 Intel 与 NVIDIA 宣布深度合作事实：NVIDIA 和 Intel 联合宣布将共同开发多代定制数据中心和 PC 产品，涵盖 AI 基础设施和个人计算领域。思考：这桩合作出乎不少人意料。NVIDIA 一直与 TSMC 深度绑定，如今转身与 Intel 合作，背后是地缘政治风险分散和产能多元化的考量。Intel 的代工业务（IFS）虽然仍在爬坡，但在美国政府推动本土半导体制造的背景下，NVIDIA 需要 Intel 作为"美国制造"的备份产能。对 Intel 而言，拿下 NVIDIA 这个客户是其代工业务的重要背书。双方各取所需，但最终产品能否达到性能预期，仍需时间验证。 🟠 半导体 TSMC 公布工艺路线图至 2029 年：A12、A13、N2U 等新节点亮相事实：台积电公布了延伸至 2029 年的先进工艺路线图，正式宣布 A12、A13、N2U 等新工艺节点。这标志着半导体制造工艺将继续向更小节点推进。思考：台积电这份路线图传递了明确信号：摩尔定律远未终结。A12（约 1.2nm）和 A13（约 1.3nm）节点的规划意味着未来 3 年内，AI 芯片的晶体管密度还将大幅提升。值得注意的是，N2U（N2 的增强版）可能成为性价比最高的节点，类似于当年 N5P 的角色。对芯片设计公司来说，选择哪个节点不再是单纯的工艺参数问题，还要考虑产能分配和成本结构——台积电的先进产能永远是供不应求的稀缺资源。 🟢 AI 治理与地缘政治中美元首同意开展人工智能政府间对话事实：外交部发言人确认，特朗普总统访华期间，两国元首就人工智能问题进行了建设性交流，同意开展人工智能政府间对话。中方表示作为两个人工智能大国，中美应携手促进 AI 发展和治理。思考：AI 首次成为中美元首级会谈的核心议题之一，这是一个里程碑事件。这意味着 AI 治理已经从技术层面上升到国家安全和外交战略层面。政府间对话机制的建立，可能涉及 AI 安全标准、芯片出口管控、AI 军事应用限制等敏感话题。但从实际效果来看，中美在 AI 领域的合作更像是一种"管控分歧"而非"深度融合"——双方都会在对话中争取自身利益最大化。 🔴 数据中心与能源 IEA 报告：AI 数据中心电力需求到 2030 年可能接近翻倍事实：国际能源署发布报告指出，AI 数据中心的电力需求到 2030 年可能接近翻倍，将对全球能源供给体系构成巨大挑战。思考：IEA 的这份报告将 AI 算力的能源问题推到了政策讨论的中心。翻倍的电力需求意味着新的发电厂、新的输电线路、新的冷却系统——这不是技术问题，而是基础设施和公共政策问题。特别是在美国，数据中心已经占据了部分地区 20% 以上的电力消耗。如果 AI 推理成本持续下降导致使用量激增，能源瓶颈可能成为 AI 发展的天花板。 Gallup 民调：美国民众反对在本地建设 AI 数据中心事实：Gallup 最新民调显示，越来越多的美国民众反对在其居住区域附近建设 AI 数据中心，NIMBY 情绪正在成为算力基建扩张的重要障碍。思考：技术乐观主义者经常忽视社会接受度这个变量。数据中心的噪音、水资源消耗、对当地电网的压力，都是真实的社区关切。叠加 IEA 的能源报告来看，AI 产业正面临一个结构性矛盾：算力需求指数级增长，但社会对数据中心的容忍度在下降。这可能导致数据中心向偏远地区、海上平台甚至太空迁移的加速。美参议员 Schiff 提出法案：保护消费者免受 AI 数据中心能源成本转嫁事实：加州民主党参议员 Adam Schiff 提出能源成本公平与可靠性法案，防止 AI 数据中心的能源成本被转嫁给普通消费者。思考：Schiff 的法案反映了一个新兴的政策趋势：AI 的社会成本谁来承担？数据中心消耗巨量电力，推高电价，但利润被科技公司拿走——这种不对等正在引发政治反弹。如果法案通过，将迫使 AI 公司承担更多基础设施成本，可能推高 AI 服务的价格。这也可能催生新的商业模式，比如 AI 公司投资可再生能源来对冲能源成本。 📌 今日核心洞察 Agent 从云端走向企业机房：OpenAI 与 Dell 合作标志着 AI Agent 进入混合云/本地部署时代。企业 AI 的竞争主战场正在从"谁的模型更强"转向"谁能更好地部署到现有 IT 基础设施中"。Dell、HPE 等传统 IT 巨商在 Agent 时代可能迎来第二春。 ...