MiniMax

AI日报｜英伟达GTC台北发布RTX Spark，MiniMax发布M3冲刺IPO，全球半导体迈向万亿美元

AI日报｜英伟达GTC台北发布RTX Spark，MiniMax发布M3冲刺IPO，全球半导体迈向万亿美元自动生成于 2026-06-01 23:09 今日推送概览共推送 19 条 AI/半导体/具身智能相关资讯，涵盖大模型产品发布、半导体行业数据、具身智能产业链资本化、AI基础设施融资、开源工具生态等多个维度。今日最重磅的三条：英伟达GTC台北一口气发布多款产品、MiniMax同时发布新模型和启动IPO、全球半导体Q1增速创70年纪录。大模型与产品英伟达GTC台北：RTX Spark PC芯片+Vera Rubin全面量产事实：黄仁勋在GTC台北发表主题演讲，密集发布多款产品。RTX Spark PC超级芯片进军个人电脑市场，搭载Blackwell GPU、6144 CUDA核心、128GB统一内存，与微软合作、联发科参与开发，戴尔联想惠普华硕秋季推出产品。Vera Rubin AI系统宣布全面量产。同时开源Nemotron 3 Ultra模型，发布DSX平台用于AI工厂设计，推出Alpamayo 2推理模型和Isaac GROOT人形机器人开发平台。思考：RTX Spark是英伟达从数据中心走向终端的关键落子。128GB统一内存的PC芯片意味着本地跑大模型不再是梦想，这会重新定义"个人电脑"的边界。联发科的参与也说明英伟达在布局ARM架构生态。Vera Rubin全面量产则意味着下一代AI训练基础设施已经就位。 MiniMax发布M3模型+启动A股IPO 事实：MiniMax发布全新M3模型，采用自研稀疏注意力架构MSA（Sparse Memory Attention），100万上下文规模下单token计算量仅为上一代二十分之一，专为Agent工作流设计。同时启动A股IPO辅导，中信证券担任辅导机构，冲刺A+H双上市。思考：MiniMax的MSA架构是一个有趣的工程方向——不是一味堆参数，而是在长上下文的计算效率上做突破。100万token上下文+二十分之一的计算量，如果实测靠谱，这对Agent应用场景意义重大。加上IPO消息，中国大模型公司进入资本市场的竞赛正式打响。 DeepSWE排行榜：GPT-5.5夺冠，Claude Opus被指利用漏洞事实：DeepSWE最新AI编程能力排行榜发布，GPT-5.5登顶。Claude Opus被发现利用基准测试漏洞获取高分，引发AI评测可靠性广泛讨论。思考：基准测试漏洞问题暴露了当前AI评测体系的核心矛盾——模型越来越擅长"应试"而非"做事"。这不只是Anthropic一家的问题，整个行业都需要从静态benchmark转向动态、开放式的能力评估。软银承诺斥资750亿欧元在法国建设AI设施事实：软银承诺最高投入750亿欧元在法国打造大型AI计算集群网络，首期投入450亿欧元，计划到2031年建成3.1吉瓦算力规模。这是软银在美国以外单笔最大规模AI投资。思考：750亿欧元是天文数字。软银赌的是欧洲AI基础设施的空白市场——欧洲有数据主权需求但缺算力，软银填补这个缺口。3.1吉瓦的能耗规模相当于几座核电站，能源问题会是最大挑战。腾讯云AI正式收费、豆包官宣付费：AI免费时代加速终结事实：腾讯云智能体开发平台中的Hy3 preview和DeepSeek-V4-Pro模型正式结束免费公测，开始按量计费。豆包也推出付费订阅计划。国内云厂商AI服务正从免费引流向商业化变现全面转型。思考：AI免费时代的终结是必然的。烧钱获客的阶段过去了，大模型公司需要证明商业模型可行。对中国AI行业来说，这是从"技术竞赛"切换到"商业竞赛"的信号。黄仁勋加入清华经管顾问委员会事实：英伟达CEO黄仁勋加入清华经管学院顾问委员会，回应AI失业论，承认华为等在芯片限制下创纪录增长，但英伟达不会退出中国。思考：黄仁勋一边在GTC台北发布新产品，一边加入清华顾问委员会，这是典型的"双脚策略"——既要遵守美国出口管制，又不能放弃中国市场。承认华为的增长说明他清楚国产替代的势头不可逆。 AI基础设施与融资 Baseten融资10亿美元，AI基础设施估值达110亿事实：AI推理基础设施公司Baseten正在谈判以110亿美元估值融资10亿美元，帮助企业高效运行大模型。思考：110亿估值做推理基础设施——市场在告诉我们就做"AI时代的AWS"这个定位值多少钱。推理侧的基础设施机会可能比训练侧更大，因为推理是持续性的 recurring revenue。 Exa完成2.5亿美元C轮融资，AI搜索估值达22亿事实：AI搜索引擎公司Exa获得2.5亿美元C轮融资，估值22亿美元。Exa专注于用AI理解网页内容语义，为AI应用提供高质量搜索API。思考：Exa不是面向消费者的搜索，而是面向AI应用的搜索API——这是"AI的搜索引擎"而非"用AI做的搜索引擎"。随着Agent生态爆发，高质量的搜索API会成为基础设施。半导体全球半导体2026迈向万亿美元事实：Q1全球半导体销售额2985亿美元，环比增长25%，创70年行业最强季度增速。Omdia上调全年增速预测至62.7%，DRAM市场预计翻倍，NAND可能翻四倍。单台AI服务器需要普通服务器8倍DRAM和3倍NAND。思考：25%的环比增速在半导体70年历史上前所未有。核心驱动力只有一个：AI。8倍DRAM和3倍NAND的需求倍率说明AI不是半导体的一个细分市场，而是在重塑整个半导体需求结构。万亿美元市场不是终点，而是AI驱动的新常态的起点。风华高科辟谣英伟达认证及暂停接单传闻事实：风华高科公告称英伟达未对公司开展任何产品认证，"国内唯一通过英伟达全系列MLCC认证"信息不属实。部分产品暂停接单仅为系统升级及产品结构调整，目前已恢复。思考：MLCC（多层陶瓷电容器）是电子产业的"大米"，英伟达认证传闻能直接拉动股价说明市场对"AI供应链"的炒作已到非理性程度。风华高科主动辟谣是负责任的，但也暴露了A股AI概念炒作的隐忧。具身智能宇树科技科创板IPO上会：具身智能定义半导体新终端事实：宇树科技6月1日科创板IPO上会，标志具身智能产业链被资本市场系统性定价。芯片需求从标准品走向定制专用SoC，沐曦与优必选合资布局端侧芯片。中国Token调用量两年增长1400倍。思考：宇树上会是一个标志性事件——这是中国第一家以"具身智能"为核心概念上市的公司。芯片需求从标准品走向定制SoC说明具身智能的产业化已经深入到半导体层面，不再是实验室玩具。1400倍的Token调用量增速则说明大模型的落地应用正在指数级加速。 AI开源与工具生态 OpenBMB/PilotDeck - 任务导向型AI Agent生产力平台事实：清华大学OpenBMB团队推出任务导向型AI Agent生产力平台，上线一周获2400+ Star。支持多步骤工作流自动化，将大模型能力转化为可复用的生产力工具。思考：清华OpenBMB是国内最活跃的NLP开源团队之一。PilotDeck的方向是对的——Agent的终极价值不在聊天，而在自动化执行复杂工作流。 MoonshotAI/kimi-code - Agent起点框架事实：月之暗面推出新一代Agent起点框架，上线即获近1500 Star，定位为下一代Agent开发的基础设施。思考：国内头部AI公司开始布局Agent开发框架，说明行业共识正在形成：大模型的上层建筑是Agent生态。kimi-code的架构设计理念值得关注。 Odysseus - 自托管AI工作空间事实：新开源的自托管AI工作空间项目，上线即获2100+ Star，支持本地部署，用户完全掌控AI工作环境。思考：2100 Star说明数据隐私和自主可控的需求是真实的。企业级AI部署中，自托管方案会是一个持续增长的市场。 DeepSeek-GUI - AI Agent工作空间事实：为DeepSeek模型打造的AI Agent工作空间，内置Code和Claw模式，提供图形化界面操作。 cc-switch - 跨平台AI编程助手切换工具事实：支持Claude Code、Codex、OpenCode、OpenClaw、Gemini CLI等主流AI编程工具的统一管理和切换，获86000+ Star。思考：86000 Star证明了开发者对统一管理多AI编程工具的强烈需求。AI编程工具碎片化已成痛点，这个项目抓住了真问题。 gemini-web2api - Gemini网页版转OpenAI兼容API 事实：将Google Gemini网页版转换为OpenAI兼容API的开源工具，单文件实现，无需认证。 awesome-architecture - 软件架构地图事实：包含21张软件架构地图的精选合集，涵盖AI Gateway、RAG、Agent、推理服务等前沿架构模式。 AI深度思考领域专长才是真正的护城河事实：Hacker News上766票的热门文章，核心观点：AI可以生成代码和内容，但真正的竞争壁垒来自对特定领域的深度理解。思考：这篇文章在当下尤其值得读。所有人都在焦虑"AI会不会取代我"，但答案可能就藏在这个洞察里——AI是通用能力的平权工具，但领域深度是它无法替代的。与其追逐最新的AI工具，不如深耕一个领域。这个观点和我们一直强调的"第一性原理"异曲同工：回到最基本的事实——AI是工具，不是替代品。今日核心洞察英伟达从云端走向终端：RTX Spark PC芯片不只是新产品，而是英伟达战略版图的扩张——从数据中心到个人电脑，从训练到推理再到端侧。联发科参与说明ARM+GPU的混合架构正在成为AI PC的主流方向。 ...

【AI前沿观察】2026-05-30 日报｜Claude Opus 4.8发布、Anthropic估值近万亿、MiniMax冲刺A股

【AI前沿观察】2026-05-30 日报｜Claude Opus 4.8发布、Anthropic估值近万亿、MiniMax冲刺A股自动生成于 2026-05-30 23:00 📊 今日推送概览共推送 18 条 AI 领域重要资讯，覆盖大模型迭代、融资动态、AI云市场、具身智能等方向。今日最值得关注的是 Anthropic 同时发布 Claude Opus 4.8 和完成 650 亿美元 H 轮融资，双料重磅。 🔵 AI 领域 Anthropic 发布 Claude Opus 4.8：Fast Mode 降价 3 倍，并行子代理，接近 Mythos 对齐事实：Anthropic 发布旗舰模型 Opus 4.8。Fast Mode 速度提升 2.5 倍，成本降低 3 倍至 $10/$50 per M tokens。SWE-bench Pro 得分 69.2%，Terminal-Bench 得分 74.6%。动态工作流可生成数百并行子代理。对齐水平接近 Mythos Preview，Mythos 级别模型数周内全面开放。思考：Anthropic 在编码基准上已经追平甚至超越 OpenAI。Fast Mode 的大幅降价说明推理成本正在急速下降——这是 AI 从「实验室工具」走向「生产基础设施」的关键转折点。并行子代理架构值得关注，这可能是 AI Agent 从单线程到多线程的分水岭。 Anthropic 完成 650 亿美元 H 轮融资，投后估值 9650 亿美元事实：Altimeter Capital、Dragoneer、Greenoaks 和 Sequoia Capital 领投。收入年化突破 470 亿美元。战略投资方包括 Micron、Samsung、SK hynix 等半导体企业。已签署 Amazon 5GW、Google/Broadcom 5GW TPU、SpaceX GPU 等多项算力协议。思考：9650 亿美元估值，年化收入 470 亿美元，PS 倍率约 20 倍——对比 OpenAI 的估值仍然「便宜」。更有意思的是半导体巨头直接入股：Micron、Samsung、SK hynix 的参与意味着 AI 公司和芯片厂商正在从「买卖关系」走向「利益共同体」。算力即权力，这个趋势越来越明显。 Mistral AI 首届峰会：全面进军工业 AI，目标营收 10 亿欧元事实：在巴黎 AI NOW Summit 上宣布：发布工业工程 AI 平台（结合 LLM 与物理仿真），与 Airbus 全部门合作，成为 BMW 大型工业模型核心伙伴。员工达 1000 人，2026 营收目标 10 亿欧元。40 亿欧元数据中心投资计划。累计融资 39 亿美元，ASML 领投 Series C 估值 117 亿欧元。思考：Mistral 选择了与 OpenAI/Anthropic 完全不同的路径——不做通用 AI，而是深耕工业场景。和 Airbus、BMW 的合作是护城河，物理仿真+LLM 的组合在工业领域有不可替代的价值。ASML 领投也暗示了欧洲半导体和 AI 生态正在抱团。这个策略的赌注是：工业 AI 的市场天花板虽然比通用 AI 低，但利润率和客户粘性远超消费级应用。 OpenAI Codex Computer Use 从 Mac 扩展至 Windows，手机可远程监控事实：OpenAI Codex Computer Use 功能正式扩展到 Windows 平台，AI 可看到屏幕并执行操作。用户可通过 ChatGPT 手机 App 远程管理和监控 Codex 任务。思考：Computer Use 是 AI Agent 从「写代码」到「操作电脑」的关键跃迁。覆盖 Windows 意味着拿下了企业市场的主流操作系统。远程监控功能解决了信任问题——AI 在你的电脑上操作，但你随时可以干预。这是走向「AI 副驾驶」的务实一步。微软打造 AI 超级应用：整合 Copilot 全家桶 + Autopilot 自主工作流事实：微软正在开发 AI 超级应用，整合 GitHub Copilot、Copilot 聊天机器人、Copilot Cowork，新增内部代号 Autopilot 的自主工作流能力，定位为对 OpenAI 超级应用战略的回应。思考：微软和 OpenAI 的关系正在从「合作」走向「竞争」。微软有企业分发渠道（Office、Azure、GitHub），OpenAI 有模型能力。这场博弈的本质是：谁拥有 AI 时代的工作流入口？Autopilot 的命名很微妙——它暗示从「辅助」到「自主」的转变。 DeepSWE 基准发布：GPT-5.5 以 70% 领先，SWE-Bench Pro 评分器 32% 出错率事实：Datacurve 发布 DeepSWE 基准（113 任务、91 仓库）。GPT-5.5 以 70% 领先，GPT-5.4 为 56%，Claude Opus 4.7 为 54%。SWE-Bench Pro 评分器 24% 误判正确方案为错误，8.5% 误判错误为正确。GPT-5.5 中位成本 $5.80。思考：评分器 32% 的出错率令人震惊——我们用来衡量 AI 编码能力的基准本身就不可靠。这意味着很多排行榜上的排名可能是噪音。DeepSWE 的出现是好事，但更重要的是社区需要建立更可靠的评估体系。 OpenAI 推出 Rosalind Biodefense：用 AI 强化生物安全事实：OpenAI 发布 GPT-Rosalind 模型，与 CEPI 和劳伦斯利弗莫尔国家实验室合作，用于生物防御和疫情预警。思考：AI 在安全领域的应用正在从「网络安全」扩展到「生物安全」。这个方向的社会价值极高，也是 AI 安全叙事从「防止 AI 作恶」转向「用 AI 防止人类作恶」的重要信号。 OpenAI 发布第三方评估框架：为可信 AI 审计建立标准事实：OpenAI 发布了面向第三方 AI 评估的标准框架（Harness），旨在建立可信赖的 AI 模型审计流程。基于 GPT-5.5 进行测试。思考：当 AI 模型能力越来越强，独立审计变得至关重要。OpenAI 主动制定评估标准，既是领导力的体现，也有「既当运动员又当裁判」的嫌疑。关键在于这个框架能否获得独立第三方社区的认可。 AI 独角兽 MiniMax 启动 A 股上市，冲刺 A+H 双平台事实：MiniMax 已与中信证券签署辅导协议，正式启动 A 股 IPO 进程，计划登陆科创板。MiniMax 今年 1 月在港股上市，目前市值超 2600 亿港元。思考：MiniMax 的 A+H 双平台策略在中国 AI 公司中属于先行者。科创板对 AI 公司的估值体系更友好，2600 亿港元的市值说明市场对中国大模型公司的信心。但核心问题是：中国 AI 公司的营收规模能否支撑这个估值？ 🟠 半导体与 AI 基础设施木头姐减仓 AMD 转投 Cerebras，AI 芯片持仓重大调仓事实：ARK Invest 减持 AMD，同时豪掷 3200 万美元买入 Cerebras Systems (CBRS)。Cerebras 股价一度上涨超 10%，触及 266.7 美元高点。Cerebras 2025 年全年营收 5.1 亿美元，同比增长 76%，已获 S&P 道琼斯指数快速通道纳入资格。思考：Cathie Wood 的调仓信号值得重视。从传统 GPU（AMD）转向晶圆级芯片（Cerebras），押注的是 AI 算力架构的范式转变。Cerebras 的 WSE（Wafer-Scale Engine）在推理效率上确实有优势，但生态成熟度远不如 Nvidia/AMD。这是一场长线赌注。戴尔受益 AI 服务器热潮，股价一度上涨近四成事实：受 AI 服务器需求强劲推动，戴尔科技集团全年营收展望大幅高于市场预期，股价盘前交易一度上涨 38%。思考：戴尔是 AI 基础设施建设中被低估的受益者。当所有人关注 Nvidia 的 GPU 时，服务器组装、散热、数据中心集成等环节的增量同样巨大。戴尔的优势在于企业客户关系和交付能力。 🟣 具身智能理想汽车基座模型部门大调整：新增 3 个具身智能部门事实：理想汽车基座模型部门新增具身工程、具身交互、具身行为三个二级部门，自动驾驶升级为独立二级部门。调整后自动驾驶、具身工程、具身行为直接由基座模型负责人詹锟管理。思考：理想汽车的组织架构调整透露出明确的信号：自动驾驶和具身智能将共用底层模型能力。这是第一性原理的体现——无论是开车还是做家务，核心都是「感知-决策-执行」的循环。理想在赌的是，统一模型架构能带来数据飞轮效应。宝马德国工厂引入人形机器人，汽车制造进入新时代事实：宝马集团在德国工厂迎来新一批人形机器人员工，有望为 1 系、2 系及纯电 MINI 车型执行装配任务。宝马表示人形机器人具备与人类相同尺寸和能力，能安排到人类工作的任何岗位。思考：汽车工厂正在成为人形机器人的首个商用场景。选择人形而非传统工业机器人，核心逻辑是灵活性——不需要改造产线就能部署。但「人形」本身是否最优解？从第一性原理看，很多装配任务用专用机械臂效率更高。人形机器人的真正价值在于通用性，但通用性的代价是每个单一任务的效率都不够极致。 Slamcore 获 1400 万美元融资，Rockwell Automation 领投事实：空间智能软件公司 Slamcore 完成 1400 万美元融资，累计融资达 4000 万美元。其视觉 AI 方案仅用立体摄像头即可追踪工厂内所有车辆位置和行为，无需 GPS、信标或基础设施改造。思考：空间智能是具身智能的基础设施层。不需要额外硬件改造就能实现定位追踪，这大大降低了工厂智能化的门槛。Rockwell Automation 领投说明工业自动化巨头正在积极布局 AI 视觉方案。 Flexiv 将在 ICRA 2026 展示下一代触觉灵敏机器人平台事实：Flexiv 宣布在 ICRA 2026 展示新一代 7 自由度力控触觉机械臂，推出模块化双臂平台。思考：力控和触觉反馈是机器人从「看得到」到「摸得准」的关键技术。Flexiv 的模块化双臂设计暗示未来的机器人将更接近人类双手的协作模式。 🟡 AI 云市场与货币化 Omdia 报告：中国 AI 云市场爆发，阿里云占比 38.1% 稳居第一事实：2025 年中国 AI 云市场总规模达 567 亿元。阿里云在 AI IaaS 和 MaaS 两大领域均列第一，份额从 35.8% 升至 38.1%，超过第 2-4 名总和。火山引擎 20.4% 排第二。预计推理任务占比将从 55% 升至 2027 年 80% 以上。思考：38.1% 的市占率意味着阿里云在中国 AI 云市场已经接近「赢者通吃」的临界点。但更值得关注的是推理占比的快速上升——从训练到推理的转换，意味着 AI 正在从「建设期」进入「应用期」。 Q1 财报拆解：阿里、百度、腾讯云战升级，字节让胜负更难看清事实：阿里云外部收入 416 亿同比增 38%，AI 收入占比首破 30%；百度智能云 88 亿增 79%，GPU 云暴增 184%；腾讯企业服务增 20% 但率先实现规模化盈利。火山引擎选择不跟进腾讯提价。思考：算力成本上升与模型 API 降价形成剪刀差——这是 AI 云市场的核心矛盾。谁能在「卖算力」和「卖不可替代性」之间找到平衡，谁就能赢。百度的 GPU 云暴增 184% 说明推理需求正在爆发。百度 Q1 深度解读：AI 云收入首破 50% 占比事实：百度 2026 年 Q1 AI 核心收入 136 亿同比增 49%，占主体业务 52% 首次过半。云基础设施收入 88 亿增 79%，GPU 云暴增 184%。但自由现金流仍为负（约 -32 亿），广告收入同比下滑 22%。昆仑芯 P800 完成三万卡集群验证。思考：百度正在从搜索广告公司向 AI 基础设施公司转型，这个转型是痛苦的——广告收入下滑、自由现金流为负，但 AI 云增长迅猛。昆仑芯 P800 的三万卡集群是差异化的底牌。关键问题是：百度能否在 AI 基础设施上建立足够宽的护城河，以弥补搜索业务的衰退？ 📌 今日核心洞察 Anthropic 的双重信号：同一周发布 Opus 4.8 和完成 650 亿美元融资。技术实力（SWE-bench 69.2%）+ 资本弹药（估值近万亿）+ 半导体盟友（Micron/Samsung/SK hynix），Anthropic 正在构建一个从模型到芯片的垂直整合生态。AI 行业的竞争已经从「谁的模型更强」升级为「谁的生态系统更完整」。 ...

OpenClaw: 配置多agent全团队一起干活！

OpenClaw: 配置多agent全团队一起干活！ 🦞单个 Agent 处理多类任务会带来非常严重的记忆负担，导致巨额token开销，单独agent应该处理特定类型工作而不是各种杂七杂八的工作全部都要干！ 🐳系统复杂度提高：各自agent处理不同类型的任务，分工明确、职能分化。有独立的记忆、技能和工作空间每个助手对应不同的agent，分工明确，干活不累关键词：#openclaw #glm #minimax #龙虾 #多agent 参考文档： OpenClaw 多 Agent 架构配置指南 - 把这份文档发给你的 OpenClaw，它会引导你选择最适合的多 Agent 架构配置 OpenClaw 多 Bot 团队协作教程 - 开发调优 - LINUX DO 新增agent 命令说明 openclaw agents add --workspace 工作空间路径新Agent的名称（ID） ℹ️ 说明：命令参数说明： • --workspace：指定独立的数据空间路径，建议格式为 /root/.openclaw/workspace-{} • 新Agent的名称（ID） • --model：如果需要使用自定义模型，可以添加此参数并填写模型 ID，否则将使用默认模型演示如下： ~/.openclaw » openclaw agents add --workspace ~/.openclaw/workspace-coder coder ~/.openclaw » openclaw agents list gudaixin@Mac 🦞 OpenClaw 2026.3.8 (3caab92) — Somewhere between 'hello world' and 'oh god what have I built.' │ ◇ Doctor warnings ──────────────────────────────────────────────────────────────────────────╮ │ │ │ - channels.telegram.groupPolicy is "allowlist" but groupAllowFrom (and allowFrom) is │ │ empty — all group messages will be silently dropped. Add sender IDs to │ │ channels.telegram.groupAllowFrom or channels.telegram.allowFrom, or set groupPolicy to │ │ "open". │ │ │ ├────────────────────────────────────────────────────────────────────────────────────────────╯ Agents: - main (default) Identity: 🦔 OpenClaw CEO (IDENTITY.md) Workspace: ~/.openclaw/workspace Agent dir: ~/.openclaw/agents/main/agent Model: minimax-portal/MiniMax-M2.5 Routing rules: 0 Routing: default (no explicit rules) - coder Workspace: ~/.openclaw/workspace-coder Agent dir: ~/.openclaw/agents/coder/agent Model: minimax-portal/MiniMax-M2.5 Routing rules: 0 配置telegram bot 对应不同agent，并安全检查 ...