Agent

AI日报｜OpenAI发布自研推理芯片Jalapeño，DeepMind公开AI Agent安全路线图

每日汇总来自全球主要 AI 实验室与研究机构的官方博客文章，筛选有深度、有实质内容的技术与产品进展。 🤖 AI博客汇总 | 2026-06-24 23:03 📰 OpenAI and Broadcom unveil LLM-optimized inference chip OpenAI 联手博通发布首颗自研推理芯片 Jalapeño 6月24日，OpenAI 正式发布其与博通合作开发的首款 AI 推理加速芯片 Jalapeño。这颗芯片从零开始设计，围绕 LLM 推理的物理需求——核函数优化、内存移动、网络和 serving 模式——进行架构定制，而非将通用加速器改写而来。关键数据：从设计到 tape-out 仅用 9 个月，官方称这是高性能先进半导体史上最快的 ASIC 开发周期工程样品已在实验室以目标频率和功耗运行，包括 GPT-5.3-Codex-Spark 初步测试显示每瓦性能显著优于当前最先进的竞品计划 2026 年底前部署于千兆瓦级数据中心，与微软等合作伙伴联合推进博通 CEO Hock Tan 表示这是"多代路线图的开端" OpenAI 表示，Jalapeño 将与其全栈战略形成飞轮：更好的基础设施 → 更高效的训练与服务 → 更有能力的模型 → 更好的产品 → 更多的用户与收入 → 更多的基础设施投入。Greg Brockman 的原话是："世界正在走向算力经济，Jalapeño 是我们让先进 AI 更快、更可靠、更普惠的长线布局。" 来源：OpenAI Blog | 时间：2026-06-24 ...

技术日报｜2026-06-14：MCP协议生态爆发，Ollama本地大模型成热潮

本期技术日报聚焦：MCP协议服务器生态突破8.7万星，Ollama本地大模型工具突破17万星，AI Agent记忆工具claude-mem获8.2万星，同时收录高频交易机器人freqtrade。

技术日报｜Goose开源Rust智能体、Headroom大幅压缩RAG令牌、小米MiMo Code登顶HN

2026年6月12日技术日报：Goose用Rust重塑AI智能体、Headroom压缩60-95% RAG令牌、NVIDIA开源技能安全扫描器、小米MiMo Code开源登顶HN、last30days-skill一周狂揽11k stars。

技术日报｜2026-06-05

本期概览数据来源：GitHub Trending（Daily + Weekly）、多平台热榜抓取时间：2026-06-04 17:00 UTC 推送条目：7 条 AI Agent / 工具类 1. hermes-agent 分类：AI Agent | 推荐指数：8/10 hermes-agent 是 NousResearch 团队推出的智能代理框架，核心理念是打造一个能够随着用户使用而不断学习和适应的AI代理。它支持多模态交互，可处理文本、代码、文档等多种输入，并具备长期记忆和上下文理解能力。该项目采用模块化设计，方便开发者自定义工具和工作流。适合需要构建个性化 AI 助手开发者关注。 📌 一句话描述：随用随学的 AI 代理框架，模块化设计支持自定义工具链 🔗 https://github.com/NousResearch/hermes-agent 2. open-notebook 分类：知识管理 | 推荐指数：8/10 open-notebook 是 Notebook LM 的开源实现，提供更多灵活性和功能特性。支持长文本处理、智能摘要、多媒体整合等功能，可作为个人知识管理和研究助理。该项目采用 TypeScript 开发，方便开发者二次定制和扩展。对于需要本地部署知识库工具的用户来说，这是一个值得关注的选择。 📌 一句话描述：开源版 Notebook LM，支持本地部署和深度定制 🔗 https://github.com/lfnovo/open-notebook 3. Open-LLM-VTuber 分类：语音交互 | 推荐指数：7/10 Open-LLM-VTuber 让你可以通过语音与任意大语言模型对话，支持免提语音交互、语音打断功能，以及 Live2D 虚拟形象。该项目跨平台运行，可在本地部署，保护隐私的同时提供有趣的交互体验。适合做 AI 虚拟主播或智能客服场景。 📌 一句话描述：语音操控 LLM + Live2D 虚拟形象，本地运行保护隐私 🔗 https://github.com/Open-LLM-VTuber/Open-LLM-VTuber 4. Understand-Anything 分类：代码理解 | 推荐指数：8/10 ...

技术日报｜headroom压缩LLM token，ECC突破20万星，Vibe-Trading引领AI交易

📊 2026年6月4日技术日报今日数据来源：GitHub Trending Daily/Weekly、Hacker News、V2EX、掘金热榜。重点关注 AI Agent、LLM工具链、金融科技、热门开发工具。 1. headroom — LLM Token压缩利器 🤖 [AI] chopratejas/headroom 🔥 推荐指数: 9/10 ⭐ 9,001 stars | 今日 +3,528 压缩工具输出、日志、文件和RAG chunks后再发送给LLM，减少60-95%的token消耗且不影响回答质量。可作为库、代理或MCP服务器使用，是目前LLM上下文优化领域最热门的方案。 💡 为什么值得关注： Token消耗是LLM应用的核心成本。headroom直接在数据进入模型前做压缩，支持MCP协议，可以无缝集成到现有Agent工作流中。日增3500+星，说明痛点确实被击中了。 🔗 https://github.com/chopratejas/headroom 2. ECC — Agent开发框架霸主 🤖 [AI] affaan-m/ECC 🔥 推荐指数: 10/10 ⭐ 205,305 stars | 周增 +9,910 AI Agent性能优化框架，为Claude Code、Codex、Cursor等编程Agent提供技能、直觉、记忆和安全能力。已突破20万星，是当前最火的Agent开发工具之一。 💡 为什么值得关注： 20万星是什么概念？整个GitHub上能到这个量级的项目屈指可数。ECC定义了"AI编程Agent应该怎么训练"的范式，它的技能系统和记忆机制正在成为行业标准。 🔗 https://github.com/affaan-m/ECC 3. Vibe-Trading — AI个人交易Agent 📡 [金融] HKUDS/Vibe-Trading 🔥 推荐指数: 9/10 ⭐ 9,723 stars | 今日 +221 ...

Harness工程：把AI的错误控制在有限范围内

Harness工程不能保证AI永远不走偏，但它能把AI从'自由发挥的概率模型'，变成一个'有边界、可验证、可审计、可恢复的工程系统'。

Harness Engineering：让 AI 可靠执行长任务的系统工程学

模型之外的那个「执行环境」，才是决定任务能否跑完的真正变量。

技术日报｜Scrapling自适应爬虫爆火，supermemory定义AI记忆新范式

2026年6月2日技术日报：Scrapling自适应爬虫框架日增1475星、supermemory AI记忆引擎、impeccable AI设计语言、train-llm-from-scratch LLM训练教程、harness Agent元技能编排、VoxCPM无Tokenizer多语言TTS

技术日报｜PilotDeck AI Agent平台爆火，月之暗面开源kimi-code，A股多Agent投研框架上线

2026年6月1日技术日报今天的GitHub Trending和Hacker News迎来了多个重磅项目，AI Agent生态持续爆发，金融量化工具也有了本土化突破。以下是精选内容： 1. OpenBMB/PilotDeck — 任务导向型AI Agent生产力平台 🏷️ [AI Agent] ⭐ 2,467 清华大学OpenBMB团队推出的任务导向型AI Agent生产力平台，上线一周即获2400+Star。该平台围绕任务驱动的Agent编排设计，支持多步骤工作流自动化，将大模型能力转化为可复用的生产力工具。对AI Agent开发者来说是值得关注的新框架，其设计理念强调"任务"而非"对话"作为核心交互单元。 🔗 https://github.com/OpenBMB/PilotDeck 2. Odysseus — 自托管AI工作空间 🏷️ [AI / 自托管] ⭐ 2,124 一个新开源的自托管AI工作空间项目，上线即获2100+Star，同时在Hacker News上引发讨论。支持本地部署，用户可以完全掌控自己的AI工作环境，无需依赖第三方云服务。对于注重数据隐私和自主可控的开发者来说是理想选择，也体现了"自托管AI"这一趋势正在加速。 🔗 https://github.com/pewdiepie-archdaemon/odysseus 3. MoonshotAI/kimi-code — 新一代Agent起点框架 🏷️ [AI Agent] ⭐ 1,497 月之暗面(Moonshot AI)推出的新一代Agent起点框架。定位为下一代Agent开发的基础设施，提供Agent构建的标准化工具链。作为国内头部AI公司的开源项目，其架构设计理念值得Agent开发者密切关注——从"对话补全"到"Agent编排"的范式转变正在发生。 🔗 https://github.com/MoonshotAI/kimi-code 4. 微信账单分析工具 wechatpay 🏷️ [金融工具] ⭐ 1,509 基于Electron构建的微信账单可视化分析应用，获1500+Star。用户导入微信账单后可进行多维度消费分析，包括分类统计、趋势图表等。解决了微信支付缺少专业账单分析工具的痛点，实用性极强，是个人财务管理的利器。 🔗 https://github.com/run-liyi/wechatpay 5. awesome-architecture — 21张软件架构地图 🏷️ [架构 / 学习] ⭐ 1,001 一份包含21张软件架构地图的精选合集，涵盖AI Gateway、RAG、Agent、推理服务等前沿架构模式。不同于普通awesome列表，该项目通过可视化架构图帮助开发者建立系统性认知，适合想要从coder升级为architect的工程师学习参考。 🔗 https://github.com/study8677/awesome-architecture 6. gemini-web2api — Gemini网页版转OpenAI兼容API 🏷️ [AI / API] ⭐ 819 ...

AI日报｜马斯克诉Altman败诉，微软打造AI超级应用，上海发布具身智能仿真平台

AI日报｜马斯克诉Altman败诉，微软打造AI超级应用，上海发布具身智能仿真平台自动生成于 2026-05-31 23:00 📊 今日推送概览今日 AI 领域共收录 21 条重要资讯，覆盖 AI 大模型、具身智能、Agent 工具链、AI 产业政策等多个方向。核心主题：AI 商业化进入深水区，Agent 经济从概念走向基础设施。 🔵 AI 大模型与应用马斯克诉Altman案败诉，陪审团仅审议2小时即裁定事实：Musk v. Altman 世纪 AI 审判落幕，陪审团认定马斯克两项索赔因诉讼时效已过被驳回，第三项因前两项失败而无法成立。马斯克已表示将上诉，称裁决基于"日历技术细节"而非案件实质。思考：这场审判的本质是 OpenAI 治理结构的合法性检验。诉讼时效的裁定回避了核心问题——非营利转营利的治理转型是否正当。上诉战将持续，但 OpenAI 已借此"脱敏"，短期内融资和商业化不受影响。微软正在开发AI超级应用，整合Copilot全家桶事实：据 Fortune 报道，微软正打造整合 GitHub Copilot、Copilot 聊天机器人、Copilot Cowork 协作工具，以及内部代号 Autopilot 的代理工作流能力的 AI 超级应用。这是对 OpenAI 超级应用野心的直接回应。思考：微软的 AI 策略正在从"在每个产品里加 Copilot"转向"用一个超级应用统一所有 Copilot"。这不仅是产品整合，更是对 AI 入口级产品的争夺——谁能成为用户与 AI 交互的第一界面。微软推出Copilot Health AI预览版，AI进入医疗核心事实：微软发布 Copilot Health AI 预览版，可分析用户医疗记录。医疗数据敏感度高、监管严格，微软此时切入意味着底层能力已达到医疗级信心阈值。思考：AI 进入医疗核心不是技术问题，是信任问题。微软选择在此时推出，说明其在合规框架和隐私保护上已做了充分准备。医疗 AI 的壁垒不在算法，在于数据信任和监管许可。 OpenAI Codex计算机使用功能扩展到Windows平台事实：继 Mac 版之后，OpenAI 的 Codex 计算机使用功能正式登陆 Windows。用户可通过 ChatGPT 手机端远程管理和监控 Codex 作业，AI Agent 能力覆盖主流桌面双平台。思考：Codex 覆盖 Windows 意味着 OpenAI 的 Agent 战略已覆盖全球 90% 以上的桌面用户。从"能看屏幕"到"能操作屏幕"，这是 AI 从工具变助手的关键一步。 Mistral AI发布Vibe产品，全面进军工业AI与数据中心事实：Mistral AI 在巴黎 AI NOW Summit 上发布 Vibe，宣布进军工业 AI 领域（包括飞机机翼物理模拟），并推进自有数据中心建设。公司目前 1000 人，2026 年营收目标 10 亿欧元。思考：Mistral 从"法国 OpenAI"走向"工业 AI 平台"，这是差异化竞争的明智选择。工业 AI 的壁垒远高于通用聊天——需要领域知识、物理模拟和工程信任。10 亿欧元营收目标如果实现，将证明垂直化路线的可行性。 Mistral AI Now Summit要点总结事实：HackerNews 上关于 Mistral AI Now Summit 的详细笔记获 449 点和 196 条评论，展示最新模型路线图和企业战略。思考：欧洲 AI 社区对 Mistral 的高度关注说明，市场需要非美国的 AI 力量来平衡格局。 🟠 AI 产业与政策火山引擎发布国内首个Agent Plan套餐，替竞品卖模型做平台入口事实：火山引擎发布 Agent Plan，将 GLM-5.1、Kimi-K2.6 等竞品模型与自研 Seed 系列打包，以 AFP 统一计费。标志着火山引擎从 Token 平台向 Agent 基础设施的战略转型。2025 年火山引擎 MaaS 调用量份额达 49.5%。思考：替竞品卖模型看似"大方"，实则是经典的平台策略——做 AI 时代的"应用商店"。Token 单价持续压缩的背景下，从卖 Token 到绑定工作流，是商业模式的必然进化。国家数据局召开词元经济座谈会，将词元经济纳入工作体系事实：国家数据局刘烈宏主持召开词元经济座谈会，阿里云、腾讯、月之暗面等企业参会。中国日均词元调用量已超 140 万亿次，较 2024 年初千倍跃升。思考：140 万次日/日 Token 调用量，千倍增长——这不是"趋势"，这是"基础设施级别"的爆发。当政府开始用"词元经济"这个概念来制定政策，说明 AI 已从技术议题升级为国家经济议题。阿里云加速AI出海，在新加坡发布Qwen Cloud海外AI产品官网事实：阿里云在新加坡面向海外市场发布 Qwen Cloud，同步推出 Agent 产品 MuleRun，以及智能体编程平台 Qoder、通用桌面智能体 QoderWork 系列更新。思考：阿里云出海的时机选择值得关注——全球 AI 市场正从模型竞赛转向应用落地，Qwen Cloud 不是去跟 GPT 拼模型能力，而是去提供完整的 Agent 基础设施。 OpenRouter完成1.13亿美元B轮融资事实：AI 模型路由平台 OpenRouter 完成 1.13 亿美元 B 轮融资。OpenRouter 为开发者提供统一 API 接口访问多种 AI 大模型。思考：模型碎片化加剧是确定性趋势——每个场景都有最优模型，但没人想维护 20 个 API。OpenRouter 做的是 AI 时代的"CDN 层"，随着模型数量增长，聚合层的战略价值只会上升。 Tesla FSD欺诈诉讼在北京首次开庭，10名中国车主索赔583万元事实：北京法院就特斯拉"完全自动驾驶"消费者欺诈案举行首次听证，10 名车主索赔超 395 万元。原告称特斯拉销售人员和马斯克曾承诺 FSD 即将实现，但 HW3.0 车型被排除在外。中国或有超 100 万辆 HW3 车辆受影响。思考：FSD 诉讼在中国开庭是一个标志性事件。HW3 车主的集体诉讼如果成立，三倍赔偿将是一笔巨款。更深层的意义在于：AI 产品的"过度承诺"正在面临法律后果。 ClickUp裁员22%用AI Agent替代员工事实：项目管理公司 ClickUp 裁员 22%，CEO 承认用 AI 代理替代部分岗位。Box 创始人称之为"AI 精神病"。思考：用 AI 替代 22% 的员工，这是一个信号——不是未来的趋势，是正在发生的事实。但 Box 创始人的批评也值得思考：如果裁掉的岗位效率不如 AI，那是进步；如果只是为了裁员而裁员，那就是"AI 精神病"。 Visa投资Replit推动AI Agent支付事实：Visa 投资在线编程平台 Replit，合作推进 Agentic Payments——让 AI 代理自主完成支付操作。思考：当 Visa 开始布局 AI Agent 支付，说明支付行业已认真对待"AI 代理自主消费"这个场景。这不仅是技术问题，更是身份验证、授权和风控体系的全面重构。 🟣 具身智能上海发布格物具身AI仿真平台，推动人形机器人国际标准事实：国家地方共建人形机器人创新中心在上海发布格物具身 AI 仿真平台，通用强化学习框架支持 100+ 种机器人训练。上海联合龙头企业推动 ISO/TC299 人形机器人分技术委员会建设，争夺国际标准话语权。思考：支持 100+ 种机器人训练的通用框架，本质是做人形机器人领域的"操作系统"。而推动国际标准委员会建设，说明中国不再满足于跟随，要在规则制定层面取得主动权。世界智能博览会2026在天津开幕，具身AI成主角事实：第八届世界智能博览会于 5 月 29 日在天津开幕，超 700 家展商参展，13 万平米展区涵盖具身智能等七大板块。宇树科技人形机器人演示拳击，帕西尼触觉机器人展示抓取能力。思考：从"AI 聊天"到"具身智能"成为博览会主角，说明行业共识已从纯软件转向物理世界。宇树拳击和帕西尼触觉——运动能力和感知能力，正是具身智能的两大核心。智元自研世界模型GE 2.0登顶WorldArena榜单事实：智元 AGIBOT 宣布其自研世界模型 GE 2.0 登顶 WorldArena Track1 赛道，仅用 20 亿参数击败英伟达 DreamDojo 等超大参数模型夺冠。思考：20 亿参数打败超大模型，这是"效率革命"的最佳注脚。世界模型是具身智能的核心基础设施——机器人需要在虚拟世界中学会行动，模型效率直接决定训练成本和迭代速度。 🟡 AI 工具与开源 microsoft/agent-governance-toolkit — AI Agent治理工具包事实：微软发布 AI Agent 治理工具包，覆盖 OWASP Agentic Top 10 全部 10 项安全风险，周增 1463 Star。思考：当微软开始做 Agent 安全治理工具包，说明 Agent 已从实验走向生产。OWASP Agentic Top 10 的覆盖意味着这是一套企业级安全合规基础设施。 OpenBMB/VoxCPM — 无Tokenizer多语言语音生成模型事实：清华 OpenBMB 团队推出完全抛弃传统 Tokenizer 架构的多语言语音生成模型，支持创意语音设计和高保真语音克隆。思考：抛弃 Tokenizer 是一次大胆的架构选择。传统语音合成受限于 Token 化的信息损失，直接建模连续信号可能在语音自然度上实现质的突破。 revfactory/harness — 元技能框架，自动生成Agent团队事实：能自动设计领域专属的 Agent 团队、定义专业化 Agent 角色并生成它们使用的技能。本质上是 Agent 编排的上一层抽象。思考：从写单个 Agent 到自动生成一整套协作 Agent 系统，这是 Agent 工程的范式升级。如果"Agent 工厂"能自动生成"Agent 工厂"，递归自进化的可能性就会出现。 🔧 AI 基础设施全国首个绿色算力全栈AI平台在呼和浩特上线事实：全国首个绿色算力全栈 AI 平台在呼和浩特正式上线，集成算力调度交易、智能模型调用、词元交易结算等功能，兼容国产芯片与主流算力架构。思考：绿色算力 + 全栈 AI 平台 = 算力的"电力化"。当算力像电力一样可以交易、调度、结算，AI 应用的成本结构将发生根本变化。北京太空智算研究院成立，计划2028年前发射试验星事实：由京东方、银河航天、蓝箭航天等企业联合成立，围绕星载算力芯片、星间激光通信攻关，目标天地一体化智算网。思考：太空计算是 AI 基础设施的终极前沿——延迟更低、覆盖更广、不受地面灾害影响。2028 年发射试验星的时间线说明这不是概念，是工程。 📌 今日核心洞察 Agent 经济进入基础设施阶段：Visa 投资 Replit 做 Agent 支付、微软发布 Agent 治理工具包、火山引擎推出 Agent Plan——三条独立线索指向同一个结论：AI Agent 不再是实验项目，正在快速获得支付、安全、平台级的基础设施支撑。 ...