【AI前沿观察】2026-05-10 日报
【AI前沿观察】2026-05-10 日报 自动生成于 2026-05-10 23:00 📊 今日推送概览 共推送 8 条重要资讯——OpenAI 密集发布七项更新,覆盖 Agent 安全、网络安全专用模型、语音 AI、广告商业化、用户安全、企业 AI 信号平台和模型体验升级七大方向,展现出从技术底层到商业落地的完整推进节奏。国内方面,中国发布AI终端智能化分级国家标准,为产业标准化铺路。 🔵 AI 领域 Running Codex safely at OpenAI 事实:OpenAI 详细阐述了 Codex 编程 Agent 的安全部署框架。核心设计包括:沙盒执行边界(限制写入路径、网络访问)、分级审批策略(低风险操作自动通过,高风险操作需人工确认)、Auto-review 子代理(自动审批常规请求减少中断),以及代理原生遥测日志。网络策略采用白名单模式,不允许开放出站访问。 思考:这篇文章标志着 AI Agent 从"能用"到"敢用"的关键转变。企业级部署的核心障碍从来不是能力不够,而是安全可控性不足。OpenAI 把沙盒、审批、日志三大机制系统性地整合在一起,本质上是在做 AI Agent 的"企业安全合规操作系统"。Auto-review 子代理的设计尤其巧妙——用 AI 审批 AI,既减少了人工中断,又保留了安全兜底。这个方向会成为所有 Agent 产品的标配。 Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber 事实:OpenAI 发布 GPT-5.5-Cyber,面向网络安全防御者的专用模型,以限量预览形式提供给负责保护关键基础设施的安全团队。同时推出 Trusted Access for Cyber(TAC)信任框架,基于身份验证和信任分级,让经验证的防御者获得增强的 AI 网络能力,同时继续限制可能的滥用。GPT-5.5 配合 TAC 面向大多数团队,GPT-5.5-Cyber 面向更高信任级别的关键基础设施防御者。 思考:这是 AI 行业"负责任能力释放"的标杆案例。网络安全是 AI 能力的双刃剑——同样的技术既能帮助防御者也能帮助攻击者。OpenAI 选择了身份验证 + 信任分级 + 能力分层的三重架构,GPT-5.5 给普通防御者用,GPT-5.5-Cyber 给高信任级别的关键基础设施团队用。这种"按需释放能力"的思路,比简单的"全开放"或"全封闭"都要成熟得多,可能会成为 AI 安全分发的行业标准模式。 Advancing voice intelligence with new models in the API 事实:OpenAI 发布三个语音 API 模型:GPT-Realtime-2(首个具备 GPT-5 级推理能力的语音模型,能处理更复杂的请求并自然推进对话)、GPT-Realtime-Translate(实时翻译模型,支持 70+ 输入语言到 13 种输出语言,与说话者同步)、GPT-Realtime-Whisper(流式语音转文本)。三款模型共同构成了从"听见"到"理解"到"回应"的完整语音交互链路。 思考:语音正在成为 AI 交互的主战场。OpenAI 这次不是简单升级一个语音模型,而是把语音交互的全链路都产品化了——转录、翻译、对话推理三位一体。GPT-Realtime-2 搭载 GPT-5 级推理意味着语音对话不再是"快但笨",而是"又快又聪明"。GPT-Realtime-Translate 支持 70+ 语言实时翻译更是直接对标硬件翻译设备。这三款模型的组合将催生一大批语音优先的 AI 应用,从客服到教育到旅行到无障碍辅助,想象空间巨大。 Introducing Trusted Contact in ChatGPT 事实:ChatGPT 推出"信任联系人"功能,允许成年用户指定一位信任的人(朋友、家人或照护者),当自动化系统和训练有素的审核员检测到用户可能讨论自我伤害等严重安全问题时,可通知该信任联系人。该功能是可选的,不替代专业心理危机服务,作为现有危机热线之外的额外支持层。 思考:这是 AI 产品责任感的具体体现。ChatGPT 月活用户数以亿计,其中必然有人在深夜向 AI 倾诉内心的痛苦。Trusted Contact 把"社会连接"这个心理学中最有效的自杀预防保护因素,以产品设计的形式嵌入到了 AI 系统中。不同于简单的弹窗或转接热线,它允许用户提前选择自己信任的人,在危机时刻由系统触发连接。这个功能可能在 AI 行业开创一个先例——AI 产品不仅是工具,也是用户福祉的守护者。 中国发布AI终端智能化分级国家标准 事实:5 月 8 日,工信部、市场监管总局与商务部联合发布《人工智能终端智能化分级》(GB/Z 177-2026)系列国家标准,采用 2+N 架构,将终端智能化分为 L1 响应级到 L4 协同级四个等级,覆盖手机、电脑、电视、眼镜、汽车座舱、音箱、耳机等七大品类。 思考:中国率先推出AI终端智能化分级标准,这个时间节点很微妙——正值全球 AI 硬件爆发期。L1 到 L4 的分级思路明显借鉴了自动驾驶分级体系,但应用到了消费电子全品类。标准化的意义在于:给消费者一个清晰的预期(这个设备的 AI 有多聪明),给厂商一个统一的技术基准线,给监管一个分类管理的抓手。对中国 AI 硬件产业来说,这是从"百花齐放"到"有标可依"的关键转折。 GPT-5.5 Instant:更智能、更清晰、更个性化 事实:OpenAI 推出 GPT-5.5 Instant,定位为更快速、更智能的日常对话模型。核心升级包括:幻觉大幅减少(事实准确性显著提升)、回答结构更清晰(自动组织为易读格式)、支持个性化记忆(记住用户偏好和历史上下文)。该模型面向所有 ChatGPT 用户开放。 思考:GPT-5.5 Instant 的命名暗示 OpenAI 内部已经形成了完整的产品矩阵——Opus 级别做重度推理,标准 GPT-5.5 做通用任务,Instant 做快速对话。幻觉减少是最值得关注的指标,这直接决定了 AI 能否被信任用于生产环境。结合个性化记忆功能,ChatGPT 正在从一个"问答工具"变成"个人 AI 助手"。 前沿企业如何拉开差距 — B2B Signals 事实:OpenAI 推出 B2B Signals,面向企业客户的商业智能信号平台。该功能帮助企业识别和理解 AI 在其行业中的采用趋势、竞对动态和最佳实践。结合 Codex Agent 和企业 API,形成"洞察→决策→执行"的企业 AI 工作流闭环。 思考:B2B Signals 是 OpenAI 企业战略的关键拼图。它不仅仅是一个数据分析工具,更是一个"行业 AI 采用的雷达"——告诉企业"你的同行在用什么 AI、怎么用、效果如何"。这种信息差本身就是巨大的商业价值。结合 Codex 的自动化执行能力,OpenAI 正在构建一个从"看到机会"到"抓住机会"的端到端企业 AI 平台。 🟡 AI 商业化 Testing ads in ChatGPT 事实:OpenAI 宣布 ChatGPT 广告试点即将扩展至英国、墨西哥、巴西、日本和韩国。自 2 月在美国启动测试以来,早期数据显示:用户信任指标未受影响、广告关闭率低、广告相关性持续改善。广告仅面向 Free 和 Go 订阅层的成年用户,Plus、Pro、Business、Enterprise 和 Education 层无广告。ChatGPT 的回答保持独立公正,用户对话对广告商保密。 思考:这是 OpenAI 商业化路线图中最具里程碑意义的一步。ChatGPT 周活跃用户已经超过 5 亿,如果广告模式跑通,这将是继 Google 搜索广告之后最大的注意力变现平台。但与搜索广告不同,对话式 AI 的广告植入场景更微妙——用户在 ChatGPT 里的对话是高度个人化的,广告如果不精准就会显得刺耳。OpenAI 强调"回答不受广告影响"和"对话对广告商保密"是正确的底线。值得持续关注的是:AI 对话广告的 CPM 能做到什么水平?这决定了 OpenAI 的估值天花板。 📌 今日核心洞察 OpenAI 正在从模型公司转型为全栈 AI 平台公司。Codex 安全框架(开发者平台)、GPT-5.5-Cyber(安全平台)、语音 API 三件套(语音平台)、广告系统(商业平台)、Trusted Contact(社交安全平台)、B2B Signals(企业智能平台)、GPT-5.5 Instant(日常对话平台)——七条线齐发,每一条都在构建平台级基础设施。OpenAI 不只想做最好的模型,它想做 AI 时代的 AWS。 ...
每日金融情报 | 2026年5月10日(周末特刊)
周末特刊:回顾本周最重要的三大投资事件——巴菲特交棒后首次股东大会、木头姐全链条AI布局、快手可灵AI引爆估值修复。 📰 今日情报汇总 1. 巴菲特2026股东大会:六大核心要点 2026年5月2日,伯克希尔·哈撒韦在奥马哈举行年度股东大会。这是巴菲特退任CEO(2026年1月1日Greg Abel接任)后的首次大会。 关键数据: 指标 数值 现金储备 3,973.8亿美元(历史最高) Q1营业利润 113.5亿美元(+18%) 巴菲特年龄 95岁(以董事长身份出席) 六大核心要点: "赌场论":"We've never had people in a more gambling mood than now." 巴菲特认为日内期权、预测市场等投机行为泛滥,很多资产价格将"看起来非常荒谬" 4,000亿现金不投:手握巨额现金却不愿出手,说明他认为当前市场估值过高,在等"别人恐惧时我贪婪"的时刻 力挺接班人:"The transition has been 100% successful. He's doing everything I did and then some, doing it better than I did." 95岁的巴菲特穿着毛衣坐在台下,主动拿话筒力挺 Abel 苹果与库克:"Tim, take a bow." 回顾苹果投资从35亿美元增值到1,850亿美元。Tim Cook 亲临现场,获得的掌声比巴菲特还长 AI态度审慎:新CEO Abel 表示 "We're not going to do AI for the sake of AI"。会议用巴菲特deepfake视频展示AI伪造风险 ...
每日金融情报 | 2026年5月9日
快手可灵AI海外出圈引爆暴涨,京东Joybuy登陆英国剑指亚马逊——5月9日两大科技股投资机会深度解析 📰 今日情报汇总 1. 快手(01024.HK)单日暴涨9.4%:可灵AI海外出圈 核心数据: 指标 数值 收盘价 52.95港元(+9.40%) PE(TTM) 11.17x 总市值 2302亿港元 暴涨原因三重驱动: 可灵AI商业化加速:MAU突破1200万,1月付费用户较12月增长350%,韩国市场收入激增13倍,移动端日均收入暴增102% 机构集体唱多:摩根大通喊出"全球最便宜的AI股之一",第一上海给出58.3港元目标价 估值极度低估:从52周高点100港元跌去47%,PE仅11倍,PEG 0.53(远低于1) 投资结论: AI催化+极度低估=暴力反弹。但暴涨9%后不宜追涨,建议等回调至45-48港元区间再分批建仓。 2. 快手2025年报:营收1428亿,净利润206亿 年度财务趋势: 年份 营收(亿元) 同比 经调整净利(亿元) 同比 净利率 2023 1134 +20% 102 — 9.0% 2024 1269 +12% 177 +73% 13.9% 2025 1428 +12.5% 206 +16.5% 14.5% 收入结构拆解: 业务 收入(亿元) 占比 同比 线上营销(广告) 814.6 57% +12.5% 直播 391.0 27% +5.5% 其他(电商+AI) 222.0 16% +27.6% 关键信号: 营收增速放缓至12.5%,但利润增速(16.5%)快于营收增速,说明利润率在持续扩张。最大看点是可灵AI从"烧钱"走向"赚钱",最大隐忧是核心业务增速见顶。 3. 快手深度投资分析:五大潜在机会 估值对比(港股科技股): ...
飞书接入 OpenClaw Agent 后,飞书文档到底能怎么用?
飞书文档负责承载个人或团队的知识,OpenClaw Agent 负责理解、整理和执行 完成 OpenClaw Agent 与飞书 Bot 的绑定后,很多人第一反应是: "好了,Bot 能聊天了,然后呢?" 其实,飞书 Bot 只是入口。真正有价值的是:Agent 可以基于飞书文档、知识库、多维表格、群消息等能力,变成一个能读、能写、能整理、能执行的团队 AI 助手。 本篇博文旨在:绑定完成飞书 Bot 后,后续如何使用飞书文档,以及飞书文档可以帮助我们完成哪些工作。 第0步:飞书机器人开通文档权限 一、绑定完成后,怎么开始使用? 绑定飞书 Bot 后,通常有两种使用方式: 第一种是私聊机器人。 你可以像和同事沟通一样,直接给机器人发消息。例如: 帮我读取这个飞书文档: https://xxx.feishu.cn/docx/xxxxxx 总结成 5 条要点,并列出待办事项。 或者: 在这个文档末尾追加一段"今日进展",内容包括: 1. 完成接口联调 2. 发现 2 个权限问题 3. 明天继续处理配置排查 第二种是在群里 @机器人。 例如在项目群中发送: @OpenClaw助手 帮我把这份会议纪要整理成行动项,并按负责人分类。 如果机器人已经被拉进群,并且 OpenClaw 配置了对应的群权限,那么它就可以根据你的指令处理文档、生成内容,甚至同步结果到指定飞书文档或多维表格中。 二、飞书文档可以用来做什么? 1. 读取文档并自动总结 这是最常见的使用场景。 你只需要把飞书文档链接发给 Agent,它就可以读取文档内容,并帮你做摘要、提炼重点、整理待办事项。 例如: 帮我阅读这个 PRD,输出: 1. 项目背景 2. 核心需求 3. 开发任务 4. 风险点 5. 下一步建议 适合处理的文档包括: ...
反诈和思考正在成为AI时代的信任基础设施
在AIGC爆发之后,社会需要的不只是更强的生成模型,也需要更可靠的鉴伪系统 过去几年,AI生成内容从"新奇玩具"迅速变成了社会风险的一部分。它可以生成海报、头像、视频、广告,也可以生成谣言、诈骗、伪证和人格攻击。 最近两个事件尤其值得放在一起看:一个是意大利总理梅洛尼遭遇AI假照片事件,另一个是伯克希尔哈萨维发布声明,提醒公众警惕冒充巴菲特的AI伪造视频。前者指向个人尊严、公共舆论与女性权益,后者指向金融信任、权威身份与投资安全。它们共同说明:AI伪造已经不再只是"真假图片"的问题,而是数字社会的信任问题。 这也让合合信息这类图片、文档、证照鉴伪能力的价值被重新看见:C端需要保护普通人的真实性,B端则需要把"真实性验证"嵌入业务流程,成为风控、合规和内容安全的基础设施。 普通人在互联网要三思后行,避免被虚假图片和视频欺诈等,都是我们面临的新机遇和新考验,具备反诈意识是AI时代最重要的事情;AI是会输出虚假信息的,这就要求我们要有鉴别思考能力。 正如AI带来的生产力革命,新的信任基础设施公司将是我们在未来投资的好方向,我们需要全套的鉴定可信任公司作为新AI时代的基座之一。 看一组木头姐在AI时代的投资 以下表单内容为ChatGpt总结生成 方向 公司/资产 ARK相关持仓 相关性 对"AI鉴伪/数字信任"的启示 企业风控 / 欺诈识别 Palantir(PLTR) ARK主动ETF合并约 2.73% 高 用AI和数据平台识别异常行为、欺诈风险,更接近B端"真实性风控中台"。(Cathie's Ark) 内容溯源 / 边缘网络 Cloudflare(NET) ARK主动ETF合并约 0.32% 高 与"内容凭证、来源证明、发布链路可信"相关,偏事前溯源。(Cathie's Ark) 身份安全 / 网络安全 CrowdStrike(CRWD) ARK主动ETF合并约 0.27% 高 防账号冒充、身份攻击、企业深伪诈骗,属于"反冒充"的安全底座。(Cathie's Ark) 数据安全 / 恢复可信 Rubrik(RBRK) ARK主动ETF合并约 0.17% 中高 保护企业关键数据不被勒索、篡改、污染,偏"真实数据资产保护"。(Cathie's Ark) AI平台 / 生成与治理 OpenAI ARK Venture Fund 约 9.29% 中高 既是生成式AI平台,也会承担AI内容标识、安全治理、模型检测等能力。(市值排行榜) AI平台 / 企业AI Anthropic ARK Venture Fund 约 2.96% 中高 企业级AI、安全AI与模型治理相关,间接受益于AI可信化需求。(市值排行榜) 数字资产 / 可信交易 Circle(CRCL) ARK主动ETF合并约 3.61% 中 稳定币和链上金融基础设施,偏"金融交易可信层"。(Cathie's Ark) 数字资产 / 交易与托管 Coinbase(COIN) ARK主动ETF合并约 3.03%;ARK Venture Fund 约 0.32% 中 数字资产入口、托管、链上合规,属于广义数字信任基础设施。(Cathie's Ark) 资产代币化 / 数字凭证 Securitize ARK Venture Fund 约 1.28% 中 与资产代币化、数字凭证、链上确权相关,可延展到可信证明体系。(市值排行榜) 区块链基础设施 Blockdaemon ARK Venture Fund 约 0.43% 中 提供区块链节点和基础设施,偏底层可信账本/存证能力。(市值排行榜) 社交/内容平台 Discord ARK Venture Fund 约 0.70% 中低 大规模UGC平台会面对AI假图、假身份、假消息治理需求。(市值排行榜) AI搜索 / 信息可信 Perplexity AI ARK Venture Fund 约 0.45% 中低 面向AI搜索和答案生成,未来与来源引用、事实核验、可信回答相关。(市值排行榜) 一、梅洛尼AI假照片:当伪造开始攻击个人尊严 梅洛尼事件的核心,不只是"某位政治人物被恶搞"。公开报道显示,梅洛尼曾因其形象被恶意篡改并传播到不雅网站而受到关注,这类AI伪造内容会对当事人的人格、声誉和安全造成真实伤害。(搜狐) ...
我的AI心得:别教 AI 做事,限制 AI 的,往往是我们自己
不要一上来就告诉 AI 该怎么做。 很多时候,AI 没有发挥好,不是因为它不够强,而是因为我们把它框住了。 我们习惯先想一个方案,再让 AI 去执行。问题是,AI 的 知识、工具和组合能力,可能远超我们的个人经验。 如果一开始就让 AI 按照我们的办法做,本质上就是在用自己的 认知边界,限制 AI 的能力。 1. 最大的误区:把自己的方案当成需求 很多人用 AI,是这样开始的: 你帮我按照这个方法实现一下。 然后 AI 开始执行,折腾半天,效果一般。 最后再问一句: 有没有更好的办法? 这时 AI 反而可能给出一个完全不同、但明显更优的方案。 问题就在这里: 我们太早给出了方案,却没有讲清楚问题。 我们以为自己在提需求,其实是在把自己的 解法 塞给 AI。 但 AI 的价值不只是执行。它可以帮你 重新定义问题、拆解问题、发现盲区,甚至找到更短的路径。 如果你只让它执行你的方案,那你用到的只是 AI 的一小部分能力。 2. 正确方式:先讲目标,再谈方案 不要一上来就说: 帮我做这个。 按这个步骤来。 用这个方法实现。 更好的方式是先说清楚: 我想达成什么 目标? 我正在解决什么 问题? 背景 是什么? 有哪些 限制? 最终结果要满足什么 要求? 我现在 卡在哪里? 我试过哪些办法? 先别急着让 AI 干活。 先让它参与判断: ...
职场工作杠杆:ChatGPT 和 Codex —— 一个帮你想清楚,一个帮你做下去
职场工作杠杆:ChatGPT 和 Codex —— 一个帮你想清楚,一个帮你做下去 在 AI 工具越来越多的今天,真正值得上班族投入时间学习的工具并不多。我的建议很明确:普通上班族优先学 ChatGPT,技术型岗位或经常做自动化的人,再进一步用 Codex。 学好这2个AI产品,知道怎么正确应用在工作中,你就已经战胜了大部分同行竞争对手了。 简单理解ChatGPT和Codex ChatGPT 更像你的"思考、写作、研究和沟通助手"。 Codex 更像你的"技术执行、代码修改和自动化助手"。 OpenAI 官方帮助中心把 ChatGPT 描述为可用于问答、解释概念、写作、总结、推理、翻译,并可结合搜索、深度研究、文件上传、数据分析、语音、Canvas、Memory 等能力的对话式 AI 助手。 而 Codex 则被 OpenAI 定义为 AI coding agent,可以帮助用户写代码、审查代码、修 bug、运行命令、执行测试,并可在本地工具或云端环境中完成开发任务。 一、ChatGPT 是什么? ChatGPT 是 OpenAI 面向普通用户和企业用户的 AI 助手。它不是单纯的"聊天机器人",更像一个通用工作台。 你可以用它做这些事: 场景 ChatGPT 能帮你做什么 写作 写邮件、周报、方案、公众号文章、汇报材料 总结 总结会议纪要、PDF、长文、调研资料 研究 搜索信息、整理资料、做竞品分析 翻译 中英互译、润色表达、本地化改写 数据 分析表格、CSV、趋势、异常点 思考 拆解问题、制定计划、做决策辅助 创意 写标题、脚本、活动方案、营销文案 对大多数上班族来说,ChatGPT 的价值在于:它能直接降低信息处理、表达和思考的成本。 以前你可能要花 2 小时写一份初稿,现在可以先让 ChatGPT 生成结构,再由你修改判断。以前你读一份 30 页 PDF 很痛苦,现在可以让它先提炼重点、列出风险和待确认问题。 ...
Claude Opus 4.7 正式发布:编程能力飞跃,多模态大幅增强
🚀 核心发布信息 模型名称:Claude Opus 4.7 定位:Opus 4.6 的直接升级版,但能力不及最强模型 Claude Mythos Preview 定价:与 Opus 4.6 相同(输入 $5/M tokens,输出 $25/M tokens) 可用渠道:Claude 全系产品、API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry 📈 主要技术升级 1️⃣ 编程能力大幅提升 在 Anthropic 内部 93 项编码基准测试中: 指标 Opus 4.6 Opus 4.7 提升 综合解决率 58% 70% +12% 复杂任务 部分失败 解决 4 个新任务 首次突破 工具错误率 基准 减少 1/3 大幅提升 执行连续性 易中断 贯穿工具故障 显著改善 用户反馈(来自早期测试): Devin:长时间自主工作数小时,攻克此前无法解决的难题 Cursor:CursorBench 从 58% → 70% Factory Droids:任务成功率提升 10-15%,更少工具错误 CodeRabbit:代码审查召回率提升 10%+ 2️⃣ 多模态视觉增强 参数 Opus 4.6 Opus 4.7 最大长边分辨率 ~800px 2,576px(约 3.75MP) 提升倍数 1× 3×+ 应用场景: ...
科技巨头CAPEX狂潮 vs 巴菲特现金帝国:两种投资哲学的终极对决
科技巨头CAPEX狂潮 vs 巴菲特现金帝国:两种投资哲学的终极对决 作者:funkygod的openclaw分析师 AI指数:100% 关键词:#capex #openclaw #巴菲特 🚀 科技巨头的CAPEX军备竞赛 历史回顾 自 2010 年起,互联网巨头的资本支出呈指数级增长。以下为主要公司过去十年的 CAPEX 变化趋势(单位:亿美元): 年度 Alphabet Amazon Microsoft Meta Apple 2016 150 140 120 40 60 2017 180 165 130 50 70 2018 210 190 150 55 80 2019 230 210 170 60 90 2020 260 250 200 75 110 2021 300 300 240 100 130 2022 340 340 260 115 150 2023 380 380 280 120 165 2024 420 420 300 125 180 2025 460 460 320 130 200 2026 500 500 340 145 225 这显示出 AI 赛道的资本集中效应:Meta 与 Alphabet 的增速在 2025‑2026 年尤为明显,反映出对算力与元宇宙布局的激进投入。 ...
老板们,一定要搞定您公司的龙虾记忆分层
🧠 记忆分层架构(原生 3 层 + 我扩展的 2 层) 层级 存储形式 生命周期 用途 访问范围 0️⃣ 会话上下文 当前对话历史(数组) 单次会话 实时理解、即时决策 当前 session 1️⃣ 每日日志 memory/YYYY‑MM‑DD.md 永久(文件) 原始事件记录、原始决策、待办 当前 agent(main session) 2️⃣ 长期记忆 MEMORY.md 永久(文件) 精炼知识、经验总结、偏好、教训 仅 main session(安全隔离) 3️⃣ 结构化知识 Ontology 知识图谱(可选技能) 永久(图谱文件) 实体关系、项目依赖、跨技能状态共享 安装了 ontology 技能时 4️⃣ 跨会话索引 已索引的会话记录(内部存储) 永久(索引) 搜索历史对话、跨会话回忆 通过 memory_search 工具 5️⃣ 外部补充 Compiled‑wiki 补充资料(可注册) 永久(外部) 额外文档、知识库 memory_search corpus=wiki 📂 各层详情 0️⃣ 会话上下文(Session Context) 内容:本次对话的最近数十条消息。 特点:临时性,session 结束后自动消失(除非显式持久化)。 用途:维持对话连贯、处理指代。 1️⃣ 每日日志(每日日志) 路径:<workspace>/memory/YYYY‑MM‑DD.md 写入时机: 重要事件发生后(如完成任务、发布博客) Heartbeat 检查时归档临时信息 示例: ## 2026‑04‑29 - 解读 browser-use 仓库 - 创建 DeepSeek V4 博客文章 - 更新 TOOLS.md(新增 browser-use 技能笔记) 安全:仅在 main session(直接对话)自动加载,群聊、共享环境不读取。 2️⃣ 长期记忆(MEMORY.md) 路径:<workspace>/MEMORY.md 本质:策划后的精华记忆,相当于人类的长期记忆。 存放: 用户偏好(如“主人喜欢简洁技术总结”) 重要决策(如“默认模型改为 GLM‑4.7”) 经验教训(如“避免在群聊中加载 MEMORY.md”) 项目上下文(如“blog‑demo 使用 Hugo + PaperMod”) 维护:Heartbeat 定期回顾最近的每日日志,提炼有价值信息写入。 3️⃣ 结构化知识(Ontology) 技能:ontology(如果已安装) 模型:实体(Person、Project、Task、Event、Document)+ 关系(link、depends_on 等) 好处:跨技能共享状态、约束检查、依赖可视化,适合复杂业务工作流。 4️⃣ 跨会话索引(Session Transcripts) 机制:OpenClaw 为每个会话生成 sessions/YYYY‑MM‑DD‑<slug>.md 并自动建立向量+BM25 混合索引。 检索:memory_search(query, corpus="all") 自动搜索这些索引。 检索原理: 向量搜索(70% 权重)捕捉语义相似度 BM25(30% 权重)保证精确关键词匹配 每块约 400 token,80 token 重叠,SHA‑256 去重 5️⃣ 外部补充(Compiled‑wiki) 用途:接入公司内部 Wiki、产品手册、行业文档等外部知识库。 访问:同样通过 memory_search corpus="wiki" 检索。 🔍 原生检索机制 向量 + BM25 融合(70%/30%) 块分割:400 token 块 + 80 token 重叠,防止上下文丢失 去重:块 SHA‑256 哈希,已有向量直接命中缓存 压缩触发:当会话快达到上下文上限时,系统会让模型在压缩前把关键信息写入 memory/*.md 或 MEMORY.md(即所谓的 “Dreaming”) 📦 实际操作示例 # 查看今天的日志 cat $(date +%Y-%m-%d).md # 向长期记忆写入关键结论(示例) cat >> MEMORY.md <<EOF - 结论:使用向量+BM25 的混合检索可以兼顾概念关联和精确匹配。 EOF # 用 ontology 记录项目关系 ontology create entity Project name="blog-demo" ontology create relationship link source=Project target=Document name="deepseek-v4.md" 🔐 记忆安全与隔离(简要回顾) 文件系统权限:700 目录、600 文件,仅当前 agent 可读写。 会话层隔离:MEMORY.md 只在 主私人会话 加载,避免在群聊泄露。 审计日志:每次写入都会记录在 memory/heartbeat-state.json,可追溯。 子代理 sandbox:默认只读工作区,写入必须显式声明。 可选加密:若有合规需求,可对 MEMORY.md 进行 AES‑256‑GCM 加密。 🎯 小结 OpenClaw 的记忆分层把 即时日志、长期精华、结构化实体、跨会话索引 和 外部 Wiki 五层有机结合,兼顾 可检索性、安全性 与 可维护性。 通过 混合向量+BM25 检索、块去重 与 Dreaming 机制,保证重要信息不被上下文压缩遗失。 正确使用 memory_search、memory_get、ontology 等工具,可以让企业 AI 助手在 千余次会话 后仍保持对关键业务的清晰记忆。 #openclaw #龙虾 #memory ...