工具 | FunkyGod - 投资与AI实践笔记

从 OpenClaw 切到 Hermes：一篇面向 AI Agent 日常使用的 Hermes 实战教程

从 OpenClaw 切到 Hermes：一篇面向 AI Agent 日常使用的 Hermes 实战教程最近我把自己的 AI Agent 工作流从 OpenClaw 切到了 Hermes。切换之后最大的感受是：OpenClaw 更像一个 Agent 控制台，而 Hermes 更像一个会越用越顺手的个人自动化运行时。如果你之前用 OpenClaw 的重点是多渠道接入、Agent 编排、团队协作，那么 Hermes 一开始可能会显得更"轻"。但如果你的核心需求是：每天让 Agent 帮你处理重复任务、跑命令、查资料、写代码、做总结、记住上下文、沉淀技能，那么 Hermes 的体验会更贴近个人长期使用。 Hermes Agent 是 Nous Research 推出的自改进型 AI Agent，官方文档把它描述为带有内置学习循环的 Agent：它可以从经验中创建 skills，在使用过程中改进 skills，并通过记忆和历史会话搜索来形成跨会话上下文。(Hermes Agent) 一、Hermes 适合什么人？我建议把 Hermes 理解成一个「个人 AI 工具执行器」，而不是单纯聊天机器人。它比较适合这些场景：个人开发者日常工作流比如读项目、改代码、写脚本、查日志、生成 PR 描述、总结报错原因。长期重复任务自动化比如每天生成日报、定时检查服务、每周整理资料、定期做项目审计。Hermes 官方 GitHub 页面提到它支持内置 cron scheduler，可以把定时任务投递到不同平台。(GitHub) ...

受够了 OpenClaw 的失忆，我本周爱上了 Hermes Agent

受够了 OpenClaw 的失忆，我本周爱上了 Hermes Agent 大多数人以为 Hermes 只是一个 AI 聊天框架。但它实际上是一个可长期运行、多角色协作、多入口接入的 Agent Runtime，已经非常接近真正意义上的 AI Operating System。 Hermes Agent 在不到三个月内突破 14 万 GitHub Star，并根据 OpenRouter 的数据成为目前全球使用量最大的 Agent。在折腾了 2 个月，受够了 OpenClaw 的失忆后，我尝试用业界火热的 Hermes Agent，效果居然出奇的好，因此写下这篇安利文章。关键词：#openclaw #Hermes 能力标签：多Agent协作 · 长期记忆隔离 · 子代理并行 · 多用户隔离 · 任务编排 · Agent Runtime 为什么这么火？三个根本原因 1. 解决了 Agent 领域最痛的问题——失忆 Hermes 要解决的正是这个问题，不是用 prompt 技巧，而是在架构层面内置了一个闭环学习机制——运行时间越长，它就越了解你。 2. 自我进化的技能系统 Hermes 有四个核心差异化能力，其中最突出的是"自进化技能"——它会自己编写并优化 skill 文档。每当 Hermes 解决一个困难问题，它就会写下一份可复用的 skill 文档，之后永远不会忘记这个解法。这些 skill 可搜索、可共享，并兼容 agentskills.io 开放标准。 ...

数字生产实践Codex：AI 编程助手进化到桌面办公智能体

数字生产实践Codex：AI 编程助手进化到桌面办公智能体 AI 编程工具正在从代码生成器，进化为能够操作环境、验证结果、持续协作的软件开发智能体。在过去，很多人对 AI 编程工具的理解还停留在"帮我补全代码""生成一段函数""解释一段报错"。但 OpenAI 最新版 Codex 的能力已经不止于此。根据 OpenAI 官方对新版 Codex 的介绍，Codex 正在从一个单纯的代码助手，升级为贯穿软件开发生命周期的智能协作伙伴。它不仅能写代码、理解代码库、处理 PR 评审，还开始具备两类更接近真实开发者工作方式的能力： Computer Use，也就是操作系统级控制能力；内置浏览器，也就是在 Codex 应用中直接打开、观察和操作网页的能力。这两项能力的出现，意味着 Codex 不再只是"回答怎么写代码"，而是开始进入真实开发环境，帮助开发者完成更完整的任务链路。一、Codex 正在从代码助手变成开发智能体传统 AI 编程工具的核心能力是生成代码。用户提出需求，AI 给出代码片段，开发者再自己复制、运行、调试和验证。而新版 Codex 的方向更接近开发智能体。所谓开发智能体，不只是会生成代码，而是能够围绕一个开发目标，主动完成多个连续动作：读取项目文件；理解代码结构；修改代码；运行终端命令；打开页面；复现问题；检查界面；验证修复结果；根据反馈继续调整。也就是说，Codex 的价值正在从"生成代码"扩展为"完成开发任务"。这背后最关键的变化，就是它开始具备操作电脑和观察网页的能力。二、什么是 Computer Use？ Computer Use 可以理解为一种让 AI 像人一样使用电脑界面的技术。它不是简单调用 API，也不是只在编辑器里生成文本，而是让模型通过屏幕画面理解当前环境，并通过鼠标、键盘等方式执行操作。它的基本能力包括：看屏幕：识别当前界面中的按钮、输入框、菜单、弹窗和错误提示；理解任务：根据用户目标判断下一步应该做什么；执行操作：点击、输入、滚动、切换窗口、打开应用；观察反馈：根据界面变化判断任务是否完成；持续迭代：如果没有完成，就继续调整下一步操作。可以用一句话概括： ...

Superpowers 14 个 Skills 全解读：AI 编程纪律框架的完整拆解

Superpowers 14 个 Skills 全解读：AI 编程纪律框架的完整拆解最核心的价值不是某个单独 skill，而是这条链路：需求澄清 → 设计确认 → 计划拆解 → 隔离开发 → TDD → review → 验证 → 收尾这条链路正好针对 AI coding 最常见的失败模式：过早实现、缺少测试、猜测修复、跳过验证、过早宣布成功。注意：要经常更新 skills 的代码版本和自己结合实际使用，将自己的经验和要求增加到 skills，以便更好的编程和业务准确性，最好是将自身业务的要求单独作为 skills 引入到编程工具里。 Superpowers 是一个给 AI 编程 Agent 的完整软件开发方法论，由一组可组合 skills 和初始指令组成。它的基本工作流是：先澄清需求、写设计、写实施计划、TDD 实现、代码审查、验证、最后合并/PR/清理。该不该装？三层判断层面判断技术层面不必须。没有它，AI coding agent 也能写代码。工程质量层面对复杂项目，强烈建议。它强制 TDD、审查、验证，能减少"AI 自信但没验证"的问题。 Superpowers 自身规则层面一旦安装并启用，它的 using-superpowers 明确要求：只要有 1% 可能适用，就必须先调用相关 skill；README 也说这些是 mandatory workflows, not suggestions。我的建议：重项目安装，轻任务选择性使用；团队协作/生产代码建议默认启用；纯探索、一次性原型可以不用或显式绕开。 1. using-superpowers — 入口规则这个 skill 不是某个开发动作，而是**"调度所有 skills 的总开关"**。它要求 agent 在任何任务开始前先判断是否有相关 skill；只要有一点可能适用，就要先调用 skill，而不是凭经验直接干。它还规定了优先级：用户明确指令最高，Superpowers skills 其次，默认系统行为最低。 ...

我用 Superpowers 治好了 AI 写代码的'急躁症'

我用 Superpowers 治好了 AI 写代码的"急躁症" 你有没有这种经历？跟 AI 说一句"帮我加个登录功能"，它三秒钟就开始生成代码了。你还没来得及说"我要 OAuth 不要密码登录"，它已经把整个 auth 模块写完了。跑一下，报错。让它修，改了三处引入两个新 bug。再改，需求理解全歪了。折腾一小时，还不如自己写。问题不在 AI 笨——现在的 Claude、GPT 编程能力已经很强了。问题是它太急了。还没搞清楚你要什么，就急着动手。没有设计，没有测试，没有验证，凭着"感觉"改代码，改完说一句"看起来没问题"就算完成。我最近发现了一个开源项目，专门治这个毛病。 Superpowers 是什么 Superpowers 是一个给 AI 编程 Agent 装的插件。它不改变模型能力，而是给 Agent 加了一套强制执行的开发流程。你可以把它理解为：一个严厉但好心的技术 Lead，站在 AI 后面盯着它—— "停，先搞清楚需求再写代码。" "计划呢？计划写好再动手。" "测试呢？测试先写，代码后写。" "代码审查过了吗？没过不许继续。" 它由 Jesse Vincent（Prime Radiant 公司）开发，目前版本 v5.1.0，MIT 协议。支持 Claude Code、Codex CLI、Gemini CLI、Cursor、GitHub Copilot CLI 等主流 AI 编程工具。实际用起来是什么体验装上 Superpowers 之后，你和 AI 的交互模式会完全不一样。我用一个实际场景走一遍。场景：让 AI 帮你做一个用户通知系统没有 Superpowers 时，对话通常是这样的：你：帮我做一个通知系统 AI：（立刻开始写代码）我创建了一个 NotificationService…… 你：等一下，我要邮件通知，不是站内信 AI：好的，我重新写…… 你：还需要支持批量发送 AI：我再加一个…… ...

OpenClaw 升级实战：我如何把 2026.5.7 平滑升级到生产环境（macOS + npm）

OpenClaw 升级实战：我如何把 2026.5.7 平滑升级到生产环境适用环境：OpenClaw 通过 npm -g 安装，Gateway 由 launchd 托管，配置目录在 ~/.openclaw。实测时间：2026-05-14，目标版本 2026.5.7。写作目的：不只想记录「怎么做」，更想把整个升级过程中我的思考、犹豫、判断写出来，方便有类似需求的朋友参考。前言：为什么要升级？事情是这样的。那天我像往常一样打开 Telegram，准备和我的 OpenClaw 助手聊几句，突然收到一条来自社区频道的推送——OpenClaw 新版 2026.5.7 发布了。看了一眼更新内容，我愣了一下： KV 缓存压缩比从 4:1 变成 1/128，内存占用直接降 90%？训练收敛速度提升 3-5 倍？缓存命中率从 70% 到 92%？单 token 延迟从 1.8s 砍到 0.7s？说实话，换做以前一些小版本更新，我可能就忽略掉了。但这几个数字太扎眼了。尤其是缓存命中率和响应延迟这两项，直接影响我每天的使用体验。我的 OpenClaw 跑了有一段时间了，配置、记忆、定时任务、消息通道都配齐了。说实话，换机器重装一次很麻烦，所以每次升级我都比较谨慎——备份做没做？Gateway 会不会崩？定时任务会不会丢？但这次数字太香了，我决定动手。动手之前，我给自己定了几条原则：先搞清楚现状：本地什么版本，npm 最新什么版本先备份，再动刀：万一出问题，要有退路升级完必须验收：Gateway 状态、定时任务、消息通道，一个都不能漏遇到问题不慌：npm 报错、launchctl 报错，都是有解法的整个过程下来，确实踩了几个坑，但也验证了一套可复用的流程。写这篇文章，一来是给自己留个记录，二来希望帮到有类似需求的朋友。第一部分：升级前，先搞清楚值不值得动手 1.1 新版本到底更新了什么？说实话，我不是一个「追新」的人。我的原则是：如果新版本没有解决我的痛点，或者新特性我用不上，那升级就是徒增风险。所以在决定升级之前，我把 2026.5.7 的 Release Notes 仔细看了一遍。 ...

AI Agent 时代，为什么我放弃 Markdown 全面转向 HTML

AI Agent 时代，为什么我放弃 Markdown 全面转向 HTML 原文作者：Thariq（@trq212），Claude Code 团队工程师原文发布于 2026 年 5 月 9 日背景 Markdown 已经成为 AI Agent 与我们沟通时的主流文件格式。它简洁、可移植，具备一定的富文本能力，并且便于编辑。Claude 甚至已经擅长在 Markdown 文件中用 ASCII 字符绘制图表。但随着 Agent 能力越来越强，我开始觉得 Markdown 成了一种束缚。 Markdown 的局限性信息密度低超过 100 行的 Markdown 文件读起来就很吃力。当 Claude 需要表达：表格数据设计系统（颜色、组件）图表和插图交互效果 Markdown 只能：画丑丑的 ASCII 图用 unicode 字符近似呈现颜色（如 🟣🟢🔴）贴截图或图片链接视觉体验差 Markdown 扁平化了一切。代码 diff、流程图、模块关系——这些空间信息在 Markdown 里全部被压成一维文字。当方案的复杂度超过一屏时，Markdown 从"文档"变成了"阅读障碍"。分享不便大多数浏览器不能原生渲染 Markdown 文件。你只能：作为邮件附件发送粘贴到 GitHub 评论里上传到某个平台（Notion、飞书等）而 HTML？上传到 S3 或任何静态托管，一个链接就能分享。 ...

我的AI模型使用情况分享：从云厂商到编程Agent的实战体验

我的AI模型使用情况分享首先，大多数国内云厂商和模型服务商的模型我都接入和使用过，以下是根据实际体验得出的算力服务上自测评价，排序靠前说明体验感和实际使用效果很好；我的模型体感（云厂商和模型商）主要以稳定性、模型质量、使用体验为主的主观描述，国外模型不在表单里，因为属于算力能力和模型能力双领先；排名平台我的推荐理由我的使用劣势感受 1 火山引擎 / 火山方舟我会把它作为线上生产环境的首选，尤其适合需要低延迟、高稳定性和持续调用的业务。我觉得它的优势主要集中在生产稳定性上，如果追求极限低价，可能不是最便宜的选择。 2 阿里云百炼我会把它作为企业级 AI 应用和多模型生态的主力平台，尤其适合需要工具链、Batch、长上下文和模型管理的场景。我觉得它的产品体系比较完整，但也相对复杂，上手和配置成本会比单一 API 平台高一些。 3 DeepSeek 官方我会把它作为低成本、高性价比调用 DeepSeek 模型的首选，适合大批量、成本敏感的任务。我在高峰期可能会担心它的稳定性和响应速度，所以不一定会把它单独作为核心生产依赖。 4 腾讯云我会把它作为腾讯云生态内项目的补充选择，尤其适合已经在腾讯云上部署业务的场景。我觉得它在价格和综合体验上不算最突出，如果没有腾讯云生态绑定，吸引力会弱一些。 5 硅基流动我会把它作为模型试验和多模型切换的平台，适合快速测试不同开源模型和低成本方案。我觉得它更适合测试和非实时任务，强实时生产场景下我会更谨慎。 6 MiniMax 官方我会在长上下文、多模态、语音或特定 MiniMax 模型能力上优先考虑它。我不会把它作为通用推理 API 的第一主力，因为平台综合稳定性和生态证据不如火山、阿里这类云厂商充分。 7 智谱 GLM 官方我会在中文场景、长上下文、工具调用和国产模型适配上考虑 GLM。我觉得它的模型能力有特色，但公开的第三方平台级压测资料相对不足，所以生产主力选择上我会保守一些。 8 天翼云息壤我会在政企、国产化、合规、央国企或电信体系项目里优先考虑它。我觉得它更偏政企交付和合规场景，作为个人开发者或互联网产品的主力 API，体验和灵活度可能不是最优，当前缺失缓存机制，成本很高且模型上下文窗口阉割和算力不足。我的主力模型 gpt + glm5.1 企业使用：火山放在线上实时调用、Agent 后端、需要稳定低延迟的任务；阿里放企业生态、Qwen、百炼工作流、Batch、长上下文和多模型兜底个人使用： Claude/Codex 更像"会干活的工程师" 或智谱的coding plans 政企客户：尤其是电信、政务、金融、央国企场景，息壤价值在合规、国产算力、专网和交付，但个人开发者不推荐国内模型模型自测排行 GLM5.1（推荐，中等难度编程或自主任务执行） DeepSeek v4（可以赶上GLM5.1） MiniMax 2.7（在复杂任务执行，效果欠佳，比如openclaw的agent自主任务） Seedance 2.0（推荐，视频质量还可以，够用） MiniMax 2.5 和 GLM5（仅适合简单任务）豆包 = 千问 > 元宝（网页使用推荐前2个）模型用量数据我的智谱AI，开通的是季度lite套餐，月度使用量截止到现在是31亿tokens； ...

飞书接入 OpenClaw Agent 后，飞书文档到底能怎么用？

飞书文档负责承载个人或团队的知识，OpenClaw Agent 负责理解、整理和执行完成 OpenClaw Agent 与飞书 Bot 的绑定后，很多人第一反应是： "好了，Bot 能聊天了，然后呢？" 其实，飞书 Bot 只是入口。真正有价值的是：Agent 可以基于飞书文档、知识库、多维表格、群消息等能力，变成一个能读、能写、能整理、能执行的团队 AI 助手。本篇博文旨在：绑定完成飞书 Bot 后，后续如何使用飞书文档，以及飞书文档可以帮助我们完成哪些工作。第0步：飞书机器人开通文档权限一、绑定完成后，怎么开始使用？绑定飞书 Bot 后，通常有两种使用方式：第一种是私聊机器人。你可以像和同事沟通一样，直接给机器人发消息。例如：帮我读取这个飞书文档： https://xxx.feishu.cn/docx/xxxxxx 总结成 5 条要点，并列出待办事项。或者：在这个文档末尾追加一段"今日进展"，内容包括： 1. 完成接口联调 2. 发现 2 个权限问题 3. 明天继续处理配置排查第二种是在群里 @机器人。例如在项目群中发送： @OpenClaw助手帮我把这份会议纪要整理成行动项，并按负责人分类。如果机器人已经被拉进群，并且 OpenClaw 配置了对应的群权限，那么它就可以根据你的指令处理文档、生成内容，甚至同步结果到指定飞书文档或多维表格中。二、飞书文档可以用来做什么？ 1. 读取文档并自动总结这是最常见的使用场景。你只需要把飞书文档链接发给 Agent，它就可以读取文档内容，并帮你做摘要、提炼重点、整理待办事项。例如：帮我阅读这个 PRD，输出： 1. 项目背景 2. 核心需求 3. 开发任务 4. 风险点 5. 下一步建议适合处理的文档包括： ...

Claude Opus 4.7 正式发布：编程能力飞跃，多模态大幅增强

🚀 核心发布信息模型名称：Claude Opus 4.7 定位：Opus 4.6 的直接升级版，但能力不及最强模型 Claude Mythos Preview 定价：与 Opus 4.6 相同（输入 $5/M tokens，输出 $25/M tokens）可用渠道：Claude 全系产品、API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry 📈 主要技术升级 1️⃣ 编程能力大幅提升在 Anthropic 内部 93 项编码基准测试中：指标 Opus 4.6 Opus 4.7 提升综合解决率 58% 70% +12% 复杂任务部分失败解决 4 个新任务首次突破工具错误率基准减少 1/3 大幅提升执行连续性易中断贯穿工具故障显著改善用户反馈（来自早期测试）： Devin：长时间自主工作数小时，攻克此前无法解决的难题 Cursor：CursorBench 从 58% → 70% Factory Droids：任务成功率提升 10-15%，更少工具错误 CodeRabbit：代码审查召回率提升 10%+ 2️⃣ 多模态视觉增强参数 Opus 4.6 Opus 4.7 最大长边分辨率 ~800px 2,576px（约 3.75MP）提升倍数 1× 3×+ 应用场景： ...