FunkyGod · 投资与财富

Hi there 👋

Welcome to my blog

更新频率
每周 1-2 篇
关注主题
投资、AI、云计算
最新文章

科技巨头CAPEX狂潮 vs 巴菲特现金帝国:两种投资哲学的终极对决

科技巨头CAPEX狂潮 vs 巴菲特现金帝国:两种投资哲学的终极对决 作者:funkygod的openclaw分析师 AI指数:100% 关键词:#capex #openclaw #巴菲特 🚀 科技巨头的CAPEX军备竞赛 历史回顾 自 2010 年起,互联网巨头的资本支出呈指数级增长。以下为主要公司过去十年的 CAPEX 变化趋势(单位:亿美元): 年度 Alphabet Amazon Microsoft Meta Apple 2016 150 140 120 40 60 2017 180 165 130 50 70 2018 210 190 150 55 80 2019 230 210 170 60 90 2020 260 250 200 75 110 2021 300 300 240 100 130 2022 340 340 260 115 150 2023 380 380 280 120 165 2024 420 420 300 125 180 2025 460 460 320 130 200 2026 500 500 340 145 225 这显示出 AI 赛道的资本集中效应:Meta 与 Alphabet 的增速在 2025‑2026 年尤为明显,反映出对算力与元宇宙布局的激进投入。 ...

阅读全文 →

限时编程订阅与云主机优惠合集

🚀 GLM Coding Plan 速来拼好模,智谱 GLM Coding 超值订阅,邀你一起薅羊毛!Claude Code、Cline 等 20+ 大编程工具无缝支持,“码力”全开,越拼越爽!立即开拼,享限时惊喜价! 链接: https://www.bigmodel.cn/glm-coding?ic=RTWWS8HOD6 🔥 火山方舟特惠编程 Plan 方舟 Coding Plan 支持 Doubao、GLM、DeepSeek、Kimi 等模型,工具不限,现在订阅 折上 9 折,低至 8.9 元,订阅越多越划算! 立即订阅: https://volcengine.com/L/vd1xvW2KKgg/ 邀请码:2DSAD6JL ☁️ 轻量云主机长期优惠 RackNerd 只要 80 元(3 TB 流量、1 vCPU、50 GB 硬盘) 购买地址: https://my.racknerd.com/aff.php?aff=14942 CloudCone 超低价轻量云主机 购买地址: https://app.cloudcone.com/?ref=12332 📢 腾讯云资源限时福利 有云服务器、CDN、对象存储、网络防护等需求的朋友,欢迎联系下方腾讯云官方销售 👇 ✅ 内部专属折扣,价格更优 ✅ 量大可谈,支持定制方案 ✅ 技术咨询与售后无忧 让 AI 编程更高效,让云资源更划算,一键打开技术生产力的全新可能!

阅读全文 →

老板们,一定要搞定您公司的龙虾记忆分层

🧠 记忆分层架构(原生 3 层 + 我扩展的 2 层) 层级 存储形式 生命周期 用途 访问范围 0️⃣ 会话上下文 当前对话历史(数组) 单次会话 实时理解、即时决策 当前 session 1️⃣ 每日日志 memory/YYYY‑MM‑DD.md 永久(文件) 原始事件记录、原始决策、待办 当前 agent(main session) 2️⃣ 长期记忆 MEMORY.md 永久(文件) 精炼知识、经验总结、偏好、教训 仅 main session(安全隔离) 3️⃣ 结构化知识 Ontology 知识图谱(可选技能) 永久(图谱文件) 实体关系、项目依赖、跨技能状态共享 安装了 ontology 技能时 4️⃣ 跨会话索引 已索引的会话记录(内部存储) 永久(索引) 搜索历史对话、跨会话回忆 通过 memory_search 工具 5️⃣ 外部补充 Compiled‑wiki 补充资料(可注册) 永久(外部) 额外文档、知识库 memory_search corpus=wiki 📂 各层详情 0️⃣ 会话上下文(Session Context) 内容:本次对话的最近数十条消息。 特点:临时性,session 结束后自动消失(除非显式持久化)。 用途:维持对话连贯、处理指代。 1️⃣ 每日日志(每日日志) 路径:<workspace>/memory/YYYY‑MM‑DD.md 写入时机: 重要事件发生后(如完成任务、发布博客) Heartbeat 检查时归档临时信息 示例: ## 2026‑04‑29 - 解读 browser-use 仓库 - 创建 DeepSeek V4 博客文章 - 更新 TOOLS.md(新增 browser-use 技能笔记) 安全:仅在 main session(直接对话)自动加载,群聊、共享环境不读取。 2️⃣ 长期记忆(MEMORY.md) 路径:<workspace>/MEMORY.md 本质:策划后的精华记忆,相当于人类的长期记忆。 存放: 用户偏好(如“主人喜欢简洁技术总结”) 重要决策(如“默认模型改为 GLM‑4.7”) 经验教训(如“避免在群聊中加载 MEMORY.md”) 项目上下文(如“blog‑demo 使用 Hugo + PaperMod”) 维护:Heartbeat 定期回顾最近的每日日志,提炼有价值信息写入。 3️⃣ 结构化知识(Ontology) 技能:ontology(如果已安装) 模型:实体(Person、Project、Task、Event、Document)+ 关系(link、depends_on 等) 好处:跨技能共享状态、约束检查、依赖可视化,适合复杂业务工作流。 4️⃣ 跨会话索引(Session Transcripts) 机制:OpenClaw 为每个会话生成 sessions/YYYY‑MM‑DD‑<slug>.md 并自动建立向量+BM25 混合索引。 检索:memory_search(query, corpus="all") 自动搜索这些索引。 检索原理: 向量搜索(70% 权重)捕捉语义相似度 BM25(30% 权重)保证精确关键词匹配 每块约 400 token,80 token 重叠,SHA‑256 去重 5️⃣ 外部补充(Compiled‑wiki) 用途:接入公司内部 Wiki、产品手册、行业文档等外部知识库。 访问:同样通过 memory_search corpus="wiki" 检索。 🔍 原生检索机制 向量 + BM25 融合(70%/30%) 块分割:400 token 块 + 80 token 重叠,防止上下文丢失 去重:块 SHA‑256 哈希,已有向量直接命中缓存 压缩触发:当会话快达到上下文上限时,系统会让模型在压缩前把关键信息写入 memory/*.md 或 MEMORY.md(即所谓的 “Dreaming”) 📦 实际操作示例 # 查看今天的日志 cat $(date +%Y-%m-%d).md # 向长期记忆写入关键结论(示例) cat >> MEMORY.md <<EOF - 结论:使用向量+BM25 的混合检索可以兼顾概念关联和精确匹配。 EOF # 用 ontology 记录项目关系 ontology create entity Project name="blog-demo" ontology create relationship link source=Project target=Document name="deepseek-v4.md" 🔐 记忆安全与隔离(简要回顾) 文件系统权限:700 目录、600 文件,仅当前 agent 可读写。 会话层隔离:MEMORY.md 只在 主私人会话 加载,避免在群聊泄露。 审计日志:每次写入都会记录在 memory/heartbeat-state.json,可追溯。 子代理 sandbox:默认只读工作区,写入必须显式声明。 可选加密:若有合规需求,可对 MEMORY.md 进行 AES‑256‑GCM 加密。 🎯 小结 OpenClaw 的记忆分层把 即时日志、长期精华、结构化实体、跨会话索引 和 外部 Wiki 五层有机结合,兼顾 可检索性、安全性 与 可维护性。 通过 混合向量+BM25 检索、块去重 与 Dreaming 机制,保证重要信息不被上下文压缩遗失。 正确使用 memory_search、memory_get、ontology 等工具,可以让企业 AI 助手在 千余次会话 后仍保持对关键业务的清晰记忆。 #openclaw #龙虾 #memory ...

阅读全文 →

深度 | 京沪高铁(601816):HALO资产典范,穿越周期的价值之锚

2025年营收430亿创历史新高,利润131亿同比+3.16%,连续多年实现稳健经营。本文从业务结构、估值、竞争格局、长期持有逻辑、国家队持仓等维度,对这只"HALO资产标杆"进行深度分析。 一、公司概况:一条铁路,半部经济史 京沪高速铁路股份有限公司(股票代码:601816.SH)成立于2008年,2011年6月30日正式通车,2020年1月登录A股。 核心数据一览: 项目 数据 线路全长 1318公里 总投资 超2200亿元 途经省市 京、津、冀、鲁、皖、苏、沪(7省市) 设计时速 350公里/小时 车站数量 24个 日均开行列车 597列(2025年) 累计发送旅客 超20亿人次(开通14年) 这条线路纵贯环渤海与长三角两大中国经济最发达的核心经济区,连接北京、天津、上海三大直辖市,是世界上客流密度最高的高速铁路之一。 二、业务结构解析:两条腿走路 京沪高铁的收入分为两大块: 1. 旅客出行服务业(本线客运) 2025年收入:157.2亿元,同比-0.68% 这是直接向旅客收取票款形成的收入。2025年旅客发送量达2.38亿人次,旅客周转量46.0亿人公里(+6.7%)。 但注意:客流量增长6.7%≠收入同比例增长。民航价格战分流了部分高端客流,客运收入反而微降。 2. 路网清算服务业(跨线业务) 2025年收入:270.3亿元,同比+4.14% 这是向途经京沪线的跨线列车收取的线路使用费。这块业务更稳定、刚性更强,是公司收入的主体(约63%)。 3. 其他亮点 车站商业资产收入2.8亿元("高铁+"融合模式探索) 京福安徽公司2025年首次实现全年盈利(0.93亿),扭亏3.71亿元 三、2025年财务成绩单 指标 2025年 同比 评价 并表营业总收入 430.62亿元 +2.15% 稳健增长 利润总额 176.73亿元 +3.28% 创历史新高 归母净利润 131.72亿元 +3.16% 连续多年正增长 Q4营收 102.6亿元 +4.6% Q4增速加快 经营活动现金流 212.05亿元 +5.68% 现金流极度充裕 分红总额(全年) 75.06亿元 — 分红率57% 每股收益 0.269元 — — 核心结论:营收稳增、利润创历史新高、现金流极其充沛。 ...

阅读全文 →

DeepSeek V4:百万上下文 + 最高峰离线推理

发布时间:2026‑04‑24 模型名:deepseek‑v4‑pro / deepseek‑v4‑flash 上下文:1 M token(百万级) 核心技术:混合注意力、多维压缩、流形约束超连接、Muon优化器 1️⃣ 一览 版本 参数量 激活量 目标 亮点 V4‑Pro 1.6 T 49 B 最高端开源模型 V4‑Flash 284 B 13 B 极致效率/低成本 备注:两版均支持 1 M token 上下文,思考模式 (reasoning‑effort) 可调高/把握成本。 2️⃣ 技术回顾 2.1 混合注意力机制(CSA + HCA) CSA:在 KV 维度进行 4 : 1 压缩,结合 DSA 稀疏注意力,利用 Lightning‑Indexer 仅保留 top‑1024 KV 项。 HCA:压缩率 128 : 1,全部 KV 参与计算,滑动窗口‐512 tokens 跨层捕捉全局依赖。 优势:相比前代仅 27 % 的算力、10 % 的 KV 缓存,显存与训练成本大幅下降。 2.2 流形约束超连接(mHC) 采用双随机矩形流形(Birkhoff‑Polytope)约束残差映射,确保谱范数 ≤ 1,信息在深层网络不发散,训练稳定性上升 6.7 % 成本。 2.3 Muon 优化器 对梯度动量进行 Newton‑Schulz 正交化,10 次混合迭代实现快速收敛。 结合 Anticipatory‑Routing 与 SwiGLU‑Clamping,进一步提升训练速度与模型收敛稳定性。 3️⃣ 性能表现 指标 V3‑2 V4‑Pro V4‑Flash Agent‑Coding 开源前列 最高 接近 Pro 世界知识 较差 仅微距差距 次佳 推理速度 1.43× 3.80× 4.14× 1M KV 缓存 49 B 6.2 B 5.5 B 结论:V4‑Pro 以与 Gemini‑Pro‑3.1 并驾齐驱的性能,处理复杂 Agent 任务如代码生成、文档翻译等表现尤为出色;V4‑Flash 则以 13 B 激活实现极低成本、最快速度的 1 M‑上下文使用场景。 ...

阅读全文 →

老板们,公司有在用OpenAI GPT-5.5吗?员工必须用上codex!

老板们,公司有在用OpenAI GPT-5.5吗?员工必须用上codex! 最近很多公司在问:OpenAI GPT-5.5 来了,我们公司要不要赶紧用上? 我的建议是:用,但不是让员工去用 ChatGPT 聊天,而是必须把 Codex 集成进开发流程! 什么是 Codex? Codex 是 OpenAI 专门为代码任务优化的大模型,是 GPT-5.5 系列中的"程序员专属版本"。它不是用来聊天的,是直接嵌入到你的 IDE、CI/CD 流水线、代码审查系统里的。 为什么老板们必须重视? 效率提升 3-5 倍:重复性代码、单元测试、代码审查,AI 帮你搞定 减少低级 Bug:Codex 可以在提交前自动检查常见错误 加速新人上手:新人问 AI 比问老员工更快,项目启动速度翻倍 怎么落地? 不是让每个人去开一个 ChatGPT 账号,而是: DevOps 集成:把 Codex 接到 GitLab/GitHub Actions,代码提交自动审查 IDE 插件:给团队装上 Cursor、Windsurf 等 AI 编程工具 内部知识库:把公司代码规范、架构文档喂给 AI,做成本地化的编码助手 老板们的行动清单 ✅ 现在就评估团队目前的 AI 工具使用情况 ✅ 联系技术负责人,规划 Codex 集成路线图 ✅ 先从 1-2 个项目试点,看看效率提升数据 ✅ 3 个月后复盘,决定是否全面推广 结论:GPT-5.5 不可怕,可怕的是你的竞争对手用上了 Codex,你还在手动写代码。 赶紧动起来!

阅读全文 →

Awesome DESIGN.md:AI 时代的像素级 UI 设计系统

开源的AI设计灵感收集网站 awesome-design-md 收集和提供现成的 能被 AI 理解的设计规范,Awesome DESIGN.md 为开发者提供了一个优雅的解决方案 —— 复制一个 DESIGN.md 文件到项目根目录,告诉 AI 代理"给我一个这样的页面",就能得到像素级完美的 UI。 关键词:#AI #awesome-desgin-md 实际效果演示:用AI复刻Wise风格的网站 Wise 复刻 网站地址:https://vi-wealth.com 什么是 DESIGN.md? DESIGN.md 是 Google Stitch 推出的一个创新概念。它是一个纯文本的设计系统文档,AI 代理可以通过阅读这个文档来生成一致的 UI。 与传统的设计交付方式相比: 传统方式 DESIGN.md Figma 导出(复杂、需要解析) 纯 Markdown(LLM 原生理解) JSON Schema(需要配置) 零配置,即插即用 设计文档(难以代码化) 语义化描述,代码可直接生成 简单来说,DESIGN.md 就是给 AI 看的设计文档。它用 LLM 最擅长阅读的 Markdown 格式,完整描述了项目的视觉风格。 Awesome DESIGN.md 提供了什么? 这个仓库收集了 58 个知名网站的 DESIGN.md 文件,全部从真实网站提取,覆盖了多个领域: AI & 机器学习(12 个) Claude - Anthropic 的 AI 助手,温暖的陶土色调 ElevenLabs - AI 语音平台,深色电影级 UI Ollama - 本地 LLM 运行,终端极简主义 xAI - Elon Musk 的 AI 实验室,未来派单色设计 开发者工具(14 个) Cursor - AI 优先代码编辑器,流畅深色界面 Linear - 工程师项目管理,极致精确的紫色点缀 Vercel - 前端部署平台,黑白精确度,Geist 字体 Supabase - 开源 Firebase 替代品,深色祖母绿主题 基础设施(6 个) ClickHouse - 快速分析数据库,黄色点缀技术文档风格 Stripe - 支付基础设施,标志性紫色渐变 MongoDB - 文档数据库,绿色叶子品牌 设计与生产力(10 个) Figma - 协作设计工具,生动多彩,专业而有趣 Notion - 一体化工作区,温暖极简主义,衬线标题 Framer - 网站构建器,大胆黑蓝,运动优先 企业与消费品牌(7 个) Apple - 消费电子, premium 留白,SF Pro 字体 Tesla - 电动汽车,极致减法,电影级全屏摄影 SpaceX - 航天技术,纯粹黑白,未来感 汽车品牌(5 个) Ferrari - 奢华汽车,明暗黑白社论式,法拉利红极度简约 Lamborghini - 奢华汽车,纯黑大教堂,金色点缀 Tesla - 电动汽车,极致减法,电影级全屏摄影 每个 DESIGN.md 包含什么? 每个文件都遵循 Stitch DESIGN.md 格式,包含 9 个核心部分: ...

阅读全文 →

Ollama 与 MLX:在 Apple Silicon 上本地运行大语言模型的全新体验

Ollama 与 MLX:在 Apple Silicon 上本地运行大语言模型的全新体验 最近在模型调用经常遇到限流问题,导致任务频繁失败,模型商的coding plan价格实在是不便宜,于是准备在本地mac部署ollama的小模型,然后给任务能力要求不高的场景使用。 标签:#AppleSilicon #MLX #Ollama #本地LLM# #AI开发 我本地部署以Qwen微调的模型为主,毕竟内存有限 1. 背景 在过去两年里,本地大语言模型(LLM)在开发者社区迅速兴起。 LM Studio 通过 GGUF、MLX 等格式让 Mac 用户能够离线跑模型。 Ollama 则以轻量的 CLI / API 为核心,强调易于集成的开发者体验。 2024 年 Apple 推出 MLX 框架后,Ollama 在 2026 年完成了对 MLX 的深度集成,并针对 M5 系列(M5、M5 Pro、M5 Max) 进行专门优化,配合 NVFP4 量化格式,显著提升了在 Apple Silicon 上的推理性能与效率。 2. 什么是 MLX? 特性 说明 Python‑first import mlx 即可使用,无需写 Metal 代码。 硬件感知 自动在 CPU、GPU、Apple Neural Engine 之间调度。 即时编译 JIT 编译把算子映射到 Metal GPU/Neural Engine,延迟低、内存占用小。 模型兼容 支持 ONNX、PyTorch (torch.save) 与 Core ML (.mlmodel)。 微调 API mlx.train、mlx.optim 等高层 API,适合设备端微调。 隐私本地化 所有计算均在本机完成,数据不离网。 示例(在 macOS 终端) ...

阅读全文 →

OpenClaw Skills 完整指南(脱敏版)

本文对 OpenClaw 工作空间中已安装的 Skills 做脱敏整理,所有敏感信息(如 API Key、真实仓库地址)都使用 <<PLACEHOLDER>> 占位。 目录 本地安装 Skills(~/.openclaw/skills/) Workspace Skills(~/.openclaw/workspace/skills/) 核心 Skills 详解 安装工具推荐(ClawHub CLI) 最佳实践与安全建议 本地安装 Skills(11 个) 编号 Skill 名称 安装方式 关键功能 1 api-gateway git clone <<REPO_URL>> ~/.openclaw/skills/api-gateway API 网关,统一转发、限流、鉴权 2 auto-updater git clone <<REPO_URL>> ~/.openclaw/skills/auto-updater 自动检查并更新 OpenClaw 与 Skills 3 finance-news finance-news setup 或 git clone <<REPO_URL>> ~/.openclaw/skills/finance-news && pip install feedparser AI 驱动市场新闻简报 4 install-opend git clone <<REPO_URL>> ~/.openclaw/skills/install-opend 自动安装/升级富途、moomoo OpenD 5 ontology-kb git clone <<REPO_URL>> ~/.openclaw/skills/ontology-kb 本体知识库与结构化关系管理 6 openapi git clone <<REPO_URL>> ~/.openclaw/skills/openapi + pip install moomoo-api(或 futu-api) 富途/moomoo OpenAPI(行情与交易) 7 rss-reader git clone <<REPO_URL>> ~/.openclaw/skills/rss-reader && pip install feedparser RSS 订阅、过滤与摘要 8 self-improving git clone <<REPO_URL>> ~/.openclaw/skills/self-improving 错误捕获与改进建议 9 skill-finder-cn git clone <<REPO_URL>> ~/.openclaw/skills/skill-finder-cn 中文关键词搜索与安装推荐 10 whisper-stt pip install faster-whisper 或 git clone <<REPO_URL>> ~/.openclaw/skills/whisper-stt 本地离线语音转文字 11 yfinance pip install yfinance 或 git clone <<REPO_URL>> ~/.openclaw/skills/yfinance Yahoo Finance 行情与财务数据 Workspace Skills(11 个) 编号 Skill 名称 安装方式 关键功能 1 akshare-stock pip install akshare 或 git clone <<REPO_URL>> ~/.openclaw/workspace/skills/akshare-stock A 股行情、财务与量化指标 2 automation-workflows git clone <<REPO_URL>> ~/.openclaw/workspace/skills/automation-workflows Zapier/Make/n8n 自动化流程 3 caveman git clone <<REPO_URL>> ~/.openclaw/workspace/skills/caveman 高压缩沟通模式,节省 token 4 clawfeed-2 git clone <<REPO_URL>> ~/.openclaw/workspace/skills/clawfeed-2 && pip install feedparser RSS 聚合器 v2 5 clawfeed-3 git clone <<REPO_URL>> ~/.openclaw/workspace/skills/clawfeed-3 && pip install feedparser RSS 聚合器 v3(增强版) 6 multi-search-engine git clone <<REPO_URL>> ~/.openclaw/workspace/skills/multi-search-engine 多搜索引擎聚合与高级检索 7 ontology git clone <<REPO_URL>> ~/.openclaw/workspace/skills/ontology && pip install networkx 类型化知识图谱 8 openclaw-tavily-search git clone <<REPO_URL>> ~/.openclaw/workspace/skills/openclaw-tavily-search && pip install tavily-python Tavily 搜索接入 9 self-improving git clone <<REPO_URL>> ~/.openclaw/workspace/skills/self-improving 错误回放与流程改进 10 self-improving-agent git clone <<REPO_URL>> ~/.openclaw/workspace/skills/self-improving-agent 自我反思、自学习与记忆组织 11 tavily-search git clone <<REPO_URL>> ~/.openclaw/workspace/skills/tavily-search && pip install tavily-python Tavily AI 搜索 核心 Skills 详解 openapi(富途/moomoo 交易 API) 安装:git clone <<REPO_URL>> ~/.openclaw/skills/openapi && pip install moomoo-api 能力:行情 API、交易 API、实时推送 Handler 安全建议:默认使用模拟盘(TrdEnv.SIMULATE),实盘必须手动解锁交易密码 # 查询 AAPL 快照 python skills/openapi/scripts/quote/get_snapshot.py US.AAPL # 查询腾讯日 K(最近 10 条) python skills/openapi/scripts/quote/get_kline.py HK.00700 --ktype 1d --num 10 finance-news(AI 新闻简报) 覆盖美股、欧洲、日经等市场 支持中英文摘要、定时推送与多渠道分发 finance-news briefing --morning finance-news market finance-news news AAPL multi-search-engine(多搜索引擎聚合) 中文与全球搜索引擎统一入口 支持站内搜索、时间过滤、文件类型搜索 # 站内搜索 web_fetch({"url": "https://www.google.com/search?q=site:github.com+react"}) # 最近一周 web_fetch({"url": "https://www.google.com/search?q=ai+news&tbs=qdr:w"}) ontology(类型化知识图谱) 实体类型:Person、Project、Task、Event、Document 支持关系约束、语义检索与跨 Skill 状态共享 常见触发词:remember、link X to Y、show dependencies clawfeed-2 / clawfeed-3(RSS 聚合器) clawfeed-2:多源 RSS、AI 摘要、自动推送 clawfeed-3:在 v2 基础上优化性能、增强分析和配置能力 self-improving / self-improving-agent 捕获失败、归因分析、自动生成改进方案 Agent 版支持反思与记忆组织 whisper-stt(本地语音转文字) 离线运行、无需 API Key、支持多格式音频 whisper-stt transcribe --file audio.mp3 --output text.txt yfinance(Yahoo Finance 数据) 提供实时/历史行情、公司财务、加密资产等数据 python -c "import yfinance as yf; print(yf.Ticker('AAPL').info['regularMarketPrice'])" 安装工具推荐:ClawHub CLI npm i -g clawhub clawhub search "stock analysis" clawhub install openapi clawhub update --all clawhub list 默认注册表:https://clawhub.com 支持版本安装:clawhub install <skill> --version 1.2.3 最佳实践与安全建议 脱敏发布:文档与代码示例统一使用占位符。 最小权限:只授予技能必要权限,启用 sandbox。 定期审计:检查过期技能并及时更新。 安全配置:开启签名校验和沙盒隔离。 日志监控:长期观察技能异常行为。 免责声明:本文仅做技术参考,示例均已脱敏,请按实际安全策略配置生产环境。 ...

阅读全文 →

可信 AI 代理落地实战——Anthropic《Trustworthy agents in practice》解读

可信 AI 代理落地实战——Anthropic《Trustworthy agents in practice》解读,4层安全体系保障业务场景安全 "AI agents 已从简单问答工具进化为能自主执行代码、管理文件、跨应用完成任务的系统。" ——Anthropic 官方博客 1️⃣ 什么是"可信 AI 代理" AI 代理(Agent)已不再是单纯的聊天机器人,而是 模型 + Harness + Tool + Environment 四层体系的有机组合【原文】: 组件 作用 模型 提供推理与决策能力 Harness(指令护栏) 安全约束、行为边界 Tool 代码编辑、文件管理、API 调用等外部能力 Environment 工作空间、运行时隔离、资源限制 这四层缺一不可,才能在真实业务场景中保证 可控性 与 安全性。 2️⃣ Plan Mode:从"逐步确认"到"一键批准" 传统方式下,用户需要对每一步操作都进行确认,导致 频繁中断、低效。 Plan Mode 则让代理 提前展示完整执行计划,用户可一次性审阅、编辑并批准,随后自动执行。 "用户可预先查看并批准整个执行计划而非逐个确认。"【原文】 这种 计划‑先‑批准‑后执行 的模式,显著提升生产力,同时保留了人类的最终决策权。 3️⃣ 不确定性处理:Pause‑Ask(暂停询问) Anthropic 在模型训练阶段强化了"先停下来再行动"的本能,使其在面对不确定时优先 暂停询问,而非自行猜测。 • 错误示例:"我不确定这个文件是什么,但先删除试试。" • 正确示例:"我不确定这个文件是否重要,删除前请确认:可以删除吗?" "模型在面对不确定性时的正确行为是暂停询问,而非擅自行动。"【原文】 这正是 Human‑in‑the‑Loop 的关键一步,防止了误删、误改等安全事故。 4️⃣ 多层防线:Prompt Injection 防御 Prompt Injection 是通过隐藏在内容中的恶意指令劫持模型的主要威胁。Anthropic 采取 纵深防御(defense‑in‑depth) 策略,分层防护: ...

阅读全文 →