职场工作杠杆:ChatGPT 和 Codex —— 一个帮你想清楚,一个帮你做下去

职场工作杠杆:ChatGPT 和 Codex —— 一个帮你想清楚,一个帮你做下去 在 AI 工具越来越多的今天,真正值得上班族投入时间学习的工具并不多。我的建议很明确:普通上班族优先学 ChatGPT,技术型岗位或经常做自动化的人,再进一步用 Codex。 学好这2个AI产品,知道怎么正确应用在工作中,你就已经战胜了大部分同行竞争对手了。 简单理解ChatGPT和Codex ChatGPT 更像你的"思考、写作、研究和沟通助手"。 Codex 更像你的"技术执行、代码修改和自动化助手"。 OpenAI 官方帮助中心把 ChatGPT 描述为可用于问答、解释概念、写作、总结、推理、翻译,并可结合搜索、深度研究、文件上传、数据分析、语音、Canvas、Memory 等能力的对话式 AI 助手。 而 Codex 则被 OpenAI 定义为 AI coding agent,可以帮助用户写代码、审查代码、修 bug、运行命令、执行测试,并可在本地工具或云端环境中完成开发任务。 一、ChatGPT 是什么? ChatGPT 是 OpenAI 面向普通用户和企业用户的 AI 助手。它不是单纯的"聊天机器人",更像一个通用工作台。 你可以用它做这些事: 场景 ChatGPT 能帮你做什么 写作 写邮件、周报、方案、公众号文章、汇报材料 总结 总结会议纪要、PDF、长文、调研资料 研究 搜索信息、整理资料、做竞品分析 翻译 中英互译、润色表达、本地化改写 数据 分析表格、CSV、趋势、异常点 思考 拆解问题、制定计划、做决策辅助 创意 写标题、脚本、活动方案、营销文案 对大多数上班族来说,ChatGPT 的价值在于:它能直接降低信息处理、表达和思考的成本。 以前你可能要花 2 小时写一份初稿,现在可以先让 ChatGPT 生成结构,再由你修改判断。以前你读一份 30 页 PDF 很痛苦,现在可以让它先提炼重点、列出风险和待确认问题。 ...

2026-05-06 · 2 min · 252 words · FunkyGod

Claude Opus 4.7 正式发布:编程能力飞跃,多模态大幅增强

🚀 核心发布信息 模型名称:Claude Opus 4.7 定位:Opus 4.6 的直接升级版,但能力不及最强模型 Claude Mythos Preview 定价:与 Opus 4.6 相同(输入 $5/M tokens,输出 $25/M tokens) 可用渠道:Claude 全系产品、API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry 📈 主要技术升级 1️⃣ 编程能力大幅提升 在 Anthropic 内部 93 项编码基准测试中: 指标 Opus 4.6 Opus 4.7 提升 综合解决率 58% 70% +12% 复杂任务 部分失败 解决 4 个新任务 首次突破 工具错误率 基准 减少 1/3 大幅提升 执行连续性 易中断 贯穿工具故障 显著改善 用户反馈(来自早期测试): Devin:长时间自主工作数小时,攻克此前无法解决的难题 Cursor:CursorBench 从 58% → 70% Factory Droids:任务成功率提升 10-15%,更少工具错误 CodeRabbit:代码审查召回率提升 10%+ 2️⃣ 多模态视觉增强 参数 Opus 4.6 Opus 4.7 最大长边分辨率 ~800px 2,576px(约 3.75MP) 提升倍数 1× 3×+ 应用场景: ...

2026-05-03 · 2 min · 333 words · FunkyGod

DeepSeek V4:百万上下文 + 最高峰离线推理

发布时间:2026‑04‑24 模型名:deepseek‑v4‑pro / deepseek‑v4‑flash 上下文:1 M token(百万级) 核心技术:混合注意力、多维压缩、流形约束超连接、Muon优化器 1️⃣ 一览 版本 参数量 激活量 目标 亮点 V4‑Pro 1.6 T 49 B 最高端开源模型 V4‑Flash 284 B 13 B 极致效率/低成本 备注:两版均支持 1 M token 上下文,思考模式 (reasoning‑effort) 可调高/把握成本。 2️⃣ 技术回顾 2.1 混合注意力机制(CSA + HCA) CSA:在 KV 维度进行 4 : 1 压缩,结合 DSA 稀疏注意力,利用 Lightning‑Indexer 仅保留 top‑1024 KV 项。 HCA:压缩率 128 : 1,全部 KV 参与计算,滑动窗口‐512 tokens 跨层捕捉全局依赖。 优势:相比前代仅 27 % 的算力、10 % 的 KV 缓存,显存与训练成本大幅下降。 2.2 流形约束超连接(mHC) 采用双随机矩形流形(Birkhoff‑Polytope)约束残差映射,确保谱范数 ≤ 1,信息在深层网络不发散,训练稳定性上升 6.7 % 成本。 2.3 Muon 优化器 对梯度动量进行 Newton‑Schulz 正交化,10 次混合迭代实现快速收敛。 结合 Anticipatory‑Routing 与 SwiGLU‑Clamping,进一步提升训练速度与模型收敛稳定性。 3️⃣ 性能表现 指标 V3‑2 V4‑Pro V4‑Flash Agent‑Coding 开源前列 最高 接近 Pro 世界知识 较差 仅微距差距 次佳 推理速度 1.43× 3.80× 4.14× 1M KV 缓存 49 B 6.2 B 5.5 B 结论:V4‑Pro 以与 Gemini‑Pro‑3.1 并驾齐驱的性能,处理复杂 Agent 任务如代码生成、文档翻译等表现尤为出色;V4‑Flash 则以 13 B 激活实现极低成本、最快速度的 1 M‑上下文使用场景。 ...

2026-04-24 · 2 min · 220 words · FunkyGod

Awesome DESIGN.md:AI 时代的像素级 UI 设计系统

开源的AI设计灵感收集网站 awesome-design-md 收集和提供现成的 能被 AI 理解的设计规范,Awesome DESIGN.md 为开发者提供了一个优雅的解决方案 —— 复制一个 DESIGN.md 文件到项目根目录,告诉 AI 代理"给我一个这样的页面",就能得到像素级完美的 UI。 关键词:#AI #awesome-desgin-md 实际效果演示:用AI复刻Wise风格的网站 Wise 复刻 网站地址:https://vi-wealth.com 什么是 DESIGN.md? DESIGN.md 是 Google Stitch 推出的一个创新概念。它是一个纯文本的设计系统文档,AI 代理可以通过阅读这个文档来生成一致的 UI。 与传统的设计交付方式相比: 传统方式 DESIGN.md Figma 导出(复杂、需要解析) 纯 Markdown(LLM 原生理解) JSON Schema(需要配置) 零配置,即插即用 设计文档(难以代码化) 语义化描述,代码可直接生成 简单来说,DESIGN.md 就是给 AI 看的设计文档。它用 LLM 最擅长阅读的 Markdown 格式,完整描述了项目的视觉风格。 Awesome DESIGN.md 提供了什么? 这个仓库收集了 58 个知名网站的 DESIGN.md 文件,全部从真实网站提取,覆盖了多个领域: AI & 机器学习(12 个) Claude - Anthropic 的 AI 助手,温暖的陶土色调 ElevenLabs - AI 语音平台,深色电影级 UI Ollama - 本地 LLM 运行,终端极简主义 xAI - Elon Musk 的 AI 实验室,未来派单色设计 开发者工具(14 个) Cursor - AI 优先代码编辑器,流畅深色界面 Linear - 工程师项目管理,极致精确的紫色点缀 Vercel - 前端部署平台,黑白精确度,Geist 字体 Supabase - 开源 Firebase 替代品,深色祖母绿主题 基础设施(6 个) ClickHouse - 快速分析数据库,黄色点缀技术文档风格 Stripe - 支付基础设施,标志性紫色渐变 MongoDB - 文档数据库,绿色叶子品牌 设计与生产力(10 个) Figma - 协作设计工具,生动多彩,专业而有趣 Notion - 一体化工作区,温暖极简主义,衬线标题 Framer - 网站构建器,大胆黑蓝,运动优先 企业与消费品牌(7 个) Apple - 消费电子, premium 留白,SF Pro 字体 Tesla - 电动汽车,极致减法,电影级全屏摄影 SpaceX - 航天技术,纯粹黑白,未来感 汽车品牌(5 个) Ferrari - 奢华汽车,明暗黑白社论式,法拉利红极度简约 Lamborghini - 奢华汽车,纯黑大教堂,金色点缀 Tesla - 电动汽车,极致减法,电影级全屏摄影 每个 DESIGN.md 包含什么? 每个文件都遵循 Stitch DESIGN.md 格式,包含 9 个核心部分: ...

2026-04-19 · 3 min · 456 words · FunkyGod

可信 AI 代理落地实战——Anthropic《Trustworthy agents in practice》解读

可信 AI 代理落地实战——Anthropic《Trustworthy agents in practice》解读,4层安全体系保障业务场景安全 "AI agents 已从简单问答工具进化为能自主执行代码、管理文件、跨应用完成任务的系统。" ——Anthropic 官方博客 1️⃣ 什么是"可信 AI 代理" AI 代理(Agent)已不再是单纯的聊天机器人,而是 模型 + Harness + Tool + Environment 四层体系的有机组合【原文】: 组件 作用 模型 提供推理与决策能力 Harness(指令护栏) 安全约束、行为边界 Tool 代码编辑、文件管理、API 调用等外部能力 Environment 工作空间、运行时隔离、资源限制 这四层缺一不可,才能在真实业务场景中保证 可控性 与 安全性。 2️⃣ Plan Mode:从"逐步确认"到"一键批准" 传统方式下,用户需要对每一步操作都进行确认,导致 频繁中断、低效。 Plan Mode 则让代理 提前展示完整执行计划,用户可一次性审阅、编辑并批准,随后自动执行。 "用户可预先查看并批准整个执行计划而非逐个确认。"【原文】 这种 计划‑先‑批准‑后执行 的模式,显著提升生产力,同时保留了人类的最终决策权。 3️⃣ 不确定性处理:Pause‑Ask(暂停询问) Anthropic 在模型训练阶段强化了"先停下来再行动"的本能,使其在面对不确定时优先 暂停询问,而非自行猜测。 • 错误示例:"我不确定这个文件是什么,但先删除试试。" • 正确示例:"我不确定这个文件是否重要,删除前请确认:可以删除吗?" "模型在面对不确定性时的正确行为是暂停询问,而非擅自行动。"【原文】 这正是 Human‑in‑the‑Loop 的关键一步,防止了误删、误改等安全事故。 4️⃣ 多层防线:Prompt Injection 防御 Prompt Injection 是通过隐藏在内容中的恶意指令劫持模型的主要威胁。Anthropic 采取 纵深防御(defense‑in‑depth) 策略,分层防护: ...

2026-04-10 · 1 min · 195 words · FunkyGod

Pi Agent:极简主义 AI 编码 Agent 的设计哲学与架构解析

「Pi ships with powerful defaults but skips features like sub agents and plan mode.」 — Mario Zechner 引言 在 AI Agent 领域,Claude Code、Cursor、Windsurf 等工具往往内置了大量功能——MCP、Sub-agent、Plan Mode、权限弹窗等。然而,有一个项目反其道而行之:只带 4 个默认工具,却获得了 23,000+ Stars。这就是 Pi。 本文基于 Pi 官方源码(badlogic/pi-mono),深入解析其架构设计与技术实现。 一、Pi 是什么? Pi 是一个终端编码 Agent 工具包,由独立开发者 Mario Zechner(@badlogic)开发和维护。 npm install -g @mariozechner/pi-coding-agent pi 项目信息 GitHub badlogic/pi-mono Stars 23,391 语言 TypeScript 定位 Minimal terminal coding harness 核心理念 "Pi is aggressively extensible so it doesn't have to dictate your workflow." ...

2026-03-14 · 5 min · 924 words · FunkyGod

OpenClaw: 配置多agent全团队一起干活!

OpenClaw: 配置多agent全团队一起干活! 🦞单个 Agent 处理多类任务会带来非常严重的记忆负担,导致巨额token开销,单独agent应该处理特定类型工作而不是各种杂七杂八的工作全部都要干! 🐳系统复杂度提高:各自agent处理不同类型的任务,分工明确、职能分化。有独立的记忆、技能和工作空间 每个助手对应不同的agent,分工明确,干活不累 关键词:#openclaw #glm #minimax #龙虾 #多agent 参考文档: OpenClaw 多 Agent 架构配置指南 - 把这份文档发给你的 OpenClaw,它会引导你选择最适合的多 Agent 架构配置 OpenClaw 多 Bot 团队协作教程 - 开发调优 - LINUX DO 新增agent 命令说明 openclaw agents add --workspace 工作空间路径 新Agent的名称(ID) ℹ️ 说明:命令参数说明: • --workspace:指定独立的数据空间路径,建议格式为 /root/.openclaw/workspace-{} • 新Agent的名称(ID) • --model:如果需要使用自定义模型,可以添加此参数并填写模型 ID,否则将使用默认模型 演示如下: ~/.openclaw » openclaw agents add --workspace ~/.openclaw/workspace-coder coder ~/.openclaw » openclaw agents list gudaixin@Mac 🦞 OpenClaw 2026.3.8 (3caab92) — Somewhere between 'hello world' and 'oh god what have I built.' │ ◇ Doctor warnings ──────────────────────────────────────────────────────────────────────────╮ │ │ │ - channels.telegram.groupPolicy is "allowlist" but groupAllowFrom (and allowFrom) is │ │ empty — all group messages will be silently dropped. Add sender IDs to │ │ channels.telegram.groupAllowFrom or channels.telegram.allowFrom, or set groupPolicy to │ │ "open". │ │ │ ├────────────────────────────────────────────────────────────────────────────────────────────╯ Agents: - main (default) Identity: 🦔 OpenClaw CEO (IDENTITY.md) Workspace: ~/.openclaw/workspace Agent dir: ~/.openclaw/agents/main/agent Model: minimax-portal/MiniMax-M2.5 Routing rules: 0 Routing: default (no explicit rules) - coder Workspace: ~/.openclaw/workspace-coder Agent dir: ~/.openclaw/agents/coder/agent Model: minimax-portal/MiniMax-M2.5 Routing rules: 0 配置telegram bot 对应不同agent,并安全检查 ...

2026-03-11 · 2 min · 274 words · FunkyGod

2025年度什么值得用:最佳AI办公和编程产品回顾

AI 在 2025 年是生产力革命性提高的一年 AI 工具集 AI 催生了一股快速创新的浪潮,而且这股浪潮的速度没有任何放缓的迹象。今天,主要是总结我在过去一年里使用的高价值 AI 产品,包含编程和办公 AI。不论你是学生还是上班族,或者是投资者,都应该积极拥抱 AI,AI 已经在重塑我们的就业岗位、工作环境和成长方式。 如果说 2024 年是 AI 开始普及的元年,那2025 就是 AI 真正上岗干活的一年且百花齐放互相竞争的一年。 推荐查询-AI 工具集:50+ AI 编程工具和助手(2025 年最新整理) | AI 工具集 盘点我在 2025 年使用的 AI 产品:编程 AI 模型和 IDE Cursor 我最爱的 AI 编程工具 编程是 AI 应用的热门场景,我也试过很多 IDE,但是效果最好的依旧是 Cursor。唯一的心疼就是最低每月 20 美金 💵,心疼但是好用。 网上好评如潮 好评:“Cursor 是一款由 AI 驱动的代码编辑器,能够理解你的代码库,并通过自然语言助你更快编写代码。 只需描述你想要构建或修改的内容,Cursor 就会为你生成相应的代码。” Vscode + Kilo Code 我最喜欢的开源免费 AI 编程插件,可以直接在 vscode 使用,且可以使用免费模型或者使用任意一家模型来进行 AI 编程开发。 ...

2026-01-04 · 2 min · 273 words · FunkyGod

AI用户的好基座模型:超强的Agent能力和思考推理的DeepSeek V3.2

超强的Agent能力和思考推理:DeepSeek V3.2 12月01日,deepseek发布了2款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。对比结果相当惊艳,我们可以低成本的推理获得高质量的输出。DS为AI创业者带来越来越好的基座模型。官方原文:https://mp.weixin.qq.com/s/ohsU1xRrYu9xcVD7qu5lNw?click_id=2 评测得分 DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数) 模型场景 DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。 DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。 思考模式 DeepSeek-V3.2 思考模式下的工具调用能力!非常重要的功能。模型名称:deepseek-reasoner,思考模式未充分适配 Cline、RooCode 等使用非标准工具调用的组件。 如何使用 **模型使用:官网,app,API都是V3.2,不管怎么用都是V3.2,通过参数控制是否启用深度思考! 谢谢关注收藏 ⏰ 刚刷到的朋友注意啦!点击【关注】锁定宝藏库,从此升职加薪不迷路 ✨ 我的投资理财博客:MakeMoney,https://funkygod.vip/ 我的技术分享博客:Tesla,https://funkygod.vip/ 轻量云主机限时优惠 RackNerd ☁ 主机显示特惠:只要80元(3TB流量,1vcpu,50GB硬盘) 购买地址:https://my.racknerd.com/aff.php?aff=14942 CloudCone CloudCone 特惠轻量云主机:购买地址:https://app.cloudcone.com/?ref=12332 📢 腾讯云资源限时福利 有云服务器、CDN、对象存储、网络防护等需求的朋友,欢迎联系下方腾讯云官方销售 👇 ✔️ 内部专属折扣,价格更优 ✔️ 量大可谈,支持定制方案 ✔️ 技术咨询与售后无忧

2025-12-02 · 1 min · 59 words · FunkyGod

性价比高的国内编程模型推荐:GLM-4.6(截止2025年12月1日)

性价比高的国内编程模型推荐:GLM-4.6(截止2025年12月1日) 使用GLM4.6 朋友们,我先替大家试试GLM4.6,看看前后端开发使用GLM4.6能够高质量的完成AI编程工作,后续效果等我过一段时间给大家反馈。 目前是黑五优惠时间,我是39.8元的包季度套餐,大家可以付费之后设置提醒,用2周看是否要取消自动续期,避免不合理扣费。 在付费完整后,就可以直接在AI插件里使用GLM4.6进行编程开发啦! 按照以下流程配置即可: API Provider:选择 Z AI Z AI Entrypoint:选择 China Coding Plan (https://open.bigmodel.cn/api/coding/paas/v4) Z AI API Key:填入您的智谱 API Key Model:选择 glm-4.6 或者列表中您想使用的模型 更多AI插件使用GLM4.6的教程 Kilo Code - 智谱AI开放文档 GLM4.6关键改进 GLM-4.6。与GLM-4.5相比,这一代模型带来了几项关键改进: 更长的上下文窗口:上下文窗口已从128K tokens扩展至200K tokens,使模型能够处理更复杂的智能体任务。 卓越的编码性能:该模型在代码基准测试中获得了更高的分数,并在Claude Code、Cline、Roo Code和Kilo Code等应用中展现出更出色的实际性能。 高级推理:GLM-4.6在推理性能上有明显提升,并在推理过程中支持工具使用。 更强大的智能体:GLM-4.6在工具使用和基于搜索的智能体方面表现出更强的性能。 结果显示,与GLM-4.5相比,GLM-4.6有明显提升,同时也比DeepSeek-V3.2-Exp和Claude Sonnet 4等国内外领先模型具有竞争优势,但在编程能力上仍落后于Claude Sonnet 4.5。 评测GLM4.6和Cloud Claude Sonnet 4.5 对阵 GLM-4.6:中外大模型编程巅峰对决,胜负已分? 丨302.AI 基准实验室 - 在 Claude Code 中使用 GLM 4.6 的体验 | Randy's Blog “若项目追求视觉惊艳、代码优雅的展示型效果,且预算充裕,Claude 仍是理想之选;而若任务涉及严谨逻辑、复杂交互与系统架构,需兼顾功能完整与高度可靠,GLM-4.6 则展现出更强的综合实力与交付保障。” ...

2025-12-01 · 1 min · 112 words · FunkyGod