AI编程 | FunkyGod - 投资与AI实践笔记

语音替代键盘：我的vibe coding实践与Handy语音输入方案

语音替代键盘：我的vibe coding实践与Handy语音输入方案键盘打字是程序员最传统的操作方式，但它的效率瓶颈在AI辅助编程时代越来越明显——我们和AI对话时需要大量输入上下文，而打字速度远远跟不上思维速度。本文分享我如何用语音彻底替代键盘，实现80%以上的coding指令下发。为什么放弃键盘打字传统的键盘输入有几个显著的效率问题：速度瓶颈：说话速度远快于打字速度，尤其在描述复杂逻辑时打断思维：打字需要同时关注拼写和内容，容易打断思路上下文不足：打字时容易省略细节，而AI需要更丰富的描述才能准确理解意图隐私顾虑：涉及密钥等敏感信息时，联网模型存在数据泄露风险用语音输入时，我可以一口气说完整个需求，包括各种细节和废话，AI能获得的上下文远比打字丰富。这在实际项目中大大提升了沟通效率。 Handy语音输入方案 Handy是我在本地Mac上部署的语音输入模型，完全开源免费，支持全球各种语言的实时翻译。核心优势完全本地运行：所有数据不经过云端，隐私安全有保障多语言实时翻译：说普通话、粤语、四川话还是英文、德语、法语，自动识别并翻译无网络延迟：本地运行，翻译速度稳定不波动模型选择建议 Handy提供针对不同语言优化的专用模型。如果你的母语或常用语言有对应模型，建议下载专用版本，速度更快、翻译质量更高。通用模型约1.5GB，对机器内存和存储都有一定要求。如果你不确定要翻译的目标语言种类，可以用通用模型覆盖。快捷键配置建议提前绑定一个快捷键来触发语音输入。我使用F4键：按一下开始讲话，再按一下结束并立刻输出翻译内容。这个流程非常自然，几乎感觉不到工具的存在。实际使用体验在实际和AI配合coding的过程中，语音输入的优势体现得淋漓尽致：时间成本更低：说话比打字快3-5倍，尤其适合长句和复杂描述细节更丰富：不会因为懒得打字而省略细节，AI理解的上下文更完整思维更流畅：不需要分心于拼写，可以完全沉浸在问题本身当然，语音输入也有其适用场景。对于简短的命令、变量名修改等精确操作，键盘依然更高效。我目前大概是80%语音 + 20%键盘的配比。未来展望我认为语音交流终将取代键盘这种传统的机械式输入方式，尤其是在和AI协作的场景下。AI需要更丰富的输入才能提供更准确的输出，而语音天然比打字更能传递完整的思维过程。当AI不再需要人类"喂料"，而是自己理解、自己决策、自己执行——这条路的起点，是让人类用最自然的方式表达意图。语音，就是最自然的方式。本文全部通过麦克风语音交流，AI辅助完成撰写。

我的编程套餐尝试：对大多数个人开发者，OpenCode Go 套餐值得试

我的编程套餐尝试：对大多数个人开发者，OpenCode Go 套餐值得试尤其是像我这种经常折腾 Docker、后端服务、AI 工具、UI 页面、脚本排错的人，$5 首月 / $10 每月的价格很有性价比。 OpenCode 官方说明：Go 是低成本订阅，首月 $5，之后 $10/月，可用于 OpenCode 或其他 agent，并支持充值兜底；它包含 GLM、Kimi、Qwen、DeepSeek、MiniMax、MiMo 等开放模型。(开源代码) 为什么值得 1. 价格低，但额度不算小官方文档写得比较清楚：Go 套餐不是简单按"请求次数"限制，而是按等价用量限制：限制周期用量额度 5 小时 $12 usage 每周 $30 usage 每月 $60 usage 实际请求次数取决于你选的模型。比如官方估算，DeepSeek V4 Flash 每月可到 158,150 次请求，Qwen3.7 Plus 每月约 21,600 次，GLM-5.2 每月约 4,300 次。(开源代码) 这对日常 coding、改 bug、解释报错、生成脚本、写 Dockerfile、分析日志，已经非常够用。 2. 很适合作为"日常编码副驾驶" Go 套餐的定位不是替代最强闭源模型，而是提供稳定、便宜、可大量使用的开放 coding 模型。官方也说它主要解决的是开放模型访问不稳定、不同 provider 质量不一致的问题，OpenCode 会筛选和 benchmark 适合 coding agent 的模型组合。(开源代码) ...

数字生产实践Codex：AI 编程助手进化到桌面办公智能体

数字生产实践Codex：AI 编程助手进化到桌面办公智能体 AI 编程工具正在从代码生成器，进化为能够操作环境、验证结果、持续协作的软件开发智能体。在过去，很多人对 AI 编程工具的理解还停留在"帮我补全代码""生成一段函数""解释一段报错"。但 OpenAI 最新版 Codex 的能力已经不止于此。根据 OpenAI 官方对新版 Codex 的介绍，Codex 正在从一个单纯的代码助手，升级为贯穿软件开发生命周期的智能协作伙伴。它不仅能写代码、理解代码库、处理 PR 评审，还开始具备两类更接近真实开发者工作方式的能力： Computer Use，也就是操作系统级控制能力；内置浏览器，也就是在 Codex 应用中直接打开、观察和操作网页的能力。这两项能力的出现，意味着 Codex 不再只是"回答怎么写代码"，而是开始进入真实开发环境，帮助开发者完成更完整的任务链路。一、Codex 正在从代码助手变成开发智能体传统 AI 编程工具的核心能力是生成代码。用户提出需求，AI 给出代码片段，开发者再自己复制、运行、调试和验证。而新版 Codex 的方向更接近开发智能体。所谓开发智能体，不只是会生成代码，而是能够围绕一个开发目标，主动完成多个连续动作：读取项目文件；理解代码结构；修改代码；运行终端命令；打开页面；复现问题；检查界面；验证修复结果；根据反馈继续调整。也就是说，Codex 的价值正在从"生成代码"扩展为"完成开发任务"。这背后最关键的变化，就是它开始具备操作电脑和观察网页的能力。二、什么是 Computer Use？ Computer Use 可以理解为一种让 AI 像人一样使用电脑界面的技术。它不是简单调用 API，也不是只在编辑器里生成文本，而是让模型通过屏幕画面理解当前环境，并通过鼠标、键盘等方式执行操作。它的基本能力包括：看屏幕：识别当前界面中的按钮、输入框、菜单、弹窗和错误提示；理解任务：根据用户目标判断下一步应该做什么；执行操作：点击、输入、滚动、切换窗口、打开应用；观察反馈：根据界面变化判断任务是否完成；持续迭代：如果没有完成，就继续调整下一步操作。可以用一句话概括： ...

Superpowers 14 个 Skills 全解读：AI 编程纪律框架的完整拆解

Superpowers 14 个 Skills 全解读：AI 编程纪律框架的完整拆解最核心的价值不是某个单独 skill，而是这条链路：需求澄清 → 设计确认 → 计划拆解 → 隔离开发 → TDD → review → 验证 → 收尾这条链路正好针对 AI coding 最常见的失败模式：过早实现、缺少测试、猜测修复、跳过验证、过早宣布成功。注意：要经常更新 skills 的代码版本和自己结合实际使用，将自己的经验和要求增加到 skills，以便更好的编程和业务准确性，最好是将自身业务的要求单独作为 skills 引入到编程工具里。 Superpowers 是一个给 AI 编程 Agent 的完整软件开发方法论，由一组可组合 skills 和初始指令组成。它的基本工作流是：先澄清需求、写设计、写实施计划、TDD 实现、代码审查、验证、最后合并/PR/清理。该不该装？三层判断层面判断技术层面不必须。没有它，AI coding agent 也能写代码。工程质量层面对复杂项目，强烈建议。它强制 TDD、审查、验证，能减少"AI 自信但没验证"的问题。 Superpowers 自身规则层面一旦安装并启用，它的 using-superpowers 明确要求：只要有 1% 可能适用，就必须先调用相关 skill；README 也说这些是 mandatory workflows, not suggestions。我的建议：重项目安装，轻任务选择性使用；团队协作/生产代码建议默认启用；纯探索、一次性原型可以不用或显式绕开。 1. using-superpowers — 入口规则这个 skill 不是某个开发动作，而是**"调度所有 skills 的总开关"**。它要求 agent 在任何任务开始前先判断是否有相关 skill；只要有一点可能适用，就要先调用 skill，而不是凭经验直接干。它还规定了优先级：用户明确指令最高，Superpowers skills 其次，默认系统行为最低。 ...

我用 Superpowers 治好了 AI 写代码的'急躁症'

我用 Superpowers 治好了 AI 写代码的"急躁症" 你有没有这种经历？跟 AI 说一句"帮我加个登录功能"，它三秒钟就开始生成代码了。你还没来得及说"我要 OAuth 不要密码登录"，它已经把整个 auth 模块写完了。跑一下，报错。让它修，改了三处引入两个新 bug。再改，需求理解全歪了。折腾一小时，还不如自己写。问题不在 AI 笨——现在的 Claude、GPT 编程能力已经很强了。问题是它太急了。还没搞清楚你要什么，就急着动手。没有设计，没有测试，没有验证，凭着"感觉"改代码，改完说一句"看起来没问题"就算完成。我最近发现了一个开源项目，专门治这个毛病。 Superpowers 是什么 Superpowers 是一个给 AI 编程 Agent 装的插件。它不改变模型能力，而是给 Agent 加了一套强制执行的开发流程。你可以把它理解为：一个严厉但好心的技术 Lead，站在 AI 后面盯着它—— "停，先搞清楚需求再写代码。" "计划呢？计划写好再动手。" "测试呢？测试先写，代码后写。" "代码审查过了吗？没过不许继续。" 它由 Jesse Vincent（Prime Radiant 公司）开发，目前版本 v5.1.0，MIT 协议。支持 Claude Code、Codex CLI、Gemini CLI、Cursor、GitHub Copilot CLI 等主流 AI 编程工具。实际用起来是什么体验装上 Superpowers 之后，你和 AI 的交互模式会完全不一样。我用一个实际场景走一遍。场景：让 AI 帮你做一个用户通知系统没有 Superpowers 时，对话通常是这样的：你：帮我做一个通知系统 AI：（立刻开始写代码）我创建了一个 NotificationService…… 你：等一下，我要邮件通知，不是站内信 AI：好的，我重新写…… 你：还需要支持批量发送 AI：我再加一个…… ...

我的AI模型使用情况分享：从云厂商到编程Agent的实战体验

我的AI模型使用情况分享首先，大多数国内云厂商和模型服务商的模型我都接入和使用过，以下是根据实际体验得出的算力服务上自测评价，排序靠前说明体验感和实际使用效果很好；我的模型体感（云厂商和模型商）主要以稳定性、模型质量、使用体验为主的主观描述，国外模型不在表单里，因为属于算力能力和模型能力双领先；排名平台我的推荐理由我的使用劣势感受 1 火山引擎 / 火山方舟我会把它作为线上生产环境的首选，尤其适合需要低延迟、高稳定性和持续调用的业务。我觉得它的优势主要集中在生产稳定性上，如果追求极限低价，可能不是最便宜的选择。 2 阿里云百炼我会把它作为企业级 AI 应用和多模型生态的主力平台，尤其适合需要工具链、Batch、长上下文和模型管理的场景。我觉得它的产品体系比较完整，但也相对复杂，上手和配置成本会比单一 API 平台高一些。 3 DeepSeek 官方我会把它作为低成本、高性价比调用 DeepSeek 模型的首选，适合大批量、成本敏感的任务。我在高峰期可能会担心它的稳定性和响应速度，所以不一定会把它单独作为核心生产依赖。 4 腾讯云我会把它作为腾讯云生态内项目的补充选择，尤其适合已经在腾讯云上部署业务的场景。我觉得它在价格和综合体验上不算最突出，如果没有腾讯云生态绑定，吸引力会弱一些。 5 硅基流动我会把它作为模型试验和多模型切换的平台，适合快速测试不同开源模型和低成本方案。我觉得它更适合测试和非实时任务，强实时生产场景下我会更谨慎。 6 MiniMax 官方我会在长上下文、多模态、语音或特定 MiniMax 模型能力上优先考虑它。我不会把它作为通用推理 API 的第一主力，因为平台综合稳定性和生态证据不如火山、阿里这类云厂商充分。 7 智谱 GLM 官方我会在中文场景、长上下文、工具调用和国产模型适配上考虑 GLM。我觉得它的模型能力有特色，但公开的第三方平台级压测资料相对不足，所以生产主力选择上我会保守一些。 8 天翼云息壤我会在政企、国产化、合规、央国企或电信体系项目里优先考虑它。我觉得它更偏政企交付和合规场景，作为个人开发者或互联网产品的主力 API，体验和灵活度可能不是最优，当前缺失缓存机制，成本很高且模型上下文窗口阉割和算力不足。我的主力模型 gpt + glm5.1 企业使用：火山放在线上实时调用、Agent 后端、需要稳定低延迟的任务；阿里放企业生态、Qwen、百炼工作流、Batch、长上下文和多模型兜底个人使用： Claude/Codex 更像"会干活的工程师" 或智谱的coding plans 政企客户：尤其是电信、政务、金融、央国企场景，息壤价值在合规、国产算力、专网和交付，但个人开发者不推荐国内模型模型自测排行 GLM5.1（推荐，中等难度编程或自主任务执行） DeepSeek v4（可以赶上GLM5.1） MiniMax 2.7（在复杂任务执行，效果欠佳，比如openclaw的agent自主任务） Seedance 2.0（推荐，视频质量还可以，够用） MiniMax 2.5 和 GLM5（仅适合简单任务）豆包 = 千问 > 元宝（网页使用推荐前2个）模型用量数据我的智谱AI，开通的是季度lite套餐，月度使用量截止到现在是31亿tokens； ...

老板们，公司有在用OpenAI GPT-5.5吗？员工必须用上codex！

老板们，公司有在用OpenAI GPT-5.5吗？员工必须用上codex！最近很多公司在问：OpenAI GPT-5.5 来了，我们公司要不要赶紧用上？我的建议是：用，但不是让员工去用 ChatGPT 聊天，而是必须把 Codex 集成进开发流程！什么是 Codex？ Codex 是 OpenAI 专门为代码任务优化的大模型，是 GPT-5.5 系列中的"程序员专属版本"。它不是用来聊天的，是直接嵌入到你的 IDE、CI/CD 流水线、代码审查系统里的。为什么老板们必须重视？效率提升 3-5 倍：重复性代码、单元测试、代码审查，AI 帮你搞定减少低级 Bug：Codex 可以在提交前自动检查常见错误加速新人上手：新人问 AI 比问老员工更快，项目启动速度翻倍怎么落地？不是让每个人去开一个 ChatGPT 账号，而是： DevOps 集成：把 Codex 接到 GitLab/GitHub Actions，代码提交自动审查 IDE 插件：给团队装上 Cursor、Windsurf 等 AI 编程工具内部知识库：把公司代码规范、架构文档喂给 AI，做成本地化的编码助手老板们的行动清单 ✅ 现在就评估团队目前的 AI 工具使用情况 ✅ 联系技术负责人，规划 Codex 集成路线图 ✅ 先从 1-2 个项目试点，看看效率提升数据 ✅ 3 个月后复盘，决定是否全面推广结论：GPT-5.5 不可怕，可怕的是你的竞争对手用上了 Codex，你还在手动写代码。赶紧动起来！