DeepSeek

我的AI模型使用情况分享：从云厂商到编程Agent的实战体验

我的AI模型使用情况分享首先，大多数国内云厂商和模型服务商的模型我都接入和使用过，以下是根据实际体验得出的算力服务上自测评价，排序靠前说明体验感和实际使用效果很好；我的模型体感（云厂商和模型商）主要以稳定性、模型质量、使用体验为主的主观描述，国外模型不在表单里，因为属于算力能力和模型能力双领先；排名平台我的推荐理由我的使用劣势感受 1 火山引擎 / 火山方舟我会把它作为线上生产环境的首选，尤其适合需要低延迟、高稳定性和持续调用的业务。我觉得它的优势主要集中在生产稳定性上，如果追求极限低价，可能不是最便宜的选择。 2 阿里云百炼我会把它作为企业级 AI 应用和多模型生态的主力平台，尤其适合需要工具链、Batch、长上下文和模型管理的场景。我觉得它的产品体系比较完整，但也相对复杂，上手和配置成本会比单一 API 平台高一些。 3 DeepSeek 官方我会把它作为低成本、高性价比调用 DeepSeek 模型的首选，适合大批量、成本敏感的任务。我在高峰期可能会担心它的稳定性和响应速度，所以不一定会把它单独作为核心生产依赖。 4 腾讯云我会把它作为腾讯云生态内项目的补充选择，尤其适合已经在腾讯云上部署业务的场景。我觉得它在价格和综合体验上不算最突出，如果没有腾讯云生态绑定，吸引力会弱一些。 5 硅基流动我会把它作为模型试验和多模型切换的平台，适合快速测试不同开源模型和低成本方案。我觉得它更适合测试和非实时任务，强实时生产场景下我会更谨慎。 6 MiniMax 官方我会在长上下文、多模态、语音或特定 MiniMax 模型能力上优先考虑它。我不会把它作为通用推理 API 的第一主力，因为平台综合稳定性和生态证据不如火山、阿里这类云厂商充分。 7 智谱 GLM 官方我会在中文场景、长上下文、工具调用和国产模型适配上考虑 GLM。我觉得它的模型能力有特色，但公开的第三方平台级压测资料相对不足，所以生产主力选择上我会保守一些。 8 天翼云息壤我会在政企、国产化、合规、央国企或电信体系项目里优先考虑它。我觉得它更偏政企交付和合规场景，作为个人开发者或互联网产品的主力 API，体验和灵活度可能不是最优，当前缺失缓存机制，成本很高且模型上下文窗口阉割和算力不足。我的主力模型 gpt + glm5.1 企业使用：火山放在线上实时调用、Agent 后端、需要稳定低延迟的任务；阿里放企业生态、Qwen、百炼工作流、Batch、长上下文和多模型兜底个人使用： Claude/Codex 更像"会干活的工程师" 或智谱的coding plans 政企客户：尤其是电信、政务、金融、央国企场景，息壤价值在合规、国产算力、专网和交付，但个人开发者不推荐国内模型模型自测排行 GLM5.1（推荐，中等难度编程或自主任务执行） DeepSeek v4（可以赶上GLM5.1） MiniMax 2.7（在复杂任务执行，效果欠佳，比如openclaw的agent自主任务） Seedance 2.0（推荐，视频质量还可以，够用） MiniMax 2.5 和 GLM5（仅适合简单任务）豆包 = 千问 > 元宝（网页使用推荐前2个）模型用量数据我的智谱AI，开通的是季度lite套餐，月度使用量截止到现在是31亿tokens； ...

【AI前沿观察】2026-05-10 日报

【AI前沿观察】2026-05-10 日报自动生成于 2026-05-10 23:00 📊 今日推送概览共推送 19 条重要资讯，创单日推送量新高。今日主线有三： OpenAI 产品大爆发——七项更新齐发，从 Agent 安全到广告商业化全覆盖 Q1 财报季收官——四大科技巨头 AI Capex 合计 $725B 创纪录，Google Cloud 63% 增速成最大亮点 AI 竞争格局剧变——中国大模型调用量首超美国，Anthropic 年化收入超越 OpenAI，英伟达中国市场份额归零 🔵 AI 领域 Running Codex safely at OpenAI 事实：OpenAI 详细阐述了 Codex 编程 Agent 的安全部署框架。核心设计包括：沙盒执行边界（限制写入路径、网络访问）、分级审批策略（低风险自动通过，高风险需人工确认）、Auto-review 子代理（自动审批常规请求减少中断），以及代理原生遥测日志。思考：标志着 AI Agent 从"能用"到"敢用"的关键转变。把沙盒、审批、日志三大机制系统性整合，本质上是在做 AI Agent 的"企业安全合规操作系统"。Auto-review 子代理——用 AI 审批 AI——的设计尤其巧妙，将成为所有 Agent 产品的标配。 Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber 事实：OpenAI 发布 GPT-5.5-Cyber 网络安全专用模型，以限量预览形式提供给关键基础设施安全团队。同时推出 Trusted Access for Cyber（TAC）信任框架，基于身份验证和信任分级让防御者获得增强能力。思考：AI 行业"负责任能力释放"的标杆案例。身份验证 + 信任分级 + 能力分层的三重架构，比简单的"全开放"或"全封闭"都成熟得多，可能成为 AI 安全分发的行业标准模式。 Advancing voice intelligence with new models in the API 事实：发布三个语音 API 模型：GPT-Realtime-2（首个搭载 GPT-5 级推理能力的语音模型）、GPT-Realtime-Translate（实时翻译，70+ 输入语言到 13 种输出语言）、GPT-Realtime-Whisper（流式语音转文本）。思考：语音正在成为 AI 交互主战场。OpenAI 不是升级一个模型，而是把语音交互全链路产品化——转录、翻译、对话推理三位一体。GPT-Realtime-2 搭载 GPT-5 级推理意味着语音对话终于可以"边想边说"。2026 下半年可能迎来语音 AI 应用爆发。 Introducing Trusted Contact in ChatGPT 事实：ChatGPT 推出"信任联系人"功能，当系统检测到用户可能讨论自我伤害等严重安全问题时，可通知用户提前指定的信任联系人。功能可选，不替代专业心理危机服务。思考：AI 产品责任感的具体体现。把"社会连接"这个心理学中最有效的自杀预防保护因素，以产品设计的形式嵌入 AI 系统。可能在 AI 行业开创先例——AI 产品不仅是工具，也是用户福祉的守护者。 GPT-5.5 Instant：更智能、更清晰、更个性化事实：OpenAI 推出 GPT-5.5 Instant 快速对话模型。核心升级：幻觉大幅减少（事实准确性显著提升）、回答结构更清晰、支持个性化记忆。思考：命名暗示 OpenAI 已形成完整产品矩阵——Opus 做重度推理，标准 GPT-5.5 做通用任务，Instant 做快速对话。幻觉减少直接决定 AI 能否被信任用于生产环境。前沿企业如何拉开差距 — B2B Signals 事实：OpenAI 推出 B2B Signals 商业智能信号平台，帮助企业识别 AI 在其行业中的采用趋势、竞对动态和最佳实践。结合 Codex Agent 形成"洞察→决策→执行"闭环。思考：不只是数据分析工具，更是"行业 AI 采用的雷达"。信息差本身就是巨大的商业价值。OpenAI 正在构建从"看到机会"到"抓住机会"的端到端企业 AI 平台。中国大模型周调用量首超美国事实：OpenRouter 数据显示，中国大模型周调用量达 7.94 万亿 Token，环比增长 81.7%，全球前五大模型中中国占四席，总占比达 85.7%。思考：这是一个里程碑式的数据。中国在 AI 应用层的规模优势正在转化为真正的市场力量。调用量不等于营收，但当你的产品被用得越多，迭代速度就越快，飞轮效应就越强。黄仁勋确认英伟达中国市场份额归零事实：英伟达 CEO 黄仁勋确认，受美国出口管制影响，英伟达在中国的市场份额已经归零。他警告这将拖慢全球 AI 部署进度。思考：英伟达中国份额归零不是英伟达的失败，而是地缘政治对全球科技产业切割的极端案例。中国 GPU 市场的空白将被华为昇腾、摩尔线程等国产替代加速填补。深圳耀光超算的发布就是例证。 Anthropic 年化收入首超 OpenAI 事实：Reuters 报道，Anthropic 年化收入达到 $90 亿，首次超过 OpenAI 的 $80-85 亿。Anthropic 推理毛利率达 70%，正寻求融资 500 亿美元。思考：这个数据点改写了行业叙事。长期以来 Anthropic 被视为"老二"，但凭借企业级 API 业务的高毛利，在收入上实现了反超。说明 AI 市场不是一个赢者通吃的游戏，企业级市场的付费意愿远高于消费者市场。 DeepSeek 多模态论文 + 灰度测试事实：DeepSeek 发布多模态论文，识图功能开启灰度测试。华为昇腾平台已全面支持 DeepSeek V4 模型。思考：DeepSeek 正在从"纯文本模型"进化为"全模态模型"。与华为昇腾的深度绑定意味着中国 AI 产业链正在形成"国产模型 + 国产算力"的闭环。 xAI 发布 Grok 4.3 降价六成事实：xAI 发布 Grok 4.3，输入 $1.25/输出 $2.50 每百万 token，较此前降价约 60%。代理任务 Elo 评分提升 321 分。思考：价格战继续升级。xAI 的激进定价策略直接对标 OpenAI 和 Anthropic，通过低价抢夺开发者生态。代理任务 Elo +321 说明不只是便宜，能力也在提升。 🟠 半导体 SEMI：全球芯片需求强劲，2026 年达 $1 万亿事实：SEMI 报告指出全球芯片需求持续强劲，预计 2026 年市场规模达 $1 万亿，2035 年达 $2 万亿。东南亚需要大幅扩产以满足需求。思考：$1 万亿意味着半导体正式进入"万亿产业"时代。AI 是最大驱动力，但供应端的瓶颈同样明显——制造产能、先进封装、电力供应都是约束。东南亚成为新的产能扩张焦点，地缘政治推动供应链多元化。深圳超算发布耀光 LineShine 事实：深圳超算中心发布耀光 LineShine 超级计算机，采用 100% 国产 CPU，零英伟达 GPU，算力剑指全球前列。思考：这是中国"去英伟达化"的标志性成果。在英伟达中国市场份额归零的背景下，耀光 LineShine 证明了中国在高性能计算领域的自主替代能力已经从"可用"走向"好用"。对中国超算和 AI 基础设施产业意义深远。 🟡 AI 货币化四大科技巨头 2026 年 AI Capex 创纪录 $725B 事实：四大科技巨头（Microsoft、Amazon、Meta、Alphabet）2026 年 AI 资本支出合计 $7250 亿，同比增长 77%。其中 Microsoft $250 亿的增长归因于芯片涨价。思考：$7250 亿是一个令人震惊的数字。四个公司一年在 AI 基础设施上的投入超过了很多国家的 GDP。核心问题是：这些投入的 ROI 什么时候能兑现？目前只有 Google Cloud 的 63% 增速给出了一个相对正面的回答。 Alphabet Q1 2026：Cloud 收入 $20B（+63%），backlog $462B 事实：Google Cloud 首次单季收入突破 $200 亿，同比增长 63%。GenAI 产品收入增长 800%。云业务 backlog 达 $4620 亿。盘后股价上涨 7%。思考：Google Cloud 63% 的增速是本次财报季最大的亮点，也是对 AI Capex 投入最强有力的验证。GenAI 收入 +800% 说明 Google 终于找到了 AI 变现的节奏——从搜索广告的增量到云服务的 AI 增值，两条腿走路。 Microsoft Q3 FY2026：Azure 重回 40% 增长，Copilot 2000 万付费席位事实：Azure 增速重回 40%，Copilot 付费席位突破 2000 万。取消 OpenAI 分润，Capex 达 $1900 亿。Maia 200 自研 AI 芯片开始部署。思考：取消 OpenAI 分润是一个重要信号——Microsoft 正在从"依赖 OpenAI"转向"多模型战略"。Copilot 2000 万付费席位说明企业 AI 工具的 PMF（产品市场匹配）正在验证。$1900 亿 Capex 背后是 Maia 自研芯片的战略意图：降低对英伟达的依赖。 Meta 上调 Capex 至 $125-145B，盘后跌 6% 事实：Meta 上调 2026 年 Capex 指引至 $1250-1450 亿，盘后股价下跌 6%。Zuckerberg 在财报电话会上关于 AI 投入 ROI 的回答未能安抚投资者。思考：Meta 是四大巨头中唯一因 AI 投入遭抛售的公司，核心原因是 ROI 叙事模糊。不同于 Google 有 Cloud 收入验证、Microsoft 有 Copilot 付费席位，Meta 的 AI 投入主要服务于广告效率提升，这种"间接变现"让投资者难以量化。Zuckerberg 需要一个更清晰的 AI 变现故事。 CoreWeave Q1：收入 $2.1B（+112%），净亏损扩至 $740M 事实：AI 云服务商 CoreWeave Q1 收入 $21 亿，同比增长 112%，但净亏损扩大至 $7.4 亿。Q2 指引不及预期。Backlog 达 $994 亿。思考：CoreWeave 的"增收不增利"揭示了 AI 基础设施层的一个深层问题——GPU 云是一门资本密集型生意，收入增长被折旧和利息支出吞噬。$994 亿 backlog 说明需求不缺，但利润模型的可持续性存疑。 Testing ads in ChatGPT 事实：ChatGPT 广告试点扩展至英国、墨西哥、巴西、日本和韩国。早期数据：用户信任指标未受影响、广告关闭率低、相关性持续改善。广告仅面向 Free 和 Go 层用户。思考：ChatGPT 周活超 5 亿，如果广告模式跑通，这将是继 Google 搜索广告之后最大的注意力变现平台。"回答不受广告影响"和"对话对广告商保密"是正确的底线。AI 对话广告的 CPM 水平将决定 OpenAI 的估值天花板。 🟣 具身智能今日无具身智能专项推送（昨日推送了 Zeroth M1 接入腾讯 OpenClaw、Dobot ISO 认证等 5 条）。 ...

DeepSeek V4：百万上下文 + 最高峰离线推理

发布时间：2026‑04‑24 模型名：deepseek‑v4‑pro / deepseek‑v4‑flash 上下文：1 M token（百万级）核心技术：混合注意力、多维压缩、流形约束超连接、Muon优化器 1️⃣ 一览版本参数量激活量目标亮点 V4‑Pro 1.6 T 49 B 最高端开源模型 V4‑Flash 284 B 13 B 极致效率/低成本备注：两版均支持 1 M token 上下文，思考模式 (reasoning‑effort) 可调高/把握成本。 2️⃣ 技术回顾 2.1 混合注意力机制（CSA + HCA） CSA：在 KV 维度进行 4 : 1 压缩，结合 DSA 稀疏注意力，利用 Lightning‑Indexer 仅保留 top‑1024 KV 项。 HCA：压缩率 128 : 1，全部 KV 参与计算，滑动窗口‐512 tokens 跨层捕捉全局依赖。优势：相比前代仅 27 % 的算力、10 % 的 KV 缓存，显存与训练成本大幅下降。 2.2 流形约束超连接（mHC）采用双随机矩形流形（Birkhoff‑Polytope）约束残差映射，确保谱范数 ≤ 1，信息在深层网络不发散，训练稳定性上升 6.7 % 成本。 2.3 Muon 优化器对梯度动量进行 Newton‑Schulz 正交化，10 次混合迭代实现快速收敛。结合 Anticipatory‑Routing 与 SwiGLU‑Clamping，进一步提升训练速度与模型收敛稳定性。 3️⃣ 性能表现指标 V3‑2 V4‑Pro V4‑Flash Agent‑Coding 开源前列最高接近 Pro 世界知识较差仅微距差距次佳推理速度 1.43× 3.80× 4.14× 1M KV 缓存 49 B 6.2 B 5.5 B 结论：V4‑Pro 以与 Gemini‑Pro‑3.1 并驾齐驱的性能，处理复杂 Agent 任务如代码生成、文档翻译等表现尤为出色；V4‑Flash 则以 13 B 激活实现极低成本、最快速度的 1 M‑上下文使用场景。 ...

AI用户的好基座模型：超强的Agent能力和思考推理的DeepSeek V3.2

超强的Agent能力和思考推理：DeepSeek V3.2 12月01日，deepseek发布了2款新模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。对比结果相当惊艳，我们可以低成本的推理获得高质量的输出。DS为AI创业者带来越来越好的基座模型。官方原文：https://mp.weixin.qq.com/s/ohsU1xRrYu9xcVD7qu5lNw?click_id=2 评测得分 DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分（括号内为消耗 Tokens 总量约数）模型场景 DeepSeek-V3.2 的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通用 Agent 任务场景。 DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致，探索模型能力的边界。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版，同时结合了 DeepSeek-Math-V2 的定理证明能力。DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致，探索模型能力的边界。V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版，同时结合了 DeepSeek-Math-V2 的定理证明能力。思考模式 DeepSeek-V3.2 思考模式下的工具调用能力！非常重要的功能。模型名称：deepseek-reasoner，思考模式未充分适配 Cline、RooCode 等使用非标准工具调用的组件。如何使用 **模型使用：官网，app，API都是V3.2，不管怎么用都是V3.2，通过参数控制是否启用深度思考！谢谢关注收藏 ⏰ 刚刷到的朋友注意啦！点击【关注】锁定宝藏库，从此升职加薪不迷路 ✨ 我的投资理财博客：MakeMoney，https://funkygod.vip/ 我的技术分享博客：Tesla，https://funkygod.vip/ 轻量云主机限时优惠 RackNerd ☁ 主机显示特惠：只要80元（3TB流量，1vcpu，50GB硬盘）购买地址：https://my.racknerd.com/aff.php?aff=14942 CloudCone CloudCone 特惠轻量云主机：购买地址：https://app.cloudcone.com/?ref=12332 📢 腾讯云资源限时福利有云服务器、CDN、对象存储、网络防护等需求的朋友，欢迎联系下方腾讯云官方销售 👇 ✔️ 内部专属折扣，价格更优 ✔️ 量大可谈，支持定制方案 ✔️ 技术咨询与售后无忧