工作提效：Qwen3系列大型语言模型

https://mp.weixin.qq.com/s/OvobsCPW0IwxeSm8pljv-A[]()
“我们的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出极具竞争力的结果。此外，小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。” by 阿里云

亮点

Qwen3 模型支持两种思考模式：

思考模式：在这种模式下，模型会逐步推理，经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。

非思考模式：在此模式中，模型提供快速、近乎即时的响应，适用于那些对速度要求高于深度的简单问题。

实践

在cursor使用qwen3如下：

Q：当前大模型的版本号

A：你提到的大模型版本号通常有以下几种含义，具体取决于你的应用场景：
1️⃣ 如果你在使用通义千问（Qwen）
目前我基于 qwen3-235b-a22b 模型版本（此为内部标识符）。实际版本号由阿里云平台管理，终端用户通常无法直接修改或查询详细版本号。
查看方式：
若通过阿里云百炼平台调用，可在模型详情页查看版本编号
开源版本可通过 pip show qwen 查看本地安装包版本（如存在）

计费

180天免费额度

目录CONTENT

工作提效：Qwen3系列大型语言模型

工作提效：Qwen3系列大型语言模型

亮点

实践

计费

评论区