字数 389,阅读大约需 2 分钟
工作提效:Qwen3系列大型语言模型
https://mp.weixin.qq.com/s/OvobsCPW0IwxeSm8pljv-A[]()
“我们的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。” by 阿里云
亮点
Qwen3 模型支持两种思考模式:
思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
实践
在cursor使用qwen3如下:
Q:当前大模型的版本号
A:你提到的大模型版本号通常有以下几种含义,具体取决于你的应用场景:
1️⃣ 如果你在使用通义千问(Qwen)
目前我基于 qwen3-235b-a22b 模型版本(此为内部标识符)。实际版本号由阿里云平台管理,终端用户通常无法直接修改或查询详细版本号。
查看方式:
若通过阿里云百炼平台调用,可在模型详情页查看版本编号
开源版本可通过 pip show qwen 查看本地安装包版本(如存在)
计费
180天免费额度
评论区