阿里巴巴发布Qwen3.5中型系列模型量化版可在24GB内存/显存的上本地运行

推广

#人工智能阿里巴巴通义千问团队发布并开源 Qwen3.5 中型系列模型，不再单纯追求参数规模，而是以更小规模实现更高的质量。基准测试显示 Qwen3.5-35B-A3B 版性能超越 Qwen3-235B-A22B-2507，这表明更好的架构、数据质量和强化学习可以推动智能进步，而不是非得依赖更大的参数量。另外量化版本可以在仅有 24GB 内存 / 显存的设备上本地运行。查看全文：https://ourl.co/111914

阿里巴巴通义千问团队日前宣布推出 Qwen3.5 中型系列模型，该系列模型的核心理念是以更少的算力实现更高的智能，即不再单纯追求参数规模，而是通过优化模型架构、数据质量和强化学习来提升实际性能。

在发布公告中通义千问团队称，Qwen3.5-35B-A3B 在多项基准测试中已经超越此前参数规模更大的 Qwen3-235B-A22B-2507 和 Qwen3-VL-235B-A22B。

这个测试结果表明更好的架构、数据质量和强化学习可以推动智能进步，而不需要非得依赖于更大参数量，这也意味着未来我们可能可以在性能较低的普通电脑上运行这些本地模型。

新发布的模型如下：

Qwen3.5-35B-A3B：采用 MoE 混合专家架构，总参数为 35B，激活参数为 3B。该模型在复杂推理、多语言理解和多模态任务中表现出色，尤其是在智能体场景下与更大规模模型形成有效竞争。

Qwen3.5-122B-A10B：总参数为 122B，激活参数为 10B，定位为中大型模型，重点优化复杂智能体任务和长上下文处理能力，继续缩小中型规模与前言模型之间的差距。

Qwen3.5-27B：该模型属于纯稠密模型，适合本地部署和在资源受限的环境中部署，在保持较高性能的同时显著降低推理成本。

Qwen3.5-Flash：托管生产版本，该版本与 Qwen3.5-35B-A3B 对齐，默认支持 1M 上下文长度并内置官方工具调用能力，适合企业级 API 调用和实时应用场景。

基准测试表现如下：

目前这些新发布的模型均在 HuggingFace 和 ModelScope 中发布，所有模型均为开源模型，任何个人和企业均可下载模型微调或直接使用，当然也不限于竞争产品使用这些模型蒸馏和改进自己的模型。

GGUF 量化版可在 24GB 内存 (包括显存) 的设备上运行：

阿里巴巴也同样为知名模型量化团队 Unsloth AI 提供首日权限让该团队可以提前进行量化，经过量化的版本可以在包含 24GB 内存 / 显存的设备上本地运行，这可以显著降低个人开发者、研究机构和中小企业的模型运行成本。

有关量化版本的相关信息请查看：https://unsloth.ai/docs/models/qwen3.5