智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务

推广

#人工智能智谱发布并开源最新的旗舰模型 GLM-5，旨在应对复杂系统工程任务和长时域智能体任务，参数规模提升到 744B (活跃参数为 40B)。在各项基准测试中 GLM-5 显著优于其他开源模型并缩小与前沿模型之间的差距，在前端、后端、长时域任务中缩小与 Claude Opus 4.5 的差距，GLM-5 继续以 MIT 许可证开源发布，任何个人和企业均可获取模型并使用。查看全文：https://ourl.co/111812

人工智能开开发商智谱日前宣布推出 GLM-5 模型，这是智谱最新推出的旗舰级模型，旨在应对复杂的系统工程和长时域智能体任务，扩展性仍然是提升通用人工智能 (AGI) 智能效率的关键途径之一。

与此前的版本例如 GLM-4.5 相比，新旗舰模型的参数规模从 3,550 亿 (使用的活跃参数为 320 亿) 扩展到 7,440 亿 (使用的活跃参数为 400 亿)，预训练数据量也从 23 万亿个 token 增加到 28.5 万亿个 token。

此外智谱还对 GLM-5 进行改进并集成深度求索 DeepSeek 模型使用的稀疏注意力机制 (DSA)，在显著降低部署成本的同时，依然保持长时域上下文的处理能力。

强化学习旨在弥合预训练模型在胜任力和卓越性之间的差距，然而由于强化学习训练效率低下，将其大规模部署到底层逻辑模型中面临挑战，所以智谱开发了名为 slime 的新型异步强化学习基础设施，这可以显著提高训练吞吐量和效率，从而能够进行更细粒度的训练后迭代。

凭借在训练前和训练后两方面的同时进步，GLM-5 在众多学术基准测试中相比 GLM-4.7 取得显著提升，在推理、编码和智能体任务上取得全球所有开源模型中的最佳性能，缩小与前沿模型之间的差距。

GLM-5 专为复杂系统工程和长时域智能体任务而设计，在智谱的内部评估套件 CC-Bench-V2 中，GLM-5 在前端、后端和长时域任务上均显著优于 GLM-4.7，同时缩小了与 Claude Opus 4.5 之间的差距。

在衡量长期运营能力的基准测试 Vending Bench 2 中，GLM-5 在开源模型中排在榜首，该基准测试要求模型模拟自动售货机业务运行一年，GLM-5 的最终账户余额为 4432 美元，超越 GPT-5.2，接近 Claude Opus 4.5 的水平，展现其强大的长期规划和资源管理能力。

目前 GLM-5 系列模型已经在 HuggingFace 和 ModelScope 上开源，模型权重以 MIT 许可证发布，GLM-5 也可以在 api.z.ai 以及 bigmodel.cn 上获取，兼容 Claude Code 和 OpenClaw。