智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务
好的,我现在需要帮用户总结一篇文章的内容,控制在100字以内。首先,我得仔细阅读用户提供的文章内容,了解主要信息。 文章主要讲的是智谱发布了GLM-5模型,这是一个旗舰级模型,参数规模提升到7440亿,活跃参数400亿。它在系统工程和长时任务上表现优异,性能超过其他开源模型,接近Claude Opus 4.5。此外,模型使用了稀疏注意力机制和新的强化学习基础设施slime,降低了部署成本,并且开源发布。 接下来,我需要提取关键点:GLM-5的发布、参数提升、性能优势、技术改进(稀疏注意力机制和slime)、开源信息。然后把这些点浓缩成一段话,不超过100字。 要注意用词简洁准确,避免重复。例如,“显著优于”可以表达性能提升,“开源”说明可用性。最后检查字数是否符合要求。 </think> 智谱发布GLM-5旗舰模型,参数规模达7440亿(活跃参数400亿),显著提升复杂系统工程和长时智能体任务性能,在基准测试中超越其他开源模型并缩小与前沿模型差距。集成稀疏注意力机制和新型强化学习基础设施slime,优化部署成本与训练效率。GLM-5以MIT许可证开源发布。 2026-2-12 02:49:41 Author: www.landiannews.com(查看原文) 阅读量:2 收藏

推广

推广

#人工智能 智谱发布并开源最新的旗舰模型 GLM-5,旨在应对复杂系统工程任务和长时域智能体任务,参数规模提升到 744B (活跃参数为 40B)。在各项基准测试中 GLM-5 显著优于其他开源模型并缩小与前沿模型之间的差距,在前端、后端、长时域任务中缩小与 Claude Opus 4.5 的差距,GLM-5 继续以 MIT 许可证开源发布,任何个人和企业均可获取模型并使用。查看全文:https://ourl.co/111812

人工智能开开发商智谱日前宣布推出 GLM-5 模型,这是智谱最新推出的旗舰级模型,旨在应对复杂的系统工程和长时域智能体任务,扩展性仍然是提升通用人工智能 (AGI) 智能效率的关键途径之一。

与此前的版本例如 GLM-4.5 相比,新旗舰模型的参数规模从 3,550 亿 (使用的活跃参数为 320 亿) 扩展到 7,440 亿 (使用的活跃参数为 400 亿),预训练数据量也从 23 万亿个 token 增加到 28.5 万亿个 token。

此外智谱还对 GLM-5 进行改进并集成深度求索 DeepSeek 模型使用的稀疏注意力机制 (DSA),在显著降低部署成本的同时,依然保持长时域上下文的处理能力。

强化学习旨在弥合预训练模型在胜任力和卓越性之间的差距,然而由于强化学习训练效率低下,将其大规模部署到底层逻辑模型中面临挑战,所以智谱开发了名为 slime 的新型异步强化学习基础设施,这可以显著提高训练吞吐量和效率,从而能够进行更细粒度的训练后迭代。

凭借在训练前和训练后两方面的同时进步,GLM-5 在众多学术基准测试中相比 GLM-4.7 取得显著提升,在推理、编码和智能体任务上取得全球所有开源模型中的最佳性能,缩小与前沿模型之间的差距。

智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务

GLM-5 专为复杂系统工程和长时域智能体任务而设计,在智谱的内部评估套件 CC-Bench-V2 中,GLM-5 在前端、后端和长时域任务上均显著优于 GLM-4.7,同时缩小了与 Claude Opus 4.5 之间的差距。

智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务

在衡量长期运营能力的基准测试 Vending Bench 2 中,GLM-5 在开源模型中排在榜首,该基准测试要求模型模拟自动售货机业务运行一年,GLM-5 的最终账户余额为 4432 美元,超越 GPT-5.2,接近 Claude Opus 4.5 的水平,展现其强大的长期规划和资源管理能力。

智谱发布并开源新旗舰模型GLM-5 旨在应对复杂系统工程和长时域智能体任务

目前 GLM-5 系列模型已经在 HuggingFace 和 ModelScope 上开源,模型权重以 MIT 许可证发布,GLM-5 也可以在 api.z.ai 以及 bigmodel.cn 上获取,兼容 Claude Code 和 OpenClaw。


文章来源: https://www.landiannews.com/archives/111812.html
如有侵权请联系:admin#unsafe.sh