深度求索发布了 DeepSeek-V4 预览版。DeepSeek-V4 有两个版本,其中 Pro 版本有 1.6 万亿参数其中 490 亿活跃参数;Flash 版本有 2840 亿参数其中活跃参数 130 亿。两个版本都支持百万上下文。DeepSeek V4 除了支持英伟达 GPU 还支持华为昇腾 NPU。深度求索称,在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异;Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1;在数学、STEM、竞赛型代码的测评中,V4-Pro 超越当前所有已公开评测的开源模型。
https://mp.weixin.qq.com/s/8bxXqS2R8Fx5-1TLDBiEDg
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf