DeepSeek 的 R2 模型因华为芯片问题推迟发布
杭州深度探索公司 DeepSeek 推迟新模型 R2 发布,因其使用华为昇腾处理器训练时遭遇技术问题。此前在有关部门鼓励下,该公司选择昇腾而非更成熟的英伟达 AI 芯片,但最终转为使用英伟达进行训练,推理仍采用华为芯片。 2025-8-14 13:2:11 Author: www.solidot.org(查看原文) 阅读量:7 收藏

金融时报报道,杭州深度探索公司 DeepSeek 在使用华为芯片训练新模型 R2 失败后,已推迟该模型的发布。DeepSeek 在今年 1 月释出了引发广泛关注的 R1 模型,之后它开始了 R2 模型的训练,在有关部门的鼓励下它使用了华为昇腾(Ascend)处理器而不是更成熟也更先进的英伟达 AI 芯片。但在使用昇腾芯片训练 R2 模型的过程中 DeepSeek 持续遭遇技术问题,因此转而使用英伟达芯片训练,使用华为芯片推理。

FT:DeepSeek新模型因华为芯片问题推迟发布


文章来源: https://www.solidot.org/story?sid=82050
如有侵权请联系:admin#unsafe.sh