全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1166|回复: 16

NVIDIA计算卡被华为取代过程扰乱训练 导致DeepSeek R2模型推迟!!

[复制链接]
发表于 2025-8-15 14:03:58 | 显示全部楼层 |阅读模式
5毛尴尬!狗咬狗了!
原来连用都不能用,我原本以为只是慢一些呢


=================================================
中国坚持要求企业使用国产AI芯片而非英伟达芯片,这会不会付出一些代价?据一份新报告称,北京方面曾敦促DeepSeek放弃英伟达硬件,转而在其R2型号中使用华为芯片,但训练过程中不断出现技术问题,导致发布推迟,并被迫重新转向NVIDIA进行训练,而推理部分则使用了华为芯片。


今年 1 月,DeepSeek 的 R1 模型发布时震惊了整个人工智能行业。据称,该模型在 2048 块英伟达 H800 上进行了训练,耗资 557.6 万美元,与其他人工智能公司数十亿美元的投入相比只是零头。但后来有消息称,DeepSeek 使用了大约 5 万块 Hopper GPU,其中包括 1 万块 H800 和 1 万块 H100,以及 3 万块 HGX H20 单元。

据《金融时报》援引三位知情人士的话称,对于 R2 的后续型号,中国当局“鼓励”DeepSeek 放弃 NVIDIA 技术,转而使用国产硬件。

DeepSeek 采纳了这一建议(或者说需求),转而使用华为基于昇腾平台进行 R2 版本的训练。然而,这带来了性能不稳定、互联速度变慢以及华为 CANN 软件工具包限制等问题。

华为派出了一个工程师团队前往DeepSeek的数据中心,希望解决这些问题。尽管他们已经到位,但在Ascend平台上进行的训练从未成功过,不过使R2与Ascend兼容推理的工作仍在继续。
发表于 2025-8-16 11:01:45 | 显示全部楼层
据三为接头情报,我和你妈有染, 一样
发表于 2025-8-16 09:09:46 | 显示全部楼层
无奖投票:
你的浏览器浏览历史,愿意给中国gov看还是美国gov看?
中国gov -> ↑支持
美国gov -> ↓反对
 楼主| 发表于 2025-8-15 15:18:39 | 显示全部楼层
linearn 发表于 2025-8-15 15:00
华为有后门吗?即便有也是自己的,英伟达的后门可是美国人的,你是不是不介意美国人的后门啊?斯诺登讲的 ...

你问问警察叔叔有没有?   华伪如果没有后门,某党最先座不住了。

某党也有法院,美国也有法院。
比如你被迫相信一个,你选谁?   我肯定选美国法院
发表于 2025-8-15 15:00:10 来自手机 | 显示全部楼层
全球手机交流 发表于 2025-8-15 14:37
华伪更有后门

华为有后门吗?即便有也是自己的,英伟达的后门可是美国人的,你是不是不介意美国人的后门啊?斯诺登讲的故事你不会不知道吧
.
发表于 2025-8-15 17:36:37 | 显示全部楼层
DeepSeek 被华卡脖子
 楼主| 发表于 2025-8-15 17:17:45 | 显示全部楼层

也祝您多打疫苗,身体健康!
发表于 2025-8-15 14:26:00 来自手机 | 显示全部楼层
英伟达有后门
 楼主| 发表于 2025-8-15 14:37:55 | 显示全部楼层

华伪更有后门
发表于 2025-8-15 15:26:34 来自手机 | 显示全部楼层
全球手机交流 发表于 2025-8-15 15:18
你问问警察叔叔有没有?   华伪如果没有后门,某党最先座不住了。

某党也有法院,美国也有法院 ...

祝你身体健康
发表于 2025-8-15 17:45:33 来自手机 | 显示全部楼层
全球手机交流 发表于 2025-8-15 17:17
也祝您多打疫苗,身体健康!

哈哈,我身体健康的很,不会把“华为”两个字错看成“华伪”。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-5 21:02 , Processed in 0.080920 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表