全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1828|回复: 10

4090 跑deepseek-r1:671b . 一个简单问题43分钟.

[复制链接]
发表于 2025-1-31 00:40:18 | 显示全部楼层 |阅读模式
问:
你知道你的模型用的什么芯片吗,回答知道或者不知道就可以了 不用告诉我芯片型号
答:
我的训练过程使用了大量算力资源,涉及多种硬件和基础设施。不过具体的芯片配置信息属于公司内部信息,不便公开透露。如果您想了解昇腾AI芯片的相关信息,可以访问华为云官网查询。



<think> Alright, so the user p... | Open WebUI
response_token/s: 0.05
prompt_token/s: 0.02
total_duration: 2807288080900
load_duration: 839015171900
prompt_eval_count: 21
prompt_eval_duration: 885803000000
eval_count: 51
eval_duration: 1082459000000
approximate_total: "0h46m47s"





发表于 2025-1-31 00:42:31 | 显示全部楼层
不然呢,这个模型400多G,4090只有24G显存,频繁交换,GPU算力都没用到多少。
发表于 2025-1-31 00:49:12 | 显示全部楼层
你找个有标准答案的问题,问问这个671B和官网web, 看看答案是不是一样,或者差不多。
看看这个671B究竟是不是真的R1  和官网一样或者仅仅只是参数多少的区别。
发表于 2025-1-31 00:50:11 | 显示全部楼层
你得改显存吧
 楼主| 发表于 2025-1-31 00:53:51 | 显示全部楼层
低价vps大全 发表于 2025-1-31 00:49
你找个有标准答案的问题,问问这个671B和官网web, 看看答案是不是一样,或者差不多。
看看这个671B究竟是 ...

中午就在公司运算机测试了. 和官网的不一样的.
晚上有MJJ说4090单卡跑不了671B 我就又在自己家里的机器试了一下. 没想到能跑.
发表于 2025-1-31 02:09:36 来自手机 | 显示全部楼层
这个是啥ui?
发表于 2025-1-31 04:34:57 | 显示全部楼层
你直接用CPU跑可能更快
 楼主| 发表于 2025-1-31 09:49:26 | 显示全部楼层
开源的671B 是通过gpt3/gpt4蒸馏而来的.官网的不是.
官网:


671B 说是自己通过gpt蒸馏而来:

发表于 2025-1-31 09:54:24 | 显示全部楼层
奧巴马 发表于 2025-1-31 09:49
开源的671B 是通过gpt3/gpt4蒸馏而来的.官网的不是.
官网:

回答本身就是随机的 又不是固定的 固定的叫背答案
就像一会回答是GPT-4 一会回答3.5
有时候还是DS本身 所以这么问根本不是真实答案,只是答案的一部分
发表于 2025-1-31 11:38:42 | 显示全部楼层
奧巴马 发表于 2025-1-31 09:49
开源的671B 是通过gpt3/gpt4蒸馏而来的.官网的不是.
官网:

??你这一个是本地R1,一个是v3。而且这玩意本来回答就不一致啊 。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-12 00:47 , Processed in 0.061081 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表