全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 2043|回复: 20

一夜普及,单显卡已能运行gpt3模型,速度100x

[复制链接]
发表于 2023-2-21 22:12:16 来自手机 | 显示全部楼层 |阅读模式
本帖最后由 spotlight 于 2023-2-22 08:59 编辑

项目flexgen:

地址:https://github.com/FMInference/FlexGen 斯坦福 伯克利 meta (FB) 联合发布

标题:Running large language models like OPT-175B/gpt-3 on a single GPU. Up to 100x faster than other offloading systems.

在单个gpu上运行大型语言模型,类似opt-175b/gpt-3,相比其他卸货系统有高达100x速度提升

论文:

地址:https://github.com/FMInference/FlexGen/blob/main/docs/paper.pdf

目测10个联合署名的7个应该是华人

12小时直接2.3k star,什么是国际热度,战术后仰
发表于 2023-2-21 22:49:06 | 显示全部楼层
开源后,我预测国内chatgpt会雨后春笋般出现

点评

这必须是自主研发呀,关开源什么事???  发表于 2023-2-22 07:25
发表于 2023-2-21 22:13:24 来自手机 | 显示全部楼层
It was on the top of hacker news
 楼主| 发表于 2023-2-22 07:10:18 来自手机 | 显示全部楼层
yy10112001 发表于 2023-2-21 22:45
这是开源给你自己训练吗。。。。
那岂不是玩法很多了。。。。。。。
很多人要失业了啊 ...

难道不是创造了更多可以骗经费的岗位吗?是什么限制了你的想象力?
发表于 2023-2-21 22:20:07 | 显示全部楼层
我还想着等显卡降价呢
发表于 2023-2-21 22:43:29 | 显示全部楼层
一块nVIDIA T4 是什么价格啊。。。。 那不是显卡,那是核弹

点评

很便宜的  发表于 2023-2-22 07:21
发表于 2023-2-21 22:45:15 | 显示全部楼层
这是开源给你自己训练吗。。。。
那岂不是玩法很多了。。。。。。。
很多人要失业了啊
发表于 2023-2-21 22:53:29 | 显示全部楼层
百度:感谢老铁的开源
发表于 2023-2-21 22:56:11 来自手机 | 显示全部楼层
真的吗?是不是得买几张50hx屯着?
发表于 2023-2-21 23:17:45 | 显示全部楼层
riofredinand 发表于 2023-2-21 22:56
真的吗?是不是得买几张50hx屯着?

原来要15GB显存 那就是要至少3080TI显卡 不然就要用内存代替 性能会下降 还没搞清楚怎么训练
发表于 2023-2-21 23:24:20 | 显示全部楼层
能达到chatgpt网页版智能吗 还是需要自己训练
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-13 21:34 , Processed in 0.102930 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表