全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1545|回复: 7

挑战sdwebui最低配置

[复制链接]
发表于 2023-5-13 19:44:15 | 显示全部楼层 |阅读模式
本帖最后由 小猪佩奇 于 2023-5-13 19:46 编辑

sdwebui需要至少4g以上显存的英伟达甜品卡,天花板自然是卡皇4090。

过高的配置要求让不少mjj望而却步,虽然有colab、dsw这种资源可白piao,不过线上的自然没有本地用的舒坦用的安心。

事实上sdwebui早就可以使用低显存显卡,甚至直接拿CPU跑,只不过效率很低。

那么低配置的机器到底该如何运行,出图效率到底如何。

这里拿两台机器作为参考,一台是i7 4710mq+950m,另一台i5 4200h+940m,都是七八年前的老爷机。

我们拿940m跑cuda,4710mq跑cpu(就不要难为4200h)

安装很简单

要求python3.10.6+git
克隆代码→双击webui-user.bat即可
这是官方的安装流程

唯一的难度在于网络,要么全局梯子/软路由,要么改安装文件使用反代,亦或者直接用集成环境的安装包
  1. https://www.123pan.com/s/DhC8Vv-vcNad.html提取码:1234
复制代码


安装之前,务必将显卡驱动更新至最新,让cuda能够支持stable diffusion。


安装完之后,webui启动程序会自动检测当前环境是否满足程序运行要求,为了能使用低配机器,需要额外设置启动命令。

这里没有使用一键包
  1. set PYTHON=
  2. set GIT=
  3. set VENV_DIR=
  4. set COMMANDLINE_ARGS=--lowvram --always-batch-cond-uncond --deepdanbooru --xformers --no-half-vae --theme dark
复制代码

如果已经成功安装了python和git,并且设置好环境变量,就无需再填写到webui启动脚本内,VENV在安装过程中会自动创建,也可以不填。
--lowvram:启用低显存模式
--always-batch-cond-uncond:禁用批量生成,同样为了减少显存使用
--deepdanbooru:为了让某些动漫模型运行的更好
--xformers:优化显存,尝试开启
--no-half-vae:不使用半精度(fp16)模型
--theme dark:暗黑模式(更不那么刺眼)

配置完之后双击启动即可,由于调用的文件很多,启动过程比较漫长,建议安装在固态硬盘内。


我们使用默认的512x512,步数20,采样方式为dpm++ sde karras
模型使用chilloutmix,vae选择通用的840000,
挂载三个Lora,分别为20d、fashiongirl与koreanDollLikeness来模拟日常出图需求。


出图过程比较顺利,速度确实有点慢,高达20s/it,总耗时7m40s


通过调用nvidia-smi,我们看到,940m的显存使用开始上升,最终稳定在1500M。
顺便一提的是,cpu几乎没有什么波动,倒是8g内存所剩无几,看来一部分内存被当作虚拟显存划走了。


之后使用图生图,将刚生成的图片使用ESRGAN插件放大2倍,可怜的2g显存终于被全部吃完。

图生图放大总耗时37m32s


高清修复(hires)和mutidiffusion都以爆显存告终。

不使用显卡,纯CPU跑sdwebui如何?

程序不需要额外的设置,通过更改启动命令即可实现。
  1. set COMMANDLINE_ARGS=--use-cpu all --no-half --precision full --skip-torch-cuda-test --theme dark
  2. set CUDA_VISIBLE_DEVICES=-1
复制代码


set CUDA_VISIBLE_DEVICES=-1:禁用掉cuda设备,让程序找不到显卡
--use-cpu all:使用全部的cpu核心
--no-half --precision full:仅使用单精度(fp32)运行
--skip-torch-cuda-test:跳过torch-cuda检测

和上一个测试一样,我们准备了相同的参数来控制变量,只不过这个结果属于——我和CPU比命长系列
总耗时22m35s完成


一开始会非常慢,几乎200s/it,最终平稳在70s/it,作为对比4090高达30it/s,诠释了什么叫时间就是金钱。
发表于 2023-5-13 19:45:16 | 显示全部楼层
我只能说,6,

zsbd
发表于 2023-5-13 20:08:21 | 显示全部楼层
这配置是11年前的吧,我记得12年买的I5 4590.12G内存等之后蹲P100显卡。
 楼主| 发表于 2023-5-13 20:10:59 | 显示全部楼层
清蒸三文鱼 发表于 2023-5-13 20:08
这配置是11年前的吧,我记得12年买的I5 4590.12G内存等之后蹲P100显卡。

4代这种的确是10年前的,不过看了下显卡,严谨点还是七八年前的好
发表于 2023-5-13 20:31:55 | 显示全部楼层
图片分辨率调低点   4G显存也能跑
发表于 2023-5-13 21:09:33 来自手机 | 显示全部楼层
3g显存也能跑
发表于 2023-5-13 21:11:07 | 显示全部楼层
1050ti也能玩玩


​​​​​​​
发表于 2023-5-14 14:44:40 | 显示全部楼层
关键是要有张量核心

在AI方面,任何没有张量核心的显卡都是垃圾。。。。。。。。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-5-10 01:03 , Processed in 0.070620 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表