Stable Diffusion1.10稳定版小内存、显存推荐模式(sd-13周到1.31版本535驱动测试)
之前有很多问我怎么降低内存压力,显存压力,我都是直接建议将Stable Diffusion、VAE模型放入内存开xFormer默认的。
但是在实际测试发现不同模式下,批量出图按不同的简单优化设置可以无门槛快速降低配置要求。
在我515*515 5批次*10张图测试中发现有效设置可以将内存性能压力从19~20g,显存接近6g,压制到13~16g,显存不到5g。
不同设置时间差距最高不到5秒。对于动不动视频转帧1770张图渲染帧视频或者批量出高清高质量图片,可以有效降低硬件压力。
不至于有年轻人痛哭流涕:今老黄猖獗,显卡飞涨,跑不动一键部署ai启动包。想学习强国,紧随科技前沿,为国出力。只恨——财力不足。
本纯鹿人觉得很有意思:“这有何难?俺颇有时间,愿与诸位共同摸索。”
当年半导体CPU汉芯实实在在打击了国内芯片发展,导致后面龙芯这些真心要做实事的企业在越来越厚的专利壁垒前步履蹒跚、来来回回看外国企业脸色。
现在ai产业方兴未艾,大家好好加油多了解多实践多出几个实实在在的专利都能在将来少看美国脸色。
我只是一个很无聊,很有空的普通人,往后还会出性能测试的视频、专栏和大家侃大山就这样吧。
先说测试版本:秋叶大佬整合包稳定版1.1
控制与变量:
一、常量:
正向提示词:1girl,landscape, young, white dress
二、反向提示词:bad anatomy, error, jpeg artifacts, low quality, lowres, normal quality, worst quality, extra digits, fewer digits, bad hands, cropped, bad feet, missing fingers, signature, text, username, watermark, futa, extra digit, missing arms(人物画像通用关键词防止出鬼图,不会用可以直接粘贴复制)
电脑配置:3060ti cpu5600g 套条金百达d4 16G*2 3600 光威天策 16G*2 3600
固态太多了不再做列举
一键解压包放固态 导出成品放垂直机械盘
英伟达驱动535studio有专门对跑AI软件、模型针对优化,CUDA12.2
模式:图生图
图片参考:

测试设置:10批次*5单张(性能测试中批次极限100批次,单张极限8张)
为了提现差距以及不出现cuda内存调用和爆显存问题,求稳10批次*5共出50张常规质量515*515图片。
如果你有3090渲染农场或者4090当我没说毕竟b站人均4090,但是作为雕毛我就没有。
其他参数不改:
采样20 默认sd模型自带vae
不开LORA其他模型
宽高512*512
采样DPM+2S
提示词7 重绘0.5
随机种子-1
缩放模式仅大小
中等显存4G
变量:
1优化方案:xformer推荐、xfomer Flash Attention、SDP方案(Troch2.0+、SDP方案(Troch2.0+)无内存优化

2网页设置:是否将Stable Diffusion大模型、VAE放入内存*2

3启动器内存调用与显存优化:是否开启

4网页设置与启动器内、显存优化:是否同时开启
结论(仅供参考,依照个人配置情况而定):
在515*515 10批次*5单张 4g以上显存设置 3060ti图生图测试中
一、xformer推荐 1:25s 显存5 内存13~16(不开启网页设置、不开启启动器内显存优化)
配置预估最低 显存6g 8*2内存
二、SDP方案(Troch2.0+)无内存优化1:19s 显存4 内存14-15(不开启网页设置、不开启启动器内显存优化)
配置预估最低显存6g 8*2内存
三、xformer推荐 1:25s 显存5 内存14-16
(开启网页设置、不开启启动器内显存优化)
配置预估最低显存6g 8*2内存
四、SDP方案(Troch2.0+)1:22s 显存5 内存13-16
(不开启网页设置、开启启动器内显存优化)
配置预估最低显存6g 8*2内存
五、SDP方案(Troch2.0+)无内存优化 1:23s 显存5 内存14-16
(不开启网页设置、开启启动器内显存优化)
配置预估最低显存6g 8*2内存
六、其他方案均在最低6g显存、内存至少16*2才能保证不崩盘 。
资源处理器显示波动范围:4.5-5g显存波动,18-21g内存运行不作推荐效率差别不大不同方案最高差距5s
推荐笔记本用户如果要跑ai绘画本地部署Stable Diffusion1.1版本。
个人推荐配置16g*2套条,显存6-8g保证稳定运行不崩盘死机~谢谢大家