0

0

stable diffusion怎样本地部署省显存_StableDiffusion低显存本地部署教程【实操】

星夢妙者

星夢妙者

发布时间:2025-12-18 23:38:02

|

534人浏览过

|

来源于php中文网

原创

在显存有限设备上运行Stable Diffusion需综合启用xFormers加速、--lowvram/--medvram参数、FP8/INT8量化模型、CPU卸载与分块VAE解码,以及精简插件和禁用高清修复功能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

stable diffusion怎样本地部署省显存_stablediffusion低显存本地部署教程【实操】

如果您希望在显存有限的设备上成功运行Stable Diffusion,但启动时频繁遭遇“CUDA out of memory”错误或WebUI根本无法加载,则很可能是模型加载与推理过程超出了当前GPU显存容量。以下是针对低显存环境(如4GB、6GB甚至2GB显存NVIDIA显卡)的多种实操性部署优化方案:

一、启用xFormers加速与内存优化

xFormers是Facebook开源的PyTorch扩展库,通过重写注意力机制显著降低显存占用并提升推理速度,对低显存设备尤为关键。它能在不牺牲图像质量的前提下,将显存消耗压缩约30%–50%。

1、确保已安装支持xFormers的PyTorch版本(推荐torch 2.0.1+cu118或torch 2.1.2+cu121)。

2、进入Stable Diffusion WebUI根目录,打开命令行窗口,执行:pip install xformers --index-url https://download.pytorch.org/whl/cu118(请根据本机CUDA版本替换cu118为cu121等)。

3、启动WebUI时添加启动参数:--xformers --medvram --no-half-vae。其中--medvram启用中等显存模式,--no-half-vae避免VAE半精度导致的显存溢出风险。

二、使用--lowvram或--medvram启动参数组合

WebUI内置多级显存适配策略,无需修改代码即可通过命令行参数强制启用低资源运行模式。该方式适用于无xFormers支持或老旧驱动环境。

1、关闭正在运行的WebUI进程。

2、右键点击A启动器.exe(或webui-user.bat),选择“编辑”,在最后一行启动命令末尾追加:--lowvram(适用于2GB–4GB显存)或--medvram(适用于4GB–6GB显存)。

3、保存文件后双击重新运行启动器。首次加载可能延长至2–3分钟,但后续生成将稳定运行。

三、切换至FP8/INT8量化模型(RTX 30/40系显卡专属)

FP8模型将权重以8位整数存储,在运行时动态反量化为FP16计算,可使模型体积与显存占用减少近50%,特别适配RTX 3060 12GB、RTX 4070等中端卡。

1、访问Hugging Face或Civitai,搜索标注为"SDXL FP8""SD 1.5 INT8"的模型(如:stabilityai/sdxl-turbo-fp8、hakurei/waifu-diffusion-fp8)。

Smart Picture
Smart Picture

Smart Picture 智能高效的图片处理工具

下载

2、下载.safetensors格式文件,放入models/Stable-diffusion/目录。

3、启动WebUI后,在左上角模型下拉菜单中选择该FP8模型,并在设置页勾选:"Use FP8 for VAE""Enable model CPU offload when idle"

四、启用CPU卸载与分块VAE解码

当GPU显存严重不足时,可将VAE(变分自编码器)部分计算任务转移至CPU执行,并采用分块解码方式避免单次显存峰值爆发,适合仅2GB显存且CPU性能尚可的设备。

1、在WebUI界面点击“设置”→“Stable Diffusion”→找到“VAE precision”选项,改为"Full"(禁用半精度)。

2、勾选"Move VAE to CPU when idle""Split VAE encode/decode into chunks"

3、返回主界面,在“采样方法”下方启用"TAESD"(Tiny AutoEncoder SD)作为轻量级VAE替代方案,大幅降低解码阶段显存压力。

五、精简插件与禁用高清修复功能

第三方插件(尤其是ControlNet、Regional Prompter、Inpaint Anything)及高清修复(Hires.fix)会额外占用1–3GB显存。在低显存环境下,必须主动裁剪非核心功能。

1、进入WebUI的“扩展”→“已安装”页面,逐个点击“移除”未立即使用的插件(保留仅ControlNet基础版或完全禁用)。

2、在生成参数区,取消勾选“Hires.fix”选项;若必须使用,请将“Upscaler”设为"None",并将“Hires steps”限制在≤15,“Denoising strength”控制在0.3–0.4之间。

3、在“设置”→“User interface”中关闭"Show all pages in Gradio"、"Enable image zoom on hover"前端资源消耗项。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 序列化
Python 序列化

本专题整合了python序列化、反序列化相关内容,阅读专题下面的文章了解更多详细内容。

0

2026.02.02

AO3官网入口与中文阅读设置 AO3网页版使用与访问
AO3官网入口与中文阅读设置 AO3网页版使用与访问

本专题围绕 Archive of Our Own(AO3)官网入口展开,系统整理 AO3 最新可用官网地址、网页版访问方式、正确打开链接的方法,并详细讲解 AO3 中文界面设置、阅读语言切换及基础使用流程,帮助用户稳定访问 AO3 官网,高效完成中文阅读与作品浏览。

91

2026.02.02

主流快递单号查询入口 实时物流进度一站式追踪专题
主流快递单号查询入口 实时物流进度一站式追踪专题

本专题聚合极兔快递、京东快递、中通快递、圆通快递、韵达快递等主流物流平台的单号查询与运单追踪内容,重点解决单号查询、手机号查物流、官网入口直达、包裹进度实时追踪等高频问题,帮助用户快速获取最新物流状态,提升查件效率与使用体验。

27

2026.02.02

Golang WebAssembly(WASM)开发入门
Golang WebAssembly(WASM)开发入门

本专题系统讲解 Golang 在 WebAssembly(WASM)开发中的实践方法,涵盖 WASM 基础原理、Go 编译到 WASM 的流程、与 JavaScript 的交互方式、性能与体积优化,以及典型应用场景(如前端计算、跨平台模块)。帮助开发者掌握 Go 在新一代 Web 技术栈中的应用能力。

11

2026.02.02

PHP Swoole 高性能服务开发
PHP Swoole 高性能服务开发

本专题聚焦 PHP Swoole 扩展在高性能服务端开发中的应用,系统讲解协程模型、异步IO、TCP/HTTP/WebSocket服务器、进程与任务管理、常驻内存架构设计。通过实战案例,帮助开发者掌握 使用 PHP 构建高并发、低延迟服务端应用的工程化能力。

5

2026.02.02

Java JNI 与本地代码交互实战
Java JNI 与本地代码交互实战

本专题系统讲解 Java 通过 JNI 调用 C/C++ 本地代码的核心机制,涵盖 JNI 基本原理、数据类型映射、内存管理、异常处理、性能优化策略以及典型应用场景(如高性能计算、底层库封装)。通过实战示例,帮助开发者掌握 Java 与本地代码混合开发的完整流程。

5

2026.02.02

go语言 注释编码
go语言 注释编码

本专题整合了go语言注释、注释规范等等内容,阅读专题下面的文章了解更多详细内容。

62

2026.01.31

go语言 math包
go语言 math包

本专题整合了go语言math包相关内容,阅读专题下面的文章了解更多详细内容。

55

2026.01.31

go语言输入函数
go语言输入函数

本专题整合了go语言输入相关教程内容,阅读专题下面的文章了解更多详细内容。

27

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

Vue3.x 工具篇--十天技能课堂
Vue3.x 工具篇--十天技能课堂

共26课时 | 1.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号