Windows 10/11 怎么打开组策略编辑器？

按 Win+R 输入 gpedit.msc 回车。家庭版系统默认没有组策略，需要手动安装。

环境变量怎么设置？

右键此电脑 > 属性 > 高级系统设置 > 环境变量，在系统变量中编辑 Path 添加新路径。

C 盘空间不足怎么清理？

运行磁盘清理工具、清理临时文件、将桌面和文档迁移到 D 盘、关闭系统休眠可以快速释放几个 G 空间。

Windows 更新卡住了怎么办？

等待 30 分钟，若仍无进度可强制重启。重启后运行更新疑难解答工具，或手动下载更新包安装。

低配电脑运行 AI 模型优化设置与显存不足报错修复（完整指南） - Win教程网

低配电脑的AI困境：不是不能跑，是不会设置

「显存不足（CUDA Out of Memory）」是所有AI入门者遇到的最常见错误。很多人因此认为自己的配置不够，放弃了本地AI。实际上通过合理的设置和优化，4GB显存可以跑Stable Diffusion，6GB显存可以跑13B大语言模型，集成显卡也能运行经过优化的AI模型。本文系统介绍低配电脑运行AI的各种优化方法。

第一部分：显存不足的根本原因与解决思路

1.1 理解显存占用

AI模型运行时，模型参数、中间计算结果（激活值）和优化器状态都会占用显存。一张512x512的SD生成图约占用4-6GB显存，一张1024x1024的需要6-8GB。大语言模型方面，7B参数模型需要约6-8GB（FP16精度），13B模型需要10-14GB。了解这些数字后，优化的思路就很清晰了：减少模型精度（量化）、减少中间计算量（分块处理）、使用系统内存作为后备。

1.2 CUDA Out of Memory常见修复

OOM报错主要有几种情况和对应的修复方法。情况一：刚启动就报OOM——其他程序占用了显存，按Ctrl+Shift+Esc打开任务管理器，在「性能」→「GPU」中查看「专用GPU内存」使用情况。关闭Chrome浏览器（Chrome的硬件加速会占用显存）、关闭Steam/游戏客户端、关闭Adobe软件。在NVIDIA控制面板中将「CUDA-GPU」设置为「全部」。情况二：生成到一半报OOM——当前模型需要的显存超过了你的显卡容量。在SD WebUI中使用--medvram参数启动，或在设置中开启Tiled VAE。减少Batch Size为1，降低输出分辨率。

第二部分：模型量化——降低显存占用的核心方法

2.1 什么是模型量化

模型量化是将模型参数的精度从高精度（FP32=32位）压缩到低精度（FP16=16位、INT8=8位，甚至INT4=4位）的过程。FP32的7B模型约28GB，FP16的约14GB，INT8的约7GB，INT4的约3.5GB。GGUF格式（llama.cpp使用）是目前最流行的量化格式，从q8_0（8位高质量）到q4_k_m（4位质量与体积平衡）到q2_k（2位极限压缩）。

2.2 在Ollama中使用量化模型

Ollama（ollama.com）是傻瓜式AI模型运行工具，自动处理模型量化。安装Ollama后在PowerShell中运行ollama pull qwen2.5:7b-q4_K_M自动下载INT4量化版模型，仅需约4GB显存即可运行。

2.3 使用llama.cpp CPU模式运行

如果完全没有独立显卡（只有Intel/AMD核显），可以使用llama.cpp的纯CPU模式运行。下载llama.cpp的Windows release和GGUF格式的量化模型文件。运行main.exe -m model.gguf -n 512 --temp 0.7。CPU模式不占用显存，16GB内存即可流畅运行7B模型，每秒生成3-8个token。对于写作、总结、翻译等任务完全够用。

第三部分：低配显卡AI优化进阶设置

3.1 虚拟共享GPU内存

Windows 11 24H2及以上版本支持「虚拟共享GPU内存」功能。在设置→系统→显示→图形→「默认图形设置」中，开启「硬件加速GPU计划」。系统可以将系统内存（RAM）的一部分作为显存使用。在PowerShell（管理员）中运行Get-WmiObject Win32_VideoController可查看显存大小。

3.2 SD WebUI低显存启动参数

编辑SD WebUI根目录下的webui-user.bat，修改COMMANDLINE_ARGS行。4GB显存用--medvram --opt-split-attention --no-half-vae。2GB显卡用--lowvram --opt-split-attention --no-half-vae --always-batch-cond-uncond。

3.3 使用模型蒸馏和LoRA

SDXL-Turbo（1-4步出图）和LCM-LoRA（快速采样）适合低显存。DeepSeek-R1-Distill-Qwen-1.5B仅需1GB显存，是低配电脑编程助手的优秀选择。QLoRA技术可以将微调显存需求从80GB降低到8-12GB。

第四部分：系统级优化

4.1 Windows游戏模式关闭

在设置→游戏→游戏模式中关闭游戏模式。在NVIDIA控制面板→管理3D设置中，将「电源管理模式」设为「最高性能优先」，防止显卡降频。

4.2 虚拟内存和页面文件优化

将虚拟内存设为物理内存的2倍（如16GB→32GB页面文件）。在系统属性→高级→性能设置→高级→虚拟内存中手动设置。虚拟内存最好放在SSD上。

总结

低配电脑运行AI的核心是不使用「原版全精度模型」，而使用量化版本。2-4GB显卡→Ollama运行Q4_K_M量化模型。4-6GB显卡→SD WebUI加medvram加Tiled VAE。纯核显/CPU→llama.cpp CPU模式加3B以下量化模型。推荐GPU-Z查看显存占用、Ollama自动管理模型、LM Studio图形化管理大语言模型。

低配电脑运行 AI 模型优化设置与显存不足报错修复（完整指南）