专门用于训练优化的 SimpleTuner

SimpleTuner 是一个专门用于训练优化的一组实验脚本的存储库。该项目旨在简化代码，重点是使代码易于阅读和理解。此代码库作为共享的学术练习，欢迎做出贡献。

设计理念

在开始学习本教程之前，请完整阅读此自述文件，因为它包含您可能需要首先了解的重要信息。

如需在不阅读完整文档的情况下快速入门，可以使用快速入门指南。

对于内存受限的系统，请参阅 DeepSpeed 文档，该文档介绍了如何使用 🤗Accelerate 配置 Microsoft 的 DeepSpeed 以实现优化器状态卸载。

多 GPU 训练
图像和字幕功能（嵌入）会提前缓存到硬盘驱动器上，以便训练运行得更快，内存消耗更少
宽高比：支持各种图像大小和宽高比，支持宽屏和纵向训练。
炼油机 LoRA 或 SDXL 的完整 u-net 培训
大多数模型都可以在 24G GPU 上训练，甚至可以在较低的基础分辨率下训练到 16G。
- 使用小于 16G VRAM 的 PixArt、SDXL、SD3 和 SD 2.x 的 LoRA 训练
DeepSpeed 集成允许在 12G VRAM 上训练 SDXL 的全 u-net，尽管速度非常慢。
量化 LoRA 训练，使用低精度基础模型或文本编码器权重来减少 VRAM 消耗，同时仍允许 DreamBooth。
可选的 EMA（指数移动平均）权重网络，用于抵消模型过拟合并提高训练稳定性。注意：这不适用于 LoRA.
直接从兼容 S3 的存储提供商处进行训练，无需昂贵的本地存储。（使用 Cloudflare R2 和 Wasabi S3 测试）
仅适用于 SDXL 和 SD 1.x/2.x，完整的 ControlNet 模型训练（不是 ControlLoRA 或 ControlLite）
用于轻量级、高质量扩散模型的专家培训组合
Webhook 支持更新，例如。包含您的训练进度、验证和错误的 Discord 频道
与 Hugging Face Hub 集成，实现无缝模型上传和漂亮的自动生成模型卡。

包括对 Flux.1 的初步培训支持：

SimpleTuner 与 PixArt Sigma 进行了广泛的培训集成 – 600M 和 900M 型号都可以轻松加载。

请参阅 PixArt 快速入门指南以开始训练。

众所周知，Stable Diffusion 2.1 在微调过程中会遇到困难，但事实并非如此。SimpleTuner 的相关功能包括：

基于 SDXL 的模型，使用 ChatGLM（通用语言模型）6B 作为其文本编码器，使隐藏维度大小增加了一倍，并大大提高了提示嵌入中包含的局部细节级别。

Kolors 支持几乎与 SDXL 一样深，但不包括 ControlNet 训练支持。