Stable Diffusion 3 (SD3) 是最新版本的开源AI模型,能够将文本转换为图像。可以在Apple Silicon Mac上本地运行它,并在几分钟内开始生成惊艳的图片。
运行以下命令克隆SD3代码仓库:
git clone https://github.com/zsxkib/sd3-on-apple-silicon.git
cd sd3-on-apple-silicon然后,使用SD3所需的包创建新的虚拟环境:
python3 -m venv sd3-env
source sd3-env/bin/activate
pip install -r requirements.txt现在,可以生成第一张SD3图像:
python sd3-on-mps.py首次运行会下载SD3模型和权重文件,大小约为15.54 GB。后续运行将使用已下载的文件。
不到一分钟,目录中就会生成一张名为 sd3-output-mps.png 的新图像,内容类似:一只举着牌子写着“hello world”的猫。
可以在 sd3-on-mps.py 中调整多种设置来生成不同的图像:
None 使每次生成不同的图像DiffusionKit 是一个CLI工具,可以使用Python MLX运行SD3。它提供了另一种运行SD3的方式,无需手动克隆SD3仓库和设置环境。使用方法如下:
python3 -m venv diffusionkit-env
source diffusionkit-env/bin/activate
cd /path/to/diffusionkit/repo
pip install -e .huggingface-cli login --token YOUR_HF_HUB_TOKENdiffusionkit-cli \
--prompt "一只举着牌子写着hello world的猫" \
--height 512 \
--width 512 \
--steps 28 \
--cfg 7.0 \
--output-path "/path/to/output/sd3-output-diffusionkit.png" \
--a16 \
--w16部分参数说明:
--a16:以float16格式运行模型,使用更少内存--w16:以float16格式加载模型,节省更多内存--t5:改善文本理解但占用更多内存,支持更长提示词(超过77个token)以下是在配备128GB内存的M3 Max MacBook Pro上生成512x512图像(28步)的平均耗时:
方法 | 平均时间 |
|---|---|
DiffusionKit (Python MLX) | ~16.73秒 |
Torch MPS后端 | ~14.14秒 |
不同DiffusionKit设置的耗时:
设置 | 时间 |
|---|---|
标准 | 18.091秒 |
| 18.078秒 |
| 20.600秒 |
| 15.997秒 |
| 19.040秒 |
同时使用 --a16 和 --w16 可以节省内存并加快生成速度,而 --t5 允许更长提示词但会占用更多内存并降低生成速度。FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。