今天看啥  ›  专栏  ›  Ai秦始皇

SD3启动:能写字、多模态生图、深刻理解提示词(附整合包)

Ai秦始皇  · 公众号  ·  · 2024-06-14 22:17
    

文章预览

Stable Diffusion 3 Medium  是一种多模态扩散转换器 (MMDiT) 文本到图像模型, 它拥有20亿个参数, 在图像质量、排版、复杂提示理解和资源效率方面具有显着改进的性能。 效果演示 【演示-1 】 【演示-2 】 【演示-3 】 项目简介 Stable Diffusion 3 Medium的尺寸适中,非常适合在消费级PC、笔记本电脑以及企业级GPU上运行。这意味着,即使是普通用户,也能享受到这个先进模型带来的便利,无需昂贵的硬件支持。 亮点 •  照片级真实 :  克服了手和脸部常见的伪影问题,无需复杂流程即可生成高质量图像。 •  指令遵循:  能够理解涉及空间关系、构图元素、动作和风格的复杂提示语。 •  图文混排:  借助 DiT 架构,可以无伪影且无拼写错误地生成前所未有的文本。 •  资源高效:  由于内存占用小,非常适合在标准消费级 GPU 上运行而不会性能下降。 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览