Это самая продвинутая модель текст-в-изображение от Stability AI, обладающая 2 млрд параметров. SD3 Medium обещает фотореалистичные результаты без сложностей для пользователей и работоспособность модели на стандартных потребительских системах.
Новая модель улучшает качество изображений, устраняя артефакты на руках и лицах, и понимает сложные запросы, связанные с пространственными отношениями и стилями. Типографика также значительно улучшена благодаря архитектуре Diffusion Transformer.
SD3 Medium может работать на домашних потребительских видеокартах благодаря низкому потреблению VRAM и обрабатывать тонкие детали из небольших наборов данных, что повышает возможности кастомизации.
Напомним, что авторы проекта сталкиваются с судебными исками и финансовыми трудностями, но продолжают впечатлять своими технологиями.