Stable Diffusion
Stable Diffusion (дословно «стабильная диффузия») — модельглубокого обучения, создающаяизображения по текстовым описаниям[англ.], соткрытым исходным кодом[2]. Выпущена в 2022 году компаниейStability AI и основана на методахдиффузии[англ.]. В основном используется для создания детальных изображений на основе текстовых описаний, хотя её также можно применять и для других задач, например дорисовывать наброски и редактировать исходные картинки[3]. Разработана группой компаний CompVis вМюнхенском университете. Кроме того, в разработке участвовалиRunway, EleutherAI и LAION[4][5][6][7].
Stable Diffusion — модель скрытой диффузии, своего родаглубокаягенеративнаянейронная сеть. Код и вес модели былиоткрыты[8]. Может работать на большинстве потребительских устройств, оснащенных графическим процессором с объёмом видеопамяти не менее 4 ГБ. Её появление ознаменовало отход от предыдущихпроприетарных моделей преобразования текста в изображение, таких какDALL-E иMidjourney, которые были доступны только черезоблачные сервисы[9][10].
В настоящее время наиболее распространены модификации: Stable Diffusion v1.0, Stable Diffusion XL и Stable Diffusion 3. Последняя третья версия построена на архитектуре DiT-трансформер[11], в отличие от первых двух, имеющих в своей основе U-Net[12].
См. также
[править |править код]Примечания
[править |править код]- ↑https://stability.ai/news/introducing-stable-diffusion-3-5
- ↑Stable Diffusion. — 2023-01-05. Архивировано 18 января 2023 года.
- ↑Stable Diffusion: что за нейросеть, как работает, инструкция (рус.). РБК Тренды. Дата обращения: 10 марта 2024. Архивировано 10 марта 2024 года.
- ↑Leaked deck raises questions over Stability AI's Series A pitch to investors . sifted.eu. Дата обращения: 20 июня 2023. Архивировано 29 июня 2023 года.
- ↑Revolutionizing image generation by AI: Turning text into images . www.lmu.de. Дата обращения: 21 июня 2023. Архивировано 17 сентября 2022 года.
- ↑Mostaque, Emad. Stable Diffusion came from the Machine Vision & Learning research group (CompVis) @LMU_Muenchen (англ.). Twitter (2 ноября 2022). Дата обращения: 22 июня 2023. Архивировано 20 июля 2023 года.
- ↑Stable Diffusion Launch Announcement . Stability.Ai. Дата обращения: 6 сентября 2022. Архивировано 5 сентября 2022 года.
- ↑Stable Diffusion Repository on GitHub . CompVis - Machine Vision and Learning Research Group, LMU Munich (17 сентября 2022). Дата обращения: 17 сентября 2022. Архивировано 18 января 2023 года.
- ↑The new killer app: Creating AI art will absolutely crush your PC . PCWorld. Дата обращения: 31 августа 2022. Архивировано 31 августа 2022 года.
- ↑Vincent, James. AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit . The Verge (16 января 2023). Дата обращения: 16 января 2023. Архивировано 9 марта 2023 года.
- ↑Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (англ.). arxiv.org. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.
- ↑Архитектура Stable Diffusion: Face ID, Lighting (рус.). habr.ru. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.