Stable Diffusion

Материал из Википедии — свободной энциклопедии

Изменения шаблонов в этой версииожидают проверки.Стабильная версия страницы проверена 4 декабря 2025.

Stable Diffusion

Тип	модель преобразования текста в изображение^[вд], модель латентной переменной, диффузионная модель^[вд] и модель глубокого обучения^[вд]
Написана на	Python
Операционные системы	Linux, macOS и Windows
Дата выпуска	22 августа 2022
Последняя версия	3.5 (23 октября 2024)^[1]
Репозиторий	github.com/Stability-AI/…
Лицензия	Stability AI Community License^[вд]
Сайт	stability.ai/stab… (англ.)
Медиафайлы на Викискладе

Stable Diffusion (дословно «стабильная диффузия») — модельглубокого обучения, создающаяизображения по текстовым описаниям^[англ.], соткрытым исходным кодом^[2]. Выпущена в 2022 году компаниейStability AI и основана на методахдиффузии^[англ.]. В основном используется для создания детальных изображений на основе текстовых описаний, хотя её также можно применять и для других задач, например дорисовывать наброски и редактировать исходные картинки^[3]. Разработана группой компаний CompVis вМюнхенском университете. Кроме того, в разработке участвовалиRunway, EleutherAI и LAION^[4]^[5]^[6]^[7].

Stable Diffusion — модель скрытой диффузии, своего родаглубокая генеративная нейронная сеть. Код и вес модели былиоткрыты^[8]. Может работать на большинстве потребительских устройств, оснащенных графическим процессором с объёмом видеопамяти не менее 4 ГБ. Её появление ознаменовало отход от предыдущихпроприетарных моделей преобразования текста в изображение, таких какDALL-E иMidjourney, которые были доступны только черезоблачные сервисы^[9]^[10].

В настоящее время наиболее распространены модификации: Stable Diffusion v1.0, Stable Diffusion XL и Stable Diffusion 3. Последняя третья версия построена на архитектуре DiT-трансформер^[11], в отличие от первых двух, имеющих в своей основе U-Net^[12].

См. также

[править |править код]

Примечания

[править |править код]

↑https://stability.ai/news/introducing-stable-diffusion-3-5
↑Stable Diffusion. — 2023-01-05. Архивировано 18 января 2023 года.
↑Stable Diffusion: что за нейросеть, как работает, инструкция (рус.). РБК Тренды. Дата обращения: 10 марта 2024. Архивировано 10 марта 2024 года.
↑Leaked deck raises questions over Stability AI's Series A pitch to investors . sifted.eu. Дата обращения: 20 июня 2023. Архивировано 29 июня 2023 года.
↑Revolutionizing image generation by AI: Turning text into images . www.lmu.de. Дата обращения: 21 июня 2023. Архивировано 17 сентября 2022 года.
↑Mostaque, Emad. Stable Diffusion came from the Machine Vision & Learning research group (CompVis) @LMU_Muenchen (англ.). Twitter (2 ноября 2022). Дата обращения: 22 июня 2023. Архивировано 20 июля 2023 года.
↑Stable Diffusion Launch Announcement . Stability.Ai. Дата обращения: 6 сентября 2022. Архивировано 5 сентября 2022 года.
↑Stable Diffusion Repository on GitHub . CompVis - Machine Vision and Learning Research Group, LMU Munich (17 сентября 2022). Дата обращения: 17 сентября 2022. Архивировано 18 января 2023 года.
↑The new killer app: Creating AI art will absolutely crush your PC . PCWorld. Дата обращения: 31 августа 2022. Архивировано 31 августа 2022 года.
↑Vincent, James. AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit . The Verge (16 января 2023). Дата обращения: 16 января 2023. Архивировано 9 марта 2023 года.
↑Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (англ.). arxiv.org. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.
↑Архитектура Stable Diffusion: Face ID, Lighting (рус.). habr.ru. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.

В другом языковом разделеесть более полная статьяStable Diffusion (англ.).

Вы можете помочь проекту, расширив текущую статьюс помощью перевода

Обработка естественного языка
Общие определения	Языковая модель Корпус текстов Речевой корпус Стоп-слова Мешок слов AI-полнота N-грамма Биграммный шифр Триграмма
Анализ текста	Сегментация текста^[англ.] Частеречная разметка Поверхностно-синтаксический анализ Обработка сложных слов^[англ.] Извлечение коллокаций^[англ.] Стемминг Лемматизация Распознавание именованных сущностей^[англ.] Разрешение кореферентности Анализ тональности текста Извлечение концептов^[англ.] Синтаксический анализ Разрешение лексической многозначности Извлечение терминологии^[англ.] Извлечение информации Идентификация языка Определение регистра^[англ.]
Реферирование	Извлечение предложений^[англ.] Генерация реферата Многодокументное реферирование^[англ.] Упрощение текста^[англ.]
Машинный перевод	Автоматизированный Гибридный Интерлингвальный^[англ.] На основе правил На основе примеров На основе словаря^[англ.] На основе трансформации Нейронный Статистический Синхронный
Идентификация и сбор данных	Распознавание речи Синтез речи Оптическое распознавание символов Генерация текста
Тематическая модель	Размещение патинко Латентное размещение Дирихле Латентно-семантический анализ
Рецензирование	Автоматизированная оценка сочинений^[англ.] Конкордансер Предиктивный ввод текста Система проверки грамматики^[англ.] Система проверки правописания Угадывание синтаксиса^[англ.]
Интерфейс на естественном языке^[англ.]	Виртуальный ассистент Виртуальный собеседник Вопросно-ответная система Голосовой интерфейс Интерактивная литература

Типыискусственных нейронных сетей
Сеть прямого распространения Сеть радиально-базисных функций Однослойный перцептрон Многослойный перцептрон Розенблата Румельхарта Сеть Хопфилда Цепь Маркова Машина Больцмана Ограниченная машина Больцмана Автокодировщик Шумоподавляющий автокодировщик^[англ.] Разреженный автокодировщик^[англ.] Вариационный автокодировщик^[англ.] Глубокая сеть доверия Свёрточная нейронная сеть Глубинная свёрточная нейронная сеть Развёртывающая нейронная сеть Глубинная свёрточная обратная графическая сеть Генеративно-состязательная сеть Рекуррентная нейронная сеть Рекурсивные нейронные сети Долгая краткосрочная память Управляемый рекуррентный блок Нейронные машины Тьюринга^[англ.] Двунаправленная сеть Двунаправленная рекуррентная нейросеть^[англ.] Двунаправленная сеть с долгой краткосрочной памятью Двунаправленные управляемые рекуррентные нейроны Глубинная остаточная сеть Нейронная эхо-сеть^[англ.] Метод экстремального обучения^[англ.] Метод неустойчивых состояний^[англ.] Метод опорных векторов Сеть Кохонена Самоорганизующаяся карта Кохонена Капсульная нейронная сеть Ассоциативная память на нейронных сетях

Типыискусственных нейронных сетей

Искусственный интеллект
История	Вычислительные машины и разум Зима искусственного интеллекта Бум искусственного интеллекта Джорджтаунский эксперимент Дартмутский семинар Отчёт Лайтхилла Регламент ЕС Гонка вооружений в области искусственного интеллекта Холодная война за искусственный интеллект
Философия	Тест Тьюринга Китайская комната Сильный и слабый искусственные интеллекты Дружественный искусственный интеллект Этика искусственного интеллекта Проблема контроля
Направления	Агентный подход Адаптивное управление Генеративный ИИ Инженерия знаний Модель жизнеспособной системы Машинное обучение Нейронная сеть Нечёткая логика Обработка естественного языка Персональный искусственный интеллект Распознавание образов Роевой интеллект Символический ИИ Эволюционные алгоритмы Экспертная система
Применение	Голосовое управление Задача классификации Классификация документов Кластеризация документов Кластерный анализ Локальный поиск Машинный перевод Оптическое распознавание символов Распознавание речи Распознавание рукописного ввода Игровой ИИ
Исследователи	Чарлз Бэббидж Владимир Вапник Джозеф Вейценбаум Норберт Винер Виктор Глушков Владимир Городецкий Рэймонд Курцвейл Ян Лекун Алексей Ляпунов Джон Маккарти Марвин Мински Аллен Ньюэлл Сеймур Пейперт Джуда Перл Гермоген Поспелов Дмитрий Поспелов Фрэнк Розенблатт Герберт Саймон Алан Тьюринг Патрик Уинстон Виктор Финн Сергей Фомин Демис Хассабис Джеффри Хинтон Ноам Хомский Клод Шеннон Эндрю Ын Элиезер Юдковский

Машинное обучение иdata mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Метод случайного леса Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Размерность Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG

Генеративный ИИ

Концепции

Модели

Текст	Alice AI BLOOM Claude Character.ai DBRX DeepSeek Ernie Bot Gemini GigaChat GPT 1^[англ.] 2^[англ.] 3 J ChatGPT 4 4o^[англ.] 4.5 5 OpenAI o1 OpenAI o3 Grok Granite Qwen LaMDA LLaMA Microsoft 365 Copilot Mistral Large PanGu-Σ^[англ.] Perplexity AI
Программный код	Cursor AI GigaCode GitHub Copilot Granite.Code OpenAI Codex Replit
Изображение	Alice AI Aurora DALL-E Firefly Flux Ideogram Kandinsky Midjourney Stable Diffusion Шедеврум GigaChat (бот)
Видео	Alice AI Dream Machine^[англ.] Runway Gen-4.5 Hailuo AI Kling^[англ.] Sora Veo Шедеврум GigaChat (бот)
Музыка	Udio Suno GigaChat (бот)
Речь голоса	15.ai ElevenLabs

Компании

Категория · Искусственный интеллект

Источник —https://ru.wikipedia.org/w/index.php?title=Stable_Diffusion&oldid=150449022

Категории:

Скрытые категории:

Movatterモバイル変換

Stable Diffusion

См. также

Примечания

Навигация

Поиск