Stable Diffusion & Flux

Закреплено

Nerual.Dreming

Пост удален администрацией (нарушение правил размещения рекламы)⁠⁠

6 месяцев назад

wolh

Stable Diffusion & Flux

Серия AI

Космос⁠⁠

1 год назад

Показать полностью 1

wonderlove

Stable Diffusion & Flux

Omost - новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры⁠⁠

1 год назад

Всем привет!

Omost, разработанный lllyasviel - это новый веб-интерфейс, который совмещает в себе возможности больших языковых моделей (LLM) и возможности генерации и изображений на SDXL моделях. Иными словами, SDXL и ChatGPT в одном флаконе

Название Omost (произношение: "almost") символизирует:

Каждый раз, когда вы используете Omost, ваше изображение почти готово

"O" означает "omni" (мультимодальный), а "most" означает стремление извлечь максимум из каждого изображения

Суть в том, что используются простые промпты, а языковая модель преобразовывает и распределяет текстовый запрос таким образом, чтобы на выходе получать красивые и необычные генерации. Смесь LLM и SDXL позволяет очень гибко управлять генерацией

Интерфейс Omost

Интерфейс очень простой и понятный, похож на Fooocus. Большая часть параметров перекочевала из Automatic1111, если вы уже с ним знакомы, то переходите к следующему разделу. Ниже остановимся подробнее

1 — Окно "Prompt"

Основное рабочее пространство

В это окно прописываем текстовый запрос с учётом позиционирования объектов на изображении (например, солнце в правом верхнем углу, силуэт по центру и т.п.)

Далее запрос отправляется в LLM-модель, для получения более сложного промпта

2 — New Chat

Работает подобно созданию нового чата в ChatGPT.

Необходим в случаях, когда нужно уйти от контекста предыдущей генерации.

3 — Edit Last Input - редактирование последнего текстового запроса

4 — Random Seed

Случайный параметр начального шума, из которого будет происходит генерация конечного изображения. Вводится вручную.

Не используйте слишком длинные комбинации цифр, достаточно 4-7 случайных цифр

5 — Окно Language Model

Настройки языковой модели:

Temperature - пришло от ChatGPT, чем больше «temperature», тем более художественный ответ даст ИИ.

Max New Tokens - максимальное количество вводимых токенов

6 — Окно Image Diffusion Model

Image Width - ширина изображения

Image Height - высота изображения

Используйте числа, кратные 64, начиная от 512 (например, 1024x1024, 768x1024 и т.д.)

Image Number - количество итоговых изображений.

Sampling Steps - количество шагов по созданию изображения. Чем их больше, тем дольше нейросеть будет над ней работать.

7 — Вкладка "Advanced"

CFG Scale - величина соответствия текстовому запросу. Для большинства XL-моделей используется от 1 до 5-6.

Настройки для Hi-Res Fix:

HR-Fix Scale - величина апскейла (повышения разрешения), увеличивает время генерации и нагрузку на видеопамять. Рекомендую оставить единицу.

Highres Fix Steps - шаги апскейла

Highres Fix Denoise - мера "новизны" изображения. Чем выше это значение, тем сильнее итоговая картинка будет отличаться от исходной. От 0 до 1.

Negative prompt - негативный запрос, в нём описываем то, чего не должно быть на изображении.

В Omost используется модель RealVisXL 4.0

Процесс генерации

Давайте поближе взглянем на сам процесс преобразования промпта

Пишем вот такой запрос на входе:

a British Shorthair cat on the center

А вот то, что мы получаем на выходе:

А вот изображение на выходе:

Изображение на выходе с запросом "a British Shorthair cat on the center"

Или давайте совсем просто:

a woman

Как видно на скриншотах, можно в мельчайших подробностях задавать параметры позиционирования: от лица, цвета волос и причёски до губ, глаз и одежды. Выглядит всё это очень интересно!

Изображение на выходе с запросом "a woman"

Хочу сгенерировать силуэт девушки на фоне ночного неба. Введём следующий запрос в нижнее окно:

Dark silhouette of a girl in the bottom right, she looks at the starry night sky, standing on a grass field, a forest in the left, fireflies, dark composition

Параметры не меняю

После обработки запроса нажимаем Render the Image!

Получаем следующие результаты:

Omost, к сожалению, не всегда строго придерживается позиционирования

Далее я пишу в чат "поменяй девочку на кошку", жму Render the image и получаю следующее:

Теперь хочу изобразить рыжую девушку в левой части изображения. Сгенерируем следующий запрос:

beautiful woman with short redhair on the left, pale skin, freckles, big green eyes, slim face, green sweatpants, belly button, white socks, lying in her bed,

Ещё один пример

rusalka on the left, aesthetic of street art with knowledge-sharing atmosphere, fog, high depth of field, f/4, framing, groundbreaking breathtaking magnum with precise details, award winning, (Travel Photography by Ashley Gilbertson and George Platt Lynes:0.1), (pastel and bluish-purple colors:0.1),

Придерживайтесь правила: один чат - один сюжет на изображении

Для создания новой композиции нажимаем справа сверху New Chat

На Гите представлены подсказки для позиционирования объектов:

Вы можете задавать расположение объектов согласно сетке

В Omost используется словесное описание позиционирования, а не координатное, потому что "прямое использование координат пикселей или процентных индексов оказалось менее эффективным для LLM"

Так же, если вам нужен точный цвет на изображении, то можно указать его в запросе. На Гите есть слова-триггеры и их HTML-коды. Однако, всё же пока не получается добиться точной цветопередачи

Как итог, Omost - новый экспериментальный инструмент наподобие DALL-E 3, который сочетает в себе мощь LLM- и SDXL моделей

Хочу напомнить, чтобы завести Omost локально, необходима видеокарта как минимум с 8 Гб видеопамяти. Так же он очень требователен к оперативной памяти, съел все мои 16, а я уверен, может и больше

Вы можете попробовать Omost в Demo на Hugging Face

Или скачать портативную версию с установкой в один клик, которая весит всего 1.6 Гб

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте 7z-архив, который нужно просто разархивировать в любое удобное место

Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 23

[моё] Искусственный интеллект Нейронные сети Арты нейросетей Stable Diffusion Компьютерная графика Арт Fooocus Чат-бот ChatGPT Длиннопост

egor.leto

Stable Diffusion & Flux

Серия Нейросклад

Colossus Project — XL Модель⁠⁠

1 год назад

1/9

Название: Colossus Project XL (SFW&NSFW) v9.0 "Hera"

Ссылка: https://civitai.com/models/147720/colossus-project-xl-sfwandnsfw?modelVersionId=459216

Тип модели: #Модель

Количество скачиваний: 50,000+

Дата загрузки: Apr 21, 2024

Базовая модель: SDXL 1.0

Комментарий разработчика: Версия 9.0 "Hera" улучшена для создания как фотореалистичных изображений, так и анимационных. Модель смешивает различные техники и настройки, чтобы предоставить пользователям универсальный инструмент для генерации контента.

@neurosklad 🤖 - все, что нужно, для твоей нейронки!

Показать полностью 9

[моё] Аниме Арт Арты нейросетей Stable Diffusion Нейронные сети Game Art Длиннопост

egor.leto

Stable Diffusion & Flux

Серия Нейро Пушка

А вот и первые пиксель-арты на SD 3⁠⁠

1 год назад

1/4

Первый вышел особенно красиво!

🎯 первый нейро-развлекательный

Показать полностью 4

Нейронные сети Stable Diffusion Искусственный интеллект Обои на рабочий стол Арты нейросетей Pixel Art Telegram (ссылка) Длиннопост

Nerual.Dreming

Stable Diffusion & Flux

Как вам Stable Diffusion 3 Medium? Опрос!⁠⁠

1 год назад

Ну что, друзья, уже попробовали Stable Diffusion 3 Medium?

Как вам Stable Diffusion 3 Medium? Опрос!

Если нет, то веса можно скачать тут - https://huggingface.co/spaces/stabilityai/stable-diffusion-3...

А вот тут демка чтобы попробовать онлайн - https://huggingface.co/spaces/stabilityai/stable-diffusion-3...

Пока работает только под ComfyUI, пайплайн тут - https://huggingface.co/stabilityai/stable-diffusion-3-medium...

Скидывайте ваши результаты в комменты.

Как вам Stable Diffusion 3?

👍 - Отлично!

🙂 - Хорошо.

😐 - Средне.

😱 - Плохо.

💩 - Очень плохо.

Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял. Удачных генераций!

Показать полностью 1 1

[моё] Опрос Нейронные сети Искусственный интеллект Stable Diffusion Арты нейросетей Sd3 Stable diffusion 3

egor.leto

Stable Diffusion & Flux

Серия Нейросклад

Yesmix XL v1.0 - новая XL аниме-модель!⁠⁠

1 год назад

1/6

Название: Yesmix XL v1.0

Ссылка: https://civitai.com/models/316783/yesmix-xl?modelVersi%3E=

Тип модели: #Модель

Количество скачиваний: 3,300+

Дата загрузки: Feb 22, 2024

Базовая модель: SDXL 1.0

Комментарий разработчика: Модель основана на Animagine XL и подходит для генерации аниме SFW/NSFW изображений с высокой стабильностью и качеством. Рекомендуемые настройки: Sampler - Euler a, Clip Skip - 1, разрешение до 1024x1024 без upscale.

@neurosklad 🤖 - все, что нужно, для твоей нейронки!

Показать полностью 6

[моё] Искусственный интеллект Нейронные сети Обои на рабочий стол Stable Diffusion Арты нейросетей Аниме Девушки Hentai mod Длиннопост

slavgo4

Stable Diffusion & Flux

SD 3.0 с пылу с жару⁠⁠

1 год назад

У же попробовал. Погенерил. Много думал. Решил показать. Внизу выводы.

Текстура мазков очень нраится

Кривой глаз, который тянется с самого начала SD

Руки-крюки на месте.

В NSFW не умеет. В околоэротические стили (типа Pin-Up) тоже. Толерантненькая получилась штука.

С реализмом непонятно, на первый взгляд не очень нравиться, косячный глаз так и остался.

Арты, диджитал арты, рисунки - это нравитсЯ. Это хорошо. Количество слов для получаемого результата уменьшилось. Стало попроще.

Руки - крюки (и у меня и у изображений)

Скорость генерации приемлемая, но зависит от видеокарты.

P.S. Без инпеинта, без всего послеобрабатывающего.

Генерации в ComfyUI, все настройки из приложеных к модели воркфлоу, генерация в 768*1024б апскейл в 2 раза

А вы на чем генерируете картинки?

SD1.5

SD XL

Миджорни

Шедеврум

Приложения в ВК

Показать полностью 7 1

[моё] Опрос Нейронные сети Stable Diffusion Арты нейросетей Девушки Арт Обзор Длиннопост

AgeOfIT

Stable Diffusion & Flux

Stable Diffusion 3⁠⁠

1 год назад

Выпустили бесплатную нейронку Stable Diffusion 3, которая оказалась самой совершенной моделью для генерации картинок.

Она может в реализм без артефактов, идеально понимает промпты и пишет текст на картинках без ошибок.
Ссылка на HF

Источник

Показать полностью

Нейронные сети Stable Diffusion Видео Telegram (ссылка)

Популярные теги в сообществе:

Процесс генерации