Сообщество - Stable Diffusion & Flux

Stable Diffusion & Flux

4 700 постов 2 289 подписчиков

Популярные теги в сообществе:

Пост удален администрацией (нарушение правил размещения рекламы)

27

Путешествие в параллельные миры с помощью Stable Diffusion

Не самый крутой пример работы нейронки, но как концепт демо сгодится. Хочу чтобы когда-нибудь подобная технология была встроена в глаз и можно было бы гулять по своему району в оформлении из разных эпох.

Создано с помощью Stable Diffision + ControlNet + Ebsynth

В img2img закидывается 1 кадр в секунду. Обрабатывается с помощью контролнета с помощью карты глубины, затем обработанные кадры передаются в Ebsynth для накладывания на оригинальное видео.

__

Мой канал с гайдами по нейросетям. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью
3

Фотоотчёт с первомайских

Нейродевочки не только в клубах отдыхают. Но и палатку на природе могут без проблем поставить (что в Краснодарском крае - незаменимое умение)

Надо либо научиться делать их не сестрами, либо все усугубить...

Показать полностью 3
49

Оптимизируем и ускоряем Automatic1111, полный гайд

В данном гайде мы разберем все наиболее доступные способы ускорения и оптимизации работы Automatic1111. Указанные здесь способы пригодятся для абсолютно всех видеокарт вплоть до RTX 4090.

Инструкции будут указаны для актуальной версии автоматика, если у вас старая - обновитесь.

***

Материал подготовлен телеграм каналом Neurogen News. Здесь я публикую новости, ссылки на новые релизы и гайды по Stable Diffusion.

Обновляем драйвера видеокарты

Самый базовый, но и самый основной шаг. Время от времени работа драйверов со Stable Diffusion улучшается, что позволяет получить увеличенную скорость генераций.

Отключаем планирование графического процессора

По неизвестной на данный момент причине, планирование графического процессора с аппаратным ускорением в Windows 10 и 11 вызывает серьёзную просадку производительности на видеокартах Nvidia (возможно и на других тоже, к сожалению, нет информации подтверждающей или отрицающей это).

Отключить ее можно следующим образом:

Откройте Параметры экрана. В Windows 11 в настройках нажмите «Графика» в разделе «Сопутствующие параметры», а в Windows 10 — «Настройки графики» ниже раздела «Несколько дисплеев». В Windows 11 дополнительно перейдите в раздел «Изменение стандартных параметров». Отключите, если у вас включена эта функция и перезагрузите ПК.

Переходим в Изменение стандартных параметров графики

Отключаем Планирование графического процессора

Настраиваем переменные в bat файле webui-user.bat

Если у вас видеокарта с 8 Gb видеопамяти и более:

Открываем webui-user.bat в блокноте или любом другом текстовом редакторе.

В строке

set COMMANDLINE_ARGS=

указываем следующие значения:

  • Если у вас видеокарта поколения RTX либо карта от AMD:

set COMMANDLINE_ARGS= --opt-sdp-attention --upcast-sampling --opt-channelslast

opt-sdp-attention - включает метод перекрестного внимания SDP, встроенный в Torch 2.0 и 2.1. Он позволяет эффективнее работать с видеопамятью и увеличивает скорость генерации.

upcast-sampling - выборка по восходящему потоку. Не имеет эффекта при использовании --no-half. Обычно дает результаты, аналогичные --no-half, с лучшей эффективностью при использовании меньшего объема памяти. Обычно дает небольшое ускорение.

opt-channelslast - Неоднозначный пункт. Активирует альтернативный режим работы с видеопамятью в torch, должно ускорить генерацию, но на слабых системах или системах с процессорами с низкой частотой или старой архитектурой - может вызывать замедление. Поэтому индивидуально.

  • Если у вас видеокарта поколения GTX:

set COMMANDLINE_ARGS= --xformers --upcast-sampling

xformers - метод перекрестного внимания от Meta (Facebook). Также улучшает работу с видеопамятью и ускоряет генерацию, как и SDP. По заявлениям пользователей, лучше работает на слабых картах чем SDP.

Также, для всех карт Nvidia, стоит добавить следующие строки:

set CUDA_MODULE_LOADING=LAZY

Данная переменная активирует режим отложенной загрузки ненужных модулей CUDA. Направлено на экономию видеопамяти.

set NUMEXPR_MAX_THREADS=16

где 16 - кол-во потоков вашего процессора.

set PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.9,max_split_size_mb:512

Запрещает torch разбивать блоки, превышающие этот размер (в МБ). Это может помочь предотвратить фрагментацию и может позволить выполнять некоторые пограничные рабочие нагрузки без нехватки памяти.

Таким образом, ваш webui-user.bat должен иметь примерно следующее параметры:

Текст для копирования:

@Echo off
set PYTHON=
set GIT=
set VENV_DIR=
set CUDA_MODULE_LOADING=LAZY
set NUMEXPR_MAX_THREADS=16
set PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.9,max_split_size_mb:24
set COMMANDLINE_ARGS= --opt-sdp-attention --upcast-sampling
call webui.bat

Настройки в Automatic1111

Заходим в Settings, переходим в Sampler Parameters, и для ползунка Negative Guidance minimum sigma выставляем значение 3. Сохраняем.

Данный твик ускоряет генерацию за счет снижения значения cfg для негативного промта под конец генерации.

Устанавливаем Token Merging (ToMe)

ToMe позволяет ускорить генерацию с небольшим падением детализации изображения, за счет объединения некоторых избыточных токенов.

Заходим в Extentions, переходим в Install from url и вставляем следующую ссылку:
https://github.com/SLAPaper/a1111-sd-webui-tome
и нажимаем Install. После установки появится сообщение, что установка закончена. Перезапускаем автоматик. По умолчанию, ToMe будет активирован.

Подробнее об установке и работе ToMe я рассказывал в следующем видео:

(Опционально) Отключаем Live Preview

Предпросмотр замедляет основной процесс генерации, и если вы хотите выжать еще немного скорости - отключите его. Зайдите в Settings, перейдите в Live previews и уберите галки на Show live previews of the created image и Show previews of all images generated in a batch as a grid. Примените настройки.

(Опционально) Используем модели, основанные на SD 2.1

По моим личным наблюдениям и тестам на RTX 3060 Ti и RTX 4090, а также по наблюдениям админов других тематических телеграм каналов, после майского обновления Automatic1111 генерация на моделях, основанных на версии SD 2.1 идет быстрее чем на моделях 1.5 при полностью одинаковых параметрах.

При тестировании на 3060 ti, включив все улучшения и оптимизации, я смог дополнительно получить ускорение на 20%.

Обновляем CUDNN

CUDNN - библиотеки от Nvidia для работы с нейронными сетями. Свежие версии этих библиотек, как правило, привносят улучшение производительности, особенно для карт поколения RTX30xx и выше.

Идем сюда: https://developer.nvidia.com/rdp/cudnn-archive выбираем самую актуальную версию для Cuda 11.x и скачиваем архив Local Installer for Windows (Zip)

Открываем архив, переходим в папку bin внутри архива.

Теперь открываем папку, где лежат файлы нашего Automatic1111, переходим в venv\Lib\site-packages\torch\lib


И теперь из нашего архива, где мы открыли папку bin, перекидываем все файлы с заменой в открытую нами папку lib.

Теперь мы обновили библиотеки Cudnn на самую актуальную версию.

Для тех, у кого 6 гб видеопамяти:

Для начала, вам необходимо выполнить все прошлые шаги.

Ваш webui-user. bat должен выглядеть примерно так:

--opt-sdp-attention --upcast-sampling --no-hashing --always-batch-cond-uncond --medvram

то есть, просто допишите параметры:

--no-hashing --always-batch-cond-uncond --medvram

Использование medvram немного снизит производительность, но позволит прилично снизить потребление видеопамяти. Чтобы снижение производительности было еще меньше, можно отключить предпросмотр при генерации в настройках автоматика.

Для тех, у кого 4 гб видеопамяти:

Ваш webui-user.bat должен выглядеть примерно так:

--opt-sdp-attention --upcast-sampling --no-hashing --always-batch-cond-uncond --lowvram

В зависимости от вашей видеокарты, попробуйте opt-sdp-attention заменить на xformers. Сравните результаты. То, что будет лучше работать с вашей картой будет необходимо оставить в bat файле.

Важно: оба параметра (xformers и sdp) не будут работать вместе. Будет активирован только один из них.

Если вы планируете генерировать, используя ControlNet или же использовать hi-res fix, то используете параметр lowram. Это очень сильно снизит производительность, но даст максимально экономное использование видеопамяти. Если же вы не собираетесь использовать вышеописанные функции, можете попробовать использовать также medvram.

***

На данный момент это все основные способы ускорения и оптимизации работы Automatic1111. Есть еще дополнительные способы, например, использовать linux вместо windows, или использовать wsl2, но они слишком сложные для обычного пользователя Stable Diffusion. При появлении новых статья будет дополняться.

***

Neurogen News - Новости, релизы и гайды из мира нейросетей
Нейрогенное искусство - авторский канал с нейросетевыми артами

Показать полностью 6 1
3

Обучение собственной модели stable diffusion

Добрый день.
Подскажите пожалуйста текстовый/видео гайд для чайников по созданию своей собственной модели в stable diffusion, четв гугле либо все уже не актуально, либо не для чайников :-(

35

Women 1950s

Еще больше работ можно найти в моем телеграмм канале,там я публикую каждый день свои работы https://t.me/neirosea
Оставляй комментарий как тебе мои работы


промт=
(1950s:1.5) style, black lady,(retro style:1.5), like in old films, a girl in a green negligee from the 1950s, hair style 1950s
around the situation like in the films of the 1950s
raw photo, hdr, rtxseries, 4K, 8K, HD, ((ultra realistic photo, best quality, masterpiece, realistic)),
correct hand anatomy,
(African woman:1.5)
(upperbody_view:1.5)


by Ed Binkley,
Atey Ghailan, Studio Ghibli, by Jeremy Mann, Gregory
Manchess, Antonio Moro,


(face focus:1.14), (redshift style), ((natural skin texture)),(sharp focus:1.2),


random pose
random emotion
random appearance

trending on ArtStation, trending on
CGSociety, ultra quality, sidelighting, finely detailed,

dark skin
afro hair
black_haircolor.
random_hairlenght.
random_eyecolor., ultra quality, sidelighting, finely detailed, beautiful eyes, realistic, 3d face, <lora:epiNoiseoffset_v2:1.0>

detailed eyes, detailed face, (look at viewer), (angry face),attractive, (night, sky),high detail, high quality, intricate, details, beautiful,
Negative prompt: (human bacground:1.5), (NSFW:1.2),(worst quality: 1.4), deformed body,2girls.(low quality: 1.4), (monochrome: 1.1), bad _prompt_version2, by bad_artist_anime, (loli: 1.5), (child:1.2), (disfigured)), ((bad art), vignette, grayscale, bokeh, blurred, depth of field, (bad-hands-5:1.2),bad_emb, EasyNegative
Steps: 35, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2124916180, Size: 768x1024, Model hash: c062cfd579, Model: NewDreamMixIsoV2, Denoising strength: 0.4, Mask blur: 4, SD upscale overlap: 64, SD upscale upscaler: 4x_NMKD-Siax_200k

Показать полностью 12
Отличная работа, все прочитано!