Сообщество - Stable Diffusion & Flux

Stable Diffusion & Flux

4 698 постов 2 289 подписчиков

Популярные теги в сообществе:

Пост удален администрацией (нарушение правил размещения рекламы)

5

FLUX.2 для бизнеса - дешёвая альтернатива Nano banana

Русская женщина и балалайка по версии FLUX.2

Русская женщина и балалайка по версии FLUX.2

Совсем недавно вышла новая модель FLUX.2 для работы с изображениями. Посмотрим на столько ли она хороша, на сколько пишут про неё. В официальном гайде по промтингу выглядит конечно всё отлично, так ли на самом деле? Как увидим дальше не всё так радужно.

Разберём несколько кейсов, которые могут быть актуальны в работе.

Замена лица

На вход две фотографии. Нужно перенести лицо с одной фото на другую, при этом всё остальное оставить как есть.

Ну в целом выглядит даже неплохо, учитывая что промпт в одну строчку

Ну в целом выглядит даже неплохо, учитывая что промпт в одну строчку

А если наоборот?

Тут конечно похуже, но в целом тоже хорошо

Тут конечно похуже, но в целом тоже хорошо

Вот тоже самое но в Nano Banana, лицо то он поменял, но вот руки и цвет кожи остались прежними

Вот тоже самое но в Nano Banana, лицо то он поменял, но вот руки и цвет кожи остались прежними

Генерация изображений

Как одно из преимуществ отмечается генерация изображений в разных стилях. Например генерация в стиле обложки для журнала.

4 вариант для одного промпта, текст вставлен не идеально

4 вариант для одного промпта, текст вставлен не идеально

Немного другой вариант промта

Немного другой вариант промта

В целом тоже конечно неплохо, для не продакшен реди. Придётся допилить напильником.

Промпты на разных языках

Крутая штука, что можно писать промпты на разных языках, при этом модель должна учитывать национальный колорит каждой культуры. Давайте попробуем.

Супер простой промпт в одну строчку на русском языке про рынок в селе. Он даже надписи сам почти нормально сделал, хотя я и не писал ничего про надписи

Супер простой промпт в одну строчку на русском языке про рынок в селе. Он даже надписи сам почти нормально сделал, хотя я и не писал ничего про надписи

Тоже рынок в селе, но на армянском языке. Надписи конечно провальные, но если не знаешь армянского возможно даже не поймёшь. Лица изменились. Главное набор продуктов изменился! Добавился виноград, персики. Зачёт!

Тоже рынок в селе, но на армянском языке. Надписи конечно провальные, но если не знаешь армянского возможно даже не поймёшь. Лица изменились. Главное набор продуктов изменился! Добавился виноград, персики. Зачёт!

Теперь казахский рынок. Лица тоже немного поменялись. В общем правда работает

Теперь казахский рынок. Лица тоже немного поменялись. В общем правда работает

Детальное описание изображения

Как супер киллер фича заявляется возможность генерации изображений по детальному джейсон промпту где прописываются детали для каждого объекта на фото. Вплоть до того, что можно задавать нужный ргб цвет!

Я попросил другую нейроночку сгенерить такой промпт на основе базовой схемы. Будем генерировать балалайку.

Вот это балалайка! Так выглядит русский национальный костюм и балалайка в мире нейронок. Попробуем уточнить детали.

Вот это балалайка! Так выглядит русский национальный костюм и балалайка в мире нейронок. Попробуем уточнить детали.

Уже получше! Особенно мне нравится кокошники. Шикарные получились. Но с балалайкой по прежнему проблемы.

Уже получше! Особенно мне нравится кокошники. Шикарные получились. Но с балалайкой по прежнему проблемы.

В официальном гайде по промптингу есть ещё несколько возможностей которые можно попробовать https://docs.bfl.ai/guides/prompting_guide_flux2 При регистрации дают сгенерить 50 изображений бесплатно. Потом генерация каждого изображения стоит примерно 4 цента.

Итак, какой вывод? Иллюстраторам, фотографам, ретушёрам и прочим ребятам можно спать спокойно. Результаты работы нейронок требуется изрядно допиливать руками. Но как заготовка, очень хорошо.

Промпты для всех изображений можно посмотреть у меня в телеграм канале https://t.me/dimaprodev

Показать полностью 11
3

Месть в красном - Чемпионы Воителницы

Месть в красном - Чемпионы Воителницы

Жажда мести и героизм сливаются в огненной битве! Узнайте, как Чемпионы Воителницы преодолевают все препятствия ради победы. Эта история полна ярких моментов и волнующих сюжетных поворотов!

Source: https://snargl.com/blog/revenge-in-red-champions-of-warmaids...

Показать полностью 7
2

Кольцо, вызывающее забытых героев

Кольцо, вызывающее забытых героев

Узнайте о кольце, способном пробуждать воспоминания о великих героях из прошлого.

Source: https://magical-artifacts.fantasy-art.ru/the-ring-of-summoni...

Показать полностью 4
5

Вышла модель FLUX.2 - это совершенно новая модель с новой архитектурой и обученная с нуля!

✅ FLUX.2 поддерживает режимы T2I и I2I. Коротко два в одном - Image и Edit модель.

✔️ ЧТО НОВОГО

- FLUX.2 способен работать в разрешении до 4 МП.

- Поддержка множественных ссылок : возможность ссылаться на 10 изображений одновременно.

- Более высокая детализация, более четкие текстуры и более стабильное освещение.

- Сложная типографика, инфографика, мемы и макеты пользовательского интерфейса с разборчивым мелким.

- Улучшенное следование сложным подсказкам.

- Значительно большие знания реального мира, освещении и пространственной логике, что приводит к созданию более связных сцен с ожидаемым поведением.

✔️ТЕКСТОВЫЙ КОДИРОВЩИК

теперь LLM модель Mistral Small 3.1. Использование одного текстового кодировщика значительно упрощает процесс вычисления вложений подсказок. Поддерживает максимальную длину строки 512 токенов.

✔️VAE

Новый вариационный автоэнкодер для латентных представлений, обеспечивающий оптимальный баланс между обучаемостью, качеством и степенью сжатия.

✔️Архитектура MM-DiT + parallel DiT в целом как и на Flux.1. Но настроена архитектура по другому. Так же сам по себе DiT стал более крупным.

✔️ Требования VRAM

Без какой-либо разгрузки вычислительный процесс занимает более 80 ГБ

✔️ СЕМЕЙСТВО МОДЕЛЕЙ

- FLUX.2 [pro] - топовая модель доступная только на площадках BFL (http://bfl.ai/play), Playground (http://bfl.ai/play), API BFL (http://docs.bfl.ai/flux_2/).

- FLUX.2 [flex] - та же модель что и pro но с гибкими настройками семплера, позиционируется для рендеринга текста и мелких деталей.

- FLUX.2 [dev] - модель с открытыми весами 32B. Модель генерации и редактирования изображений с открытыми весами, объединяющая синтез текста в изображение и редактирование изображений с несколькими входными изображениями в одной контрольной точке. ЭТО МОДЕЛЬ ДЛЯ НАС!

- FLUX.2 [klein] - ОЖИДАЕТСЯ ВЫХОД - модель Apache 2.0 с открытым исходным кодом, созданная на основе базовой модели FLUX.2. Более мощная и удобная для разработчиков, чем аналогичные модели того же размера. Подозревая это Lightning модель.

⬆️ Text encoder: HF (https://huggingface.co/Comfy-Org/flux2-dev/blob/main/split_f...)

⬆️ Diffusion model: HF (https://huggingface.co/Comfy-Org/flux2-dev/blob/main/split_f...)

⬆️ VAE: HF (https://huggingface.co/Comfy-Org/flux2-dev/blob/main/split_f...)

🪢 Страница разработчика: ССЫЛКА (https://huggingface.co/blog/flux-2)

🔑 Все ссылки и файлы доступны на Boosty: ссылка (https://boosty.to/stabledif/posts/f3e54a1e-a703-40fa-8bf9-16...)

👉 Workflow приложен в комментариях к посту: https://t.me/stabledif_lesson/475

🔥Обзор:

🎦 СМОТРЕТЬ НА YOUTUBE (https://youtu.be/JU1dmuyDSks)

🎦 СМОТРЕТЬ НА RUTUBE (https://rutube.ru/video/fcb6ba132e7ba681c93ba08416941b30/)

Показать полностью 2
Отличная работа, все прочитано!