11

Ответ Agaress в «Новый датасет обученный на 1.45 миллиарда картинок»

Для тех у кого слабая видеокарта или просто состоит в ЛЛ, то не отчаивайтесь. Покомандовать нейронкой можно здесь:

https://huggingface.co/spaces/multimodalart/latentdiffusion


Ну и парочка примеров :)


queen of galaxy

bear with minigun oil on canvas

Показать полностью 2
8

Ответ на пост «Новый датасет обученный на 1.45 миллиарда картинок»

Запрос : a robot holding a sign that reads: "Love Pikabu"

Работает в бесплатном колабе:
Ссылка
Работало в веб:
Ссылка
Но так как можно делать 18+ запросы, на данный момент отключили, может включат..

Показать полностью 1
267

Ответ на пост «Новый датасет обученный на 1.45 миллиарда картинок»

Самому стало интересно поставить эту нейросеть и поиграться. Вот сейчас сам ставлю и пишу этот мануал.

1. Скачиваем с оффсайта conda.io инсталлятор Miniconda и устанавливаем.

2. Из репозитория на Github скачиваем нейросеть и распаковываем куда нам удобно.

3. Запускаем Anaconda Shell и устанавливаем git

conda install git

4. Переходим в консоли в папку с нейросетью и создаём среду для работы нейросети. Джём пока всё скачается и установится (около 1Гб)

conda env create -f environment.yaml

5. Активируем только что созданную среду

conda activate ldm

6. Создаём папку для обученных моделей

mkdir -p models\ldm\text2img-large\

7. Устанавливаем пакет wget, который скоро пригодится

conda install -c menpo wget

8. Скачиваем обученные для нас модели

wget -O models/ldm/text2img-large/model.ckpt https://ommer-lab.com/files/latent-diffusion/nitro/txt2img-f...

9. Запускаем тестовый скрипт, который можно взять в мануале к нейросети на Github

python scripts/txt2img.py --prompt "a virus monster is playing guitar, oil on canvas" --ddim_eta 0.0 --n_samples 4 --n_iter 4 --scale 5.0 --ddim_steps 50

10. Радуемся


PS вот, что получилось у меня

a virus monster is playing guitar, oil on canvas

magick book

text 'Preved Pikabu' oil and canvas

fantasy landscape

Emperor of Mankind

Emperor of Mankind Warhammer 40000

По просьбе @Susliche сделал запрос muscular gays puke on each other's cocks. Публиковать это я, конечно же, не буду. Да и получилась шляпа.

Как делать тексты пока не понял. Игра с кавычками не удалась.

Жаль, что нельзя делать большие картинки пожертвовав временем.. быстро вылетает ошибка, что недостаточно памяти. Видеокарта 3060ti.

Показать полностью 6
315

Новый датасет обученный на 1.45 миллиарда картинок

Новая нейронка - latent-diffusion от команды разработчиков CompVis

Позволяет не только создавать арты, но так же убирать объекты из кадров и даже улучшать качество артов и фотографий.

Я потестировал только одну часть нейронки - генерацию изображений по текстовому запросу. Пишешь текст - получаешь картинку.
Текст - "коты играют в шахматы в стиле Пикассо."

Текст - "киты с незабудками в стиле Кандинского/Дали"
Здесь я думаю вы сможете отличить стиль Кандинского от Дали, так как я их перемешал.

Пока Тестов мало, ребята в твиттере делают более успешные тесты. Прикладываю несколько скринов.

Разница в генерациях обусловлена размером изображений, у меня нет пока возможности использовать карты Nvidia Tesla A100 на 80Gb, потому генерация происходит в размерах 256 пикселей на 256 пикселей. От этого сильно страдает детальность и качество.

В общем нейросетки с каждым месяцем становятся все круче и круче.

Показать полностью 15
Отличная работа, все прочитано!