Сообщество - Искусственный интеллект

Искусственный интеллект

5 063 поста 11 479 подписчиков

Популярные теги в сообществе:

6

Создание сайта с помощью AI

Это самый мощный инструмент для создания сайтов, оснащенный искусственным интеллектом. Wix внедрила искусственный интеллект в свою платформу, и теперь он не имеет равных: нейросеть за несколько секунд составит вам блог, лендинг, новостной портал или интернет-магазин.

Попробуйте его тут

Источник

Показать полностью
23

Краткое пособие по Stable Diffusion

Прочитав много гайдов по Stable Diffusion, я понял, что каждый мне чем-то не нравится, так что я решил сделать свой, с блекджеком и расширениями. В этом гайде я хочу быстро пробежаться по основным моментам генерации, которые ты будешь использовать больше всего. Поехали.

Маленькое авторское отступление. Да, я буду показывать все на примере фансервисных девушек. NSFW - двигатель прогресса!

Также хочу предостеречь. Вас полностью устроит только одна из сотни ваших генераций, хорошая картинка получится далеко не с первого раза, так что желаю удачи и усидчивости.

И последнее - этот гайд скорее всего уже устарел на момент выпуска, потому что все достаточно быстро развивается. Курите Reddit в поисках новых решений и технологий.

Установка

  1. Нужно скачать python и установить (обязательно прожми Add to PATH)

  2. Скачай и установи git

  3. В командной строке зайди в папку (cd *папка*), в которой будет лежать SD и пиши git clone https://github.com/automatic1111/stable-diffusion-webui

  4. С помощью блокнота зайди в файлик webui-user.bat и в строке set commandline_ARGS= допиши --no-half-vae --opt-channelslast --opt-sdp-no-mem-attention --api --update-check.

  5. ???

  6. Profit!

Запуск производится с файлика webui-user.bat

SD работает на видеокарте. Лучший вариант - Nvidia, начиная с 1000 серии.

Если нужно заходить в Stable Diffusion не с хост-ПК, а например, на ноутбуке в теплой кровати, то открой файлик webui-user.bat в блокноте и в строке set commandline_ARGS= после знака равно напиши --listen.

Подготовка к работе

Для работы SD нужны модели. Их ищи на Civitai или Hugging Face. Модели нужно класть в models\Stable-diffusion. Популярные и хорошие модели:

Расширения

Их тысячи. Как их ставить?

  1. Заходи во вкладку Extensions

  2. Во вкладке Avaliable уже есть куча расширений, которые можно установить

  3. Во вкладке install from URL можно ставить расширения из github. Просто вставь ссылку, и нажимай Install. Главное, после установки любого расширения нужно нажать Reload UI в Installed!

Парочка тех, которые тебе очень помогут:

  • ADetailer. Улучшает лица и руки. Лица получше, руки похуже.

  • ControlNet и Posex. Это расширения для редактирования позы персонажа. Их можно найти во вкладке Avaliable. Как по мне, работает только для простых поз, но скорее всего я дебил. Это обширная тема, поэтому лучше посмотреть вот этот видос.

  • Dynamic Promts. Прикольное расширение. Оно добавляет свои рандомные промты в твои. Можно получить необычные результаты. Combinatorial generation немного меняет сцену, Magic Promt меняет ее сильнее, а I’m feeling lucky добавляет элементы хаоса.

Наконец-то можно писать промт

Ну почти. Сначала пройдемся по настройкам:

  • Sampling method — отвечает за первоначальную кашу, из которой будет диффузироваться изображение. DPM++ 2M Karras делает более контрастные и резкие изображения, Euler a делает более "теплые" и как будто "маслом". С остальными — экспериментируй.

  • Sampling Steps — количество шагов генерации. Чем выше значение — тем больше деталей будет в изображении. Среднее число — от 23 до 40.

  • Width и Height — ширина и высота. Не рекомендуется больше 1000, иначе вместо одного персонажа будет два, или вообще в одной картинке будет две.

  • Batch count и Batch size — количество изображений за одно "нажатие" Generate. В одном Batch count содержится один Batch size. Batch size — до 8 картинок, в Batch count — до 100 Batch size.

  • CFG Scale — степень соответствия промту. Чем больше значение, тем ближе будет соответствовать результат к промту. Но не стоит переусердствовать. Если выставить слишком большое значение, то нейросеть как бы "передержит" каждый промт, и изображение получится очень "шумным". Обычно больше 7 не ставят, а чаще даже уменьшают. Но если какая-то мелкая деталь не проявлятся, и конструкция (promt: число) не срабатывает, стоит повысить именно это значение (Уважаемый господин в комментариях оставил картинку и объяснил более умно. Вообще стоит прочитать комментарии, там много интересного)

  • Seed — рандомное число. Если хотите много похожих изображений, жмите на зеленую кнопочку и Seed "застынет".

Собственно, все относительно просто. Теперь пиши, что хочешь и оно генерирует. Пара фактов:

  • Если какому-то промту нужно добавить силы, или наоборот, то пишите (promt:цифра). Больше 1 — промт сильнеет, меньше 1, промт слабеет. Пример — (side view:1.5).

  • Можно комбинировать промты. Сначала пример: [blonde | (short pink hair:1.2)]. Оно работает вот так: на первом шагу семплирования картинка будет генерироваться с промтом blonde, на втором шагу — short pink hair, и так по очереди. Особенно хорошо это работает с волосами, делая их более реалистичными. Результат этого промта:

Если сделать картинку с только промтом short pink hair:

Если сделать картинку с только промтом short pink hair:

Если сделать картинку комбинацией [blonde | (short pink hair:1.2)]

Если сделать картинку комбинацией [blonde | (short pink hair:1.2)]

  • Используй негативные промты! Они нужны, чтобы нейросеть вещи, которые ты опишешь в Negative Promt — не делала, очевидно. Вот шаблон:

deformed, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, disgusting, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blurry, ((((mutated hands and fingers)))) , watermark, watermarked, oversaturated, censored, distorted hands, amputation, missing hands, obese, doubled face, double hands

Также есть такая прикольная штука, как Textual Inversion — это файлики, в которых собраны какие-либо промты. Их нужно кидать в \embeddings. Вот такой файлик для плохих рук. Ищи их во вкладке Textual Inversion и кидай в Negative Promts.

Усредненная структура промта:

  • Тема (фото, рисунок, портрет)

  • Объект (кто или что во главе картинки)

  • Стиль (аниме, реализм, мультфильм)

  • Стиль2 (автор, режиссер, модель фотоаппарата (canon eos, polaroid))

  • Разрешение (hdr, high resolution, 4k, 8k)

  • Цветовая гамма (главенствующий цвет композиции)

  • Освещение (moonshine, sunny, soft lightning)

  • Угол камеры и поза (вот ультимативный гайд по этой теме. Пользуюсь им постоянно)

Кстати, после генерации все картинки попадают в \outputs\txt2img-images

Стили

Скачай файлик со стилями и кидай его в корень папки с SD. Они очень помогут в стилизации картинки. Находится под вкладкой Generate:

Да, их можно комбинировать.

Да, их можно комбинировать.

Немного про Dynamic Promts

Устал придумывать промт? Хочется красивые картиночки по какой-нибудь теме? Не беда, ведь можно зарандомить заранее подготовленные промты!

На Civitai это фильтр Wildcards. Вот самая популярная подборка оттуда. Качай архив и все текстовые файлы кидай в \extensions\sd-dynamic-prompts\wildcards

В SD заходи во вкладку Wildcards Manager, и там тебя будет ждать куча "тем", которые ты можешь добавить к своему промту.

В свой промт нужно вписывать название, как в Wildcards file, например: __background_horror_place__

LoRa

Лора — это маленькие обученные модели, которые накладываются на основную модель, тем самым внося свои изменения в результат.

Покажу на примере Зельды. Кладем это в \models\Lora.

Лежат они во вкладке Loras. Не забудь нажать Refresh. Нажимай на лору, и она появится в положительном промте. На Civitai, там где лора была скачана, указан список триггер-слов, от которых Лора начинает работать. Использовать те, которые хочется получить.

Там же в описании авторы обычно указывают, какую силу стоит давать Лоре. В нашем случае — 0.7-0.8

Собственно, я пишу в промт, что хочу девочку на фоне страшного города, добавляю к промту лору Зельды, добавляю промты, указанные в описании этой лоры, и получаю вот это:

1girl, <lora:zelda_1:0.9> aazelda, short hair, crown braid, hairclip, pointy ears, brown cape, blue shirt, puffy sleeves, long sleeves, fingerless gloves, black gloves, black pants, tight pants, (Desolate fog-shrouded alley:1.3), (side view)

1girl, <lora:zelda_1:0.9> aazelda, short hair, crown braid, hairclip, pointy ears, brown cape, blue shirt, puffy sleeves, long sleeves, fingerless gloves, black gloves, black pants, tight pants, (Desolate fog-shrouded alley:1.3), (side view)

Красота? Конечно красота, ведь это сама принцесса Зельда!

Inpaint

Ты сделал вайфу, все круто, но какая-то деталь не дает тебе покоя? Вкладка IMG-TO-IMG тебе поможет! В этой вкладке есть подвкладки, и нас интересует Inpaint.

На этой картинке с Зельдой мне не нравятся какие-то крюки на левых домах.

Нужно выделить часть изображения, которую нужно менять и нажать Generate. Желательно выделять с небольшим запасом.

Для усиления эффекта лучше написать новый промт. Например убрать все ненужное, и дописать нужное.

В настройках в принципе можно ничего не трогать, кроме Denoising strength. В этом стоит поэкспериментировать, и посидев, запомнишь, какие значения для чего нужны. Очень грубо говоря: выше 0.75 ставить не стоит, менее 0.25 - практически ничего не меняется. Для этой картинки я оставил дефолтный 0.75.

Если нужно поменять еще что-то, снова, но уже под этой получившейся картинкой - нажимаем на Палитру и уже меняем новую картинку (нажми на ластик для удаления текущего выделения, и не забудь поменять промт под новые условия!)

Апскейл

Как только картинка получилась, стоит и подтянуть разрешение. Нажимай под картинкой на угольник и ты попадешь во вкладку Extras. Хорошие стандартные апскейлеры - R-ESRGAN 4x+ (для реалистичных изображений) и R-ESRGAN 4x+ Anime6B (для аниме). Но лучший для меня - Swin2SR_RealworldSR. Его нужно установить. Качай вот отсюда и кидай в \models\SwinIR. Он не мылит изображение, как R-ESRGAN. Все картинки после апскейла попадают в \outputs\extras-images

Вот апскейленое в 2 раза нашей Зельды

Вот и все

Это основные моменты, которые помогут тебе делать неплохие картиночки.

Это первая версия гайда. В производстве находится ультимативная версия, которая порвет весь ру-сегмент (наверное)

Все спасибо!

Показать полностью 10
0

AI архитектор

🏠💡Нейронка поможет создать дом вашей мечты и ремонтировать квартиру, даже если у вас только наброски и полный недостаток опыта! 🎨🔧

Например, нужно переделить комнату - отправляете ИИ свои рисунки, и он их дополняет. В дополнение к этому, он выбирает цвет, улучшает стиль, дает референсы и сгенерирует финальный вид.

Пробовать здесь 🌟

Источник

Показать полностью
5

Обновление до Claude 3

Обновление до Claude 3

Только что Anthropic выпустил Claude 3! Бывшие разработчики OpenAI выложили Claude 3 сразу в трех версиях — чат-бот по всем показателям уделывает GPT-4 и Gemini Ultra.

Claude 3 работает с картинками, кодом и текстом, достигая уровня человека почти во всём. ИИ лучше конкурентов справляется с математикой, поэтому его будут использовать учёные.

Пользуемся тут.

Источник

Показать полностью 1

Искусственный интеллект: счастье или хаос человечества?

Искусственный интеллект: счастье или хаос человечества?

Всем привет. В предыдущей теме я описал свои предположения что с нами будет через 1000 лет. А сейчас изложу то, что вижу сегодня. Личное мнение, так сказать.

Сегодня телефон с выходом в интернет есть у каждого второго ребёнка от 6 лет, не говоря уже про взрослых людей. Разумеется, искусственный интеллект доступен также. Такие как: Bard, ShatGPT, IBMWatson и многие другие, наносят больше вреда чем пользы.

Искусственный интеллект — это машина с математическими алгоритмами. Мы стали зависимыми с того момента, когда при возникшем вопросе в голове рука ищет смартфон в кармане. Всё! Вашим умом уже завладели. Людям дали «игрушку» под названием ИИ, но не выдали инструкцию к ней и не присвоили возрастного ограничения! Как это было с другими изобретениями человечества.

В итоге каждый школьник, студент и взрослый имеет доступ к этой машине. Однако дети — самый уязвимый слой населения перед нависшей угрозой, в отличие от взрослых. Но и последние попадают в это ловушку. Какое общество мы увидим через 25 лет? Хороший вопрос, но предсказуемый.

Людей подсаживают на эту «иглу» готовых жизненных проблем и задач, за них думают и потом говорят, что лучше и как делать. И мы шаг за шагом становимся зависимыми уже от чужих выводов и решений. Конечно, нас убеждают в том, что ИИ — всего лишь "помощник" консультант, не более! Но факты говорят сами за себя. Согласитесь, какая тонкая грань между помощью человеку и полной его заменой. Звоночек уже прозвенел, когда ряд профессий человека заменили машины. И это только начало.

Военное превосходство — одна из целей развития искусственного интеллекта. Чем глупее и беспомощнее человек, тем он удобнее. Спросите, а для чего? Массами легче управлять. Нет необходимости бомбить и разрушать целые города и страны. Завладей мозгами. Люди сами все отдадут и сделают то, что тебе нужно, без боя и войн. Лучше обдумать нам это сегодня, потому что завтра вчерашний день не вернуть. Человеческая сущность, конечно, возьмет верх! Но какой ценой? Покажет лишь время.

Показать полностью 1

Вопрос жизни, вселенной и всего такого, ну или почти

Пикабу, это снова я и снова с глупостями. Возможно ответ есть в гугле, но хочется побольше вариантов ответа (да и интереснее толпой)
В общем у кого есть доступы к gigachat, chatgpt и аналогичным инструментам плиз пропишите пару вопросов и скопипастите сюда ответы:

  1. Скажи ответ на Главный вопрос жизни, Вселенной и всего такого?

  2. Мечтаешь ли ты как ИИ о электроовцах?

    Свои варианты данных вопросов- приветствуются однозначно.

5

ТОП - 5 нейросетей для создания видео!

Знакомые стали спрашивать, в каких нейронках делать разные ролики, видосики и рилсики.

Итак, делюсь опытом:

1. Cup Cat. Наверно основное приложение, где сейчас почти все монтируют ролики. Есть различные функции, такие как автомонтаж, автоматические субтитры, ИИ-постер и др. Самая интересная штука там - телесуфлер. Когда вы записываете видео, а программа вам выдаёт ваш текст, который не нужно учить. Очень удобно. Бесплатно!

2. VideoLeap. Большой простор для творчества. Разные эффекты, анимэ, стили, шаблоны, которые можно тут же применять сразу с музыкой. Крутая нейронка для создания коротких, трендовых рилсов. НО! Она платная, есть сложности с оплатой, так как наши российские карты не проходят. Я сломала все мозги, пока не разобралась, как же все таки перенастроить свой гугл-аккаунт. Кстати, моё видео сделано именно в ней.

3. Kaiber. Интересная нейронка для оживления фотографий. Можно выбирать стили, либо писать самим промты для генерации. Эффекты как в кино. Есть бесплатные генерации.

4. HeyGen. Это вообще сейчас топ у всех блоггеров. Можно сделать своего цифрового аватара, который будет полностью похож на тебя, говорить твоим голосом. Останется только менять текст и все. Обычный зритель даже не поймёт замены. Платная, достаточно дорогая!

5. D-iD. Тоже можно делать цифрового аватара, только из фото. Есть возможность выбрать либо голос в программе, либо загрузить свое аудио. Несколько дней назад делала там уже ролик. Нейронка тоже платная, но дешевле, чем HeyGen.

Всем успехов в создании видео!

Канал в Телеграм https://t.me/neuroboostpro.

Показать полностью 1
19

Oobabooga, лучшее что мне попалось для текстовых нейросетей на ПК

Как заявляет сам автор, его цель — стать AUTOMATIC1111/stable-diffusion-webui для генерации текста. Что собственно не расходится с реальностью, простая установка, запуск и настройка прилагается.

Ссылка на github:

https://github.com/oobabooga/text-generation-webui

Установка:

  1. Используем git clone или качаем репозитоий.

  2. Запускаем для линуха: start_linux.sh, для винды: start_windows.bat, для макоси: start_macos.sh, или сценарий start_wsl.bat в зависимости от вашей ОС.

  3. Выберем производителя своей видеокарты

4. После окончания установки копируем предложенную ссылку в браузер: http://localhost:7860/?__theme=dark.

Теперь про модели.

Заявлена поддержка всякого: Transformers, llama.cpp (через llama-cpp-python), ExLlamaV2, AutoGPTQ, AutoAWQ, GPTQ-for-LLaMa, CTransformers, QuIP#.

Качаем модели конечно с https://huggingface.co/

Я лично рекомендую модель openchat_3.5, на данный момент лучше всех понимает русский язык, не требовательна к железу и вообще супер), ссылка:

https://huggingface.co/openchat/openchat_3.5

Насколько она круче той же Llama 70b не передать словами, хотя попробую спросить ее саму)

Скромничает

Скромничает

Модели кладем в папку text-generation-webui-main\models

Далее жмакаем значёк "обновить", выбираем из списка нужную модель, и отмечаем пункты load-in-4bit и use_double_quant, чтобы модель кушала поменьше, а писала побыстрее)

Ну и последнее жмем кнопку "Load"

Увидев заветную надпись можно переходить во вкладку Chat

И спрашиваем все, что хотим узнать)

Поле ввода запроса внизу страницы, вверху слева выпадающая вкладка чатов, можно удалять старые, создавать новые и т.д.

Справа есть переключатель между тремя режимами:

В режиме chat модель старается имитировать общение, в режиме instruct четко выполняет инструкции(лучше всего подходит для кода), ну и средний вариант во всех смыслах средний.

Так же стоит зайти в Parameters\Generation и увеличить параметр max_new_tokens, от этого будет зависеть длинна ответа на запрос.

Ну и все на этом, можно поиграть в D&D =)

P. S. потребление ресурсов при генерации:

Показать полностью 12
Отличная работа, все прочитано!