Релиз клипа «Влюбиться» Маши Шейх
Несколько бессонных ночей и, наконец, свершилось. На канале исполнителя выложили смонтированный мной в сентябре клип. С которым мы победили на командных соревнованиях чемпионата «АртМастерс» 🤩🎉
Несколько бессонных ночей и, наконец, свершилось. На канале исполнителя выложили смонтированный мной в сентябре клип. С которым мы победили на командных соревнованиях чемпионата «АртМастерс» 🤩🎉
Села монтировать документалку. Всю голову сломала, почему у меня звук идет в левый канал. Причем, визуально, по аудио метру (справа) всё норм.
Решила загуглить проблему на ютубе. Включила какой-то видос, и поняла, что с него звук тоже идет только в левый канал.
Тут меня взяли сомнения. Я проверила штекер наушников. И оказалось, что всё это время он был просто в ноут недоткнут 😂
Друзья, всем привет!
Вот скажите, вы в шоке от скорости развития современных технологий?
Я честно да, у меня уже ощущение что мы живем в научно-фантастическом фильме. Да он пока не дотягивает по удобству и комфорту до того, что нам обещали фантасты, но, в общем и целом, да.
Вот два видео, первое оригинал, второе я прогнал через сервис HeyGen Labs Video Translate, чтобы автоматически перевести его на английский язык и синхронизировать перевод на видео с движением губ.
Мне особенно понравилось, что качество сырого видео после хайгена стало даже лучше чем было изначально, огромный простор для блогинга, ютуба, просветительской деятельности.
Попробовать сервис можете и вы, регистрацию из РФ разрешает, при регистрации у вас будет 1 кредит, этого хватит на минуту перевода. Интерфейс очень простой, просто кидаете ролик в окошко и выбираете язык.
Очень много мемов так перевели, вы уже наверняка видели. А если нет, то вот вам лучшие:
Не знаю как вам, а меня это действительно впечатляет и пугает, особенно с собственным голосом. Но поговорим о плюсах и минусах.
Плюсы
1. Офигеть, это реально работает, нормально работает!
Минусы
1. Я ждал генерацию видео с переводом 2 дня на бесплатном тарифе
2. Ограничение по длине в 5 минут (20 на бизнес тарифе)
3. 1.5-2 бакса за минуту перевода
Пока минусов больше, но сам факт, что такое возможно и работает в автоматическом режиме – срывает мне башню.
Ждем подобное локальное решение, ведь технологии в принципе известные и понятные там и вав2лип и языковые мультимодальные модели от меты и китайский клонер голоса по 3 секундам записи, и наверняка кодформер чтобы сгладить ширховатости, конечно изрядно допиленные, но все же открытые технологии.
А вы что об этом думаете? Скоро вообще не надо будет языки учить? Будут переводчики говорящие голосом собеседника прямо в ухе?
А если уже видели локальный прототип такого софта, то обязательно пишите в комменты, потестим вместе.
Если интересуетесь темой нейросетей и их использования, то посмотрите мой YouTube канал и в телеграме тоже интересно.
Создатели добавили в нейросеть новую функцию управления камерой по команде -camera, у которой есть следующие параметры:
- Поворот камеры осуществляется через команду -camera pan up/down/left/right
Так же можно поворачивать её против либо по часовой стрелке с помощью -camera rotate clockwise/counterclockwise/anticlockwise
- Приближение(Zoom): -camera zoom in/out
Из других нововведений, теперь стандартный FPS генерации 24 кадра в секунду. Регулировать можно с помощью -fps
Если вы вдруг забыли о других командах, то ловите список:
-create prompt: текст промпта - создать текстовый запрос
-neg текст промпта (негативный запрос, чего не будет в генерации)
-motion xx (интенсивность движения, 0-4)
-ar xx:xx (соотношение сторон)
-gs xx (guidance scale, близость визуала к промпту)
-seed xxx (отобразить сид в названии файла)
-hide (скрыть промпт)
Пример промпта: /create prompt:a dog flying in a clouds, 4K -neg "bad anatomy, lowres" -ar 1:1
Источник - 💫Арт-нейросети от Nerual Dreming - подпишись, будет интересно!
😅🤣😂
FaceFusion - это продукт одного из разработчиков популярного дипфейка Roop. Дело в том, что у них произошел разлад, проект Roop закрался, а команда разошлась.
В целом, FaceFusion - это тот же самый Roop, только с интерфейсом на базе Gradio, который многие знают по Stable Diffusion от Automatic1111
Тем не менее множество функций тут вынесены из командной строки в интерфейс.
FRAME PROCESSORS - этот модуль отвечает за обработку кадров.
face_swapper - просто замена лица
face_enhancer - улучшение лица (через GFPGAN)
frame_enhancer - новая опция, апскейлит весь кадр.
EXECUTION PROVIDERS - тут вы выбираете ваш бэкенд, через что будет идти обработка. На видеокартах Nvidia это Cuda либо TensoRT, на AMD это DirectML (DML), если запускать на Windows.
Остальные же параметры в блоке EXECUTION отвечают за скорость обработки. Больше потоков - больше скорость, больше потребление видеопамяти. Поэтому выставляйте в меру, большое количество потоков может привести к вылету либо к замедлению работы.
MAX MEMORY - лимит потребления оперативной памяти.
OUTPUT VIDEO ENCODER - через какой енкодер будут собраны кадры в видео, после замены лица. Для видеокарт Nvidia можно использовать NVENC, так как он базируется на аппаратном ускорении.
KEEP FPS, KEEP TEMP, SKIP AUDIO - Отвечают за то, чтобы Сохранить фпс оригинального видео, оставить временную папку с раскадровками и пропустить аудио.
Средний блок отвечает за выбор файлов с которыми мы будем работать.
SOURCE - фото с лицом, на которое будем менять
TARGET - фото или видео, в котором будем менять лицо
OUTPUT PATH - где будет сохранено видео. Также в Output появится итоговое видео
Третий блок содержит в себе:
PREVIEW - Тут вы можете посмотреть как будет выглядеть замена.
FACE RECOGNITION - выбор распознавания лиц. Либо на основе референса, либо все лица.
REFERENCE FACE - тут как раз и будут лица, распознанные на кадре из превью. Выбирая их, вы выбираете какое лицо будет меняться в кадре.
Оставшиеся параметры отвечают за настройки анализа лиц.
Что касается скорости работы - я не заметил разницы с последней версией Roop. Все примерно точно так же, шустро, но можно и шустрее (Refacer и Rope тому примеры)
Как обычно, я сделал портативную версию с запуском в 1 клик. Пока что готова версия для Nvidia, версия для AMD будет позже, ссылку на нее оставлю у себя в Телеграм канале.
Скачать портативную версию можно по ссылкам:
Мое облако | Яндекс Диск
Особенности портативной сборки:
- Запуск в 1 клик, не надо ничего устанавливать
- Удалена 18+ цензура.
- Обновлены библиотеки CUDA (Cudnn 8.9.4)
После открытия программы, откройте в браузере адрес, который будет написан в консоли (обычно http://127.0.0.1:7860)
Последующие обновления, а так же другие дипфейки можно найти у меня в Телеграм канале, а пообщаться на тематику всего, что связано с нейронками - можно в нашем чате.
