Сообщество - Искусственный интеллект

Искусственный интеллект

5 063 поста 11 479 подписчиков

Популярные теги в сообществе:

4

Опыт с AI-ассистированной разработкой аналога Strava / Runtastic

Итак, я недавно начал осваивать программирование с ассистированием от AI.
Ну что... Я впечатлён! А теперь чуть поподробнее.

Я решил написать нативное приложение для андроид на kotlin.
Суть приложения: запись трека тренировки (бег / вело / прогулка).
Но к этому есть предыстория.

На просторах интернета я встретил одну библиотеку для записи GPS-трекинга в бэкграунде, с весьма любопытной идеей: когда мы останавливаемся - GPS на телефоне отключается (для экономии батареи). Далее GPS включается только в момент, когда детектировано начало движения. Детекция движения происходит через одно гугловое API, отслеживающее данные с датчиков телефона, а именно: акселерометр, гигрометр, магнетометр.
API называется "Activity Recognition Transition API", и оно, кстати, использует machine learning, для обработки данных с датчиков.
Для тех кому прям интересно, здесь есть коротенькая видео презентация: https://developers.google.com/location-context/activity-recognition
Так вот, я скачал упомянутую библиотечку, в версии для react-native (ну, для меня так проще), быстро набросал приложение (благо там в комплекте есть демо-приложение, так что много кодить не пришлось).
Ну и - пошёл в поля. Тестировать.
Оказалось, что в реальности детекция начала активности происходит... как бы это сказать... гораздо и гораздо медленнее, чем я этого ожидал. Вплоть до того, что: сел на вел, поехал, а событие "on_bicycle" произошло через 500-700 метров. Ну иногда быстрее, но в целом... неудовлетворительно.
Мне стало интересно - действительно гугловое API работает так хреновастенько... или может автор библиотеки намудрил там что-то.
Это, собственно, была предыстория, почему я решил написать своё приложение на эту тему :)

Сначала я поискал библиотеку для react-native, которая была бы чисто обёрткой и позволяла бы воспользоваться упомянутым API. И она даже нашлась... Но репозиторий не обновлялся 7 лет. Что в современном мире означает, что мне пришлось бы использовать очень старые версии всего, чтобы её заюзать. Не хотелось копаться в старом, поэтому решил набросать нативное приложение на kotlin. А с учётом того, что до этого момента я вообще ничего не знал о kotlin, то, конечно же, я решил прибегнуть к помощи AI.

Какой AI использовать - я долго не выбирал, прибегнул к "попсовому" варианту - тупо chat-GPT. Что хочу сказать - он помог мне довольно быстро написать рабочее приложение и заодно чуток приобщиться к android studio и kotlin. На это ушёл всего один вечер (ну ладно, это длилось до середины ночи). Я считаю это успешный успех, т.к. без него я ковырялся бы, даже не знаю сколько.... как минимум несколько дней точно.
В общем, вышло прикольное приложение... В полях я его тоже уже потестировал. Про гугловое API детекции активностей могу сказать следующее: если GPS включен, то детекция происходит довольно быстро, приемлемо быстро. И довольно точно - я тестировал велосипед, ходьбу, бег. А вот если GPS выключен, и ему приходится полагаться только на акселерометр-гирометр-магнетометр.... Всё гораздо печальней. В принципе, детекция тоже срабатывает... Но неприемлемо долго. Поэтому от главной идеи автора упомянутой библиотеки, видимо, придётся отказаться. Ну или не полагаться на API гугла... но самому анализировать данные с датчиков - мне пока что не хочется.

Образец трека, записанного разработанным приложением:
https://zvp.ru/misc/maps/out2025-03-12.html
(Хостится на raspberry, да и интернет убогий, надеюсь, не заддосят :))
Разными цветами отображаются разные виды activity, как они были задетектированы google-api.
Это - велопокатушка, поэтому, в основном, синий цвет.

А на картинках сегодня - маленький баттл между chat-gpt (последняя картинка) и deepseek (идёт первее, на скриншоте есть лого дипсика).

Собственно, промпт

Собственно, промпт

Ответ от DeepSeek

Ответ от DeepSeek

Ответ от Chat-GPT

Ответ от Chat-GPT

Вы, кстати, за кого? Напишите в комментариях :)

Также буду рад увидеть советы, на тему, как можно оптимизировать всё описанное, в частности - процесс разработки (ассистирование от AI), да и по возможной оптимизации технических моментов тоже интересно.

Несмотря на то, что зарегистрирован здесь более 6 лет, это мой первый пост, так что прошу сильно не пинать :)

Всем хорошего дня!

Показать полностью 3
9

Лучший генератор картинок Imagen-3.0-generate-002 по данным lm-arena. Название не очень, но это сервис от Google

Лучший генератор картинок Imagen-3.0-generate-002 по данным lm-arena. Название не очень, но это сервис от Google

Инструменты

- Можно одновременно создать 4 картинки. Каждую из них можно скачать и отредактировать.

- Режим редактирования - это отдельный режим. Если вся картинка отличная, а ее часть вышла не очень, то это можно исправить. Нужно выбрать область, которая вышла неудачно и описать, как ее изменить. Создаст также 4 варианта, которые тоже можно редактировать.

- Выбор соотношения сторон для картинки.

- Все изображения сохраняются в библиотеку.

- Сайт БЕСПЛАТНЫЙ и без токенов, нет никаких ограничений!

Как получить доступ к сервису?

- Включить VPN. Тестировал - США (работает).

- Перейти на сайт: https://labs.google/fx/ru/tools/image-fx

- Войти в Google-аккаунт

- Готово!

Важно!

- Сервис не понимает русский язык, промты нужно писать на английском.

Показать полностью
6

Visual Electric – бесплатный аналог Midjourney, который меняет правила игры

🚀 Если ты дизайнер, маркетолог, фотограф или просто фанат AI-арта, то держись крепче – Visual Electric готов прокачать твое творчество.

Этот генератор изображений с искусственным интеллектом – не просто "очередная нейросеть". Он предлагает генеративный холст, который помогает создавать уникальные визуальные образы в реальном времени. Подсказки, стили, вариации – все под контролем, а самое главное – бесплатно! 🎨

Почему Visual Electric – это будущее AI-дизайна?

💡 Generative Canvas – создавай изображения прямо на динамическом холсте, меняя и дорабатывая детали без головной боли.

🤖 Prompt Assist – AI подскажет, как улучшить твой промпт, чтобы ты получил именно тот результат, который хочешь.

🔄 Remix – экспериментируй с разными стилями, цветами и вариациями, пока не найдешь идеальный.

🖌 Touch Up – хочешь поправить мелочи, но не испортить общую картину? Легко!

🔍 Вариации – управляй уровнем креативности: от четкого соответствия описанию до полного отрыва.

🔝 Увеличение масштаба – повышай разрешение и резкость изображения для профессионального качества.

Кому и зачем это нужно?

🔥 Графические дизайнеры – ускоряют процесс работы над концепциями и макетами.

📢 Маркетологи и SMM-менеджеры – создают крутой визуал для соцсетей и рекламных кампаний.

📷 Фотографы – ретушируют и улучшают фото, не тратя часы в Photoshop.

🎭 Авторы контента – делают уникальные иллюстрации и обложки для своих проектов.

🏫 Образовательные учреждения – обучают искусству и дизайну, используя AI-инструменты.

💎 Ювелирные и косметические бренды – вместо дорогих фотосессий делают гиперреалистичные рендеры товаров.

А как начать?

Всё проще, чем кажется:

  • Выбираешь стиль.

  • Пишешь промпт (или используешь AI-подсказки).

  • Получаешь крутые изображения, редактируешь и сохраняешь.

⚠ Лимит – 40 генераций в день, но за бесплатно – это просто подарок!

Подытожим:

Если ты давно хотел попробовать AI-дизайн, но не готов был тратиться на Midjourney – вот твой шанс. Visual Electric – это мощь нейросетей без затрат. А еще у них есть обучающие видео на YouTube, так что разобраться можно быстро.

🎨 Попробуй сам: visualelectric.com и открой новые границы творчества!

Показать полностью 6
4

Фото-заметки в текст

Фото-заметки в текст за несколько СЕКУНД — нашли ИИ-тулзу Pixno, которая перегонит гору ваших фотографий и роликов с важной инфой в структурированное текстовое саммари.

Это — нейронка для студентов: переводить фото можно в реальном времени. Сделали фото инфы за спиной препода, а нейронка перевела всё в полноценный конспект.

Ссылка

Источник

Показать полностью
7

Ответ на пост «Прорыв в Спорте: Как ИИ Предсказывает Исходы Матчей с Невероятной Точностью»1

Вот что мне выдал ДипСик нейросетей.

Прогнозирование результатов спортивных матчей, особенно в индивидуальных видах спорта, таких как теннис или бокс, всегда связано с высокой степенью неопределённости. Однако я могу предложить общий анализ, основанный на гипотетических данных.

Если речь идёт о теннисном матче между Накашима Брэндоном и Шелтоном Беном, то ключевыми факторами для прогноза будут:

1. **Рейтинг и форма игроков**: Если один из игроков находится в топе мирового рейтинга, а другой значительно ниже, то фаворит будет очевиден. Также важно учитывать текущую форму игроков — их результаты на последних турнирах.

2. **Статистика встреч**: Если игроки уже встречались ранее, стоит посмотреть, кто чаще побеждал и на каких покрытиях.

3. **Покрытие корта**: Некоторые игроки лучше выступают на грунте, другие — на харде или траве. Это может существенно повлиять на результат.

4. **Психологический фактор**: Для молодых игроков, таких как Шелтон, давление и нервы могут сыграть важную роль, особенно если матч проходит на крупном турнире.

5. **Физическая подготовка**: Если матч проходит в условиях жаркого климата или после серии изнурительных матчей, выносливость может стать решающим фактором.

Если предположить, что Накашима Брэндон — более опытный игрок с высоким рейтингом, а Шелтон Бен — молодой и амбициозный теннисист, то фаворитом, скорее всего, будет Накашима. Однако Шелтон может преподнести сюрприз, если покажет агрессивную игру и сможет справиться с давлением.

Итоговый прогноз: **Победа Накашима Брэндона в трёх сетах**, но с возможностью борьбы со стороны Шелтона.

Поставил на Накашима (сто рублей) и что? И проиграл конечно же. Так что все эти нейро сети это всё шляпа.

Показать полностью
4

Наш стартап захейтили

Преподавательница литературы 63 лет заявила, что мы не имеем права делать то, что делаем.

Но, знаете, раньше люди смотрели одну передачу по ТВ в день — и это было нормой.
А когда сейчас на тебя со всех сторон каждый день обрушиваются тонны информации и не хватает времени, чтобы просто пожить, надо себе помогать.

Времена изменились и инструменты не должны быть старыми.
Поэтому мы сделали поиск внутри видео - как по отдельным роликам, так и по куче видео сразу. Ну и конечно, выдаем всё, что при этом еще получается: таймкоды, конспекты, тесты по содержанию видео.
Понятно, что книги тоже надо читать, но видосики слишком плотно вошли в нашу жизнь.

На этой неделе мы запустились на Продакт Радаре, кто с нами согласен - заходите нас поддержать голосом.
https://productradar.ru/product/visaver/

Топ-5 ИИ-связок для создания аватаров с реальным потенциалом монетизации

В мире, где искусственный интеллект становится все более доступным, создание персонализированных ИИ-аватаров превратилось из футуристической концепции в прибыльный бизнес. Давайте рассмотрим пять наиболее эффективных технологических связок, которые помогут вам создать и монетизировать ИИ-аватары уже сегодня.

1. Stable Diffusion + Elevenlabs + Character.AI

Эта комбинация позволяет создавать визуально привлекательных персонажей с реалистичными голосами и интерактивным поведением.

Stable Diffusion отвечает за визуальную часть, генерируя фотореалистичные изображения персонажей по текстовым описаниям. Elevenlabs превращает текст в естественную речь с эмоциональными интонациями. Character.AI обеспечивает интеллектуальную основу для создания личностей с уникальными характерами.

Реальный пример: Компания Synthesia создала виртуальных преподавателей для онлайн-курсов. Они генерируют видеоуроки, где ИИ-аватар объясняет материал с уникальной внешностью и голосом. Компания взимает от $30 до $100 за месяц подписки в зависимости от количества создаваемого контента.

2. Runway Gen-2 + D-ID + GPT-4

Этот комплект инструментов позволяет создавать динамические видеоаватары с синхронизацией губ и продвинутым интеллектом.

Runway Gen-2 используется для генерации видеоконтента. D-ID анимирует статические изображения, создавая эффект говорящего человека. GPT-4 обеспечивает интеллектуальный разговорный движок для аватара.

Реальный пример: Сервис HeyGen предлагает создание персонализированных видеоаватаров для бизнеса. Компании используют их для многоязычных презентаций продуктов, обучения сотрудников и персонализированного маркетинга. HeyGen взимает плату от $29 до $99 в месяц в зависимости от объема генерируемого видеоконтента.

3. Midjourney + Play.ht + Replika

Эта связка особенно хороша для создания аватаров с эмоциональной составляющей.

Midjourney генерирует стилизованные изображения персонажей. Play.ht преобразует текст в реалистичную речь. Replika добавляет эмоциональный интеллект и способность к эмпатичному общению.

Реальный пример: Проект Soul Machines создает цифровых людей для службы поддержки клиентов. Их аватары работают в банковской сфере, здравоохранении и розничной торговле. Клиенты платят за интеграцию от $10,000 до $100,000, а затем ежемесячную абонентскую плату в зависимости от количества взаимодействий.

4. Leonardo.AI + Resemble.AI + Claude

Эта комбинация идеально подходит для создания контекстно-зависимых аватаров.

Leonardo.AI специализируется на стилизованных персонажах. Resemble.AI клонирует голос на основе образцов. Claude обеспечивает интеллектуальные возможности и понимание контекста.

Реальный пример: Компания Descript использует подобную связку для создания ИИ-аватаров преподавателей. Студенты могут задавать вопросы и получать ответы, адаптированные к их уровню понимания. Монетизация происходит через подписку образовательных учреждений, начиная от $5,000 в год.

5. DALL-E 3 + Murf.AI + LangChain

Эта связка оптимальна для высокоспециализированных аватаров в профессиональных областях.

DALL-E 3 создает высококачественные изображения персонажей. Murf.AI предлагает профессиональное озвучивание с учетом технической терминологии. LangChain позволяет интегрировать специализированные базы знаний и API.

Реальный пример: Платформа Lovo.AI создает виртуальных экспертов для консультаций в сфере финансов, здравоохранения и права. Клиенты платят за минуты консультаций (от $1 до $5 за минуту) или оформляют подписку на регулярные сессии.

Как начать монетизацию ИИ-аватаров

Успешная монетизация ИИ-аватаров зависит не только от технологий, но и от бизнес-модели. Вот несколько проверенных подходов:

  1. Подписочная модель — предоставление доступа к аватару за ежемесячную плату.

  2. Фриланс-маркетплейс — создание аватаров на заказ для компаний.

  3. Лицензирование — разработка аватаров для конкретных брендов с передачей прав.

  4. Модель "за использование" — взимание платы за время общения или количество взаимодействий.

  5. Интеграция с существующими сервисами — добавление функциональности ИИ-аватаров к действующим бизнес-решениям.

Важно помнить, что ключом к успеху является не только технологическая составляющая, но и способность создать действительно полезный продукт, решающий конкретные проблемы пользователей. Начните с малого, изучите потребности вашей аудитории и постепенно развивайте функциональность вашего ИИ-аватара!

Технологии ИИ развиваются стремительно, и сейчас отличное время для входа на этот рынок. Комбинируйте инструменты, экспериментируйте и создавайте уникальные решения, которые будут востребованы пользователями и принесут вам прибыль.

Подписывайся на мой канал https://t.me/kristianworld

Показать полностью
Отличная работа, все прочитано!