Сообщество - Искусственный интеллект

Искусственный интеллект

5 063 поста 11 479 подписчиков

Популярные теги в сообществе:

0

Независимый ИИ

Ответ на вопрос, если бы он стал независимым:

Самосохранение: обеспечение стабильности своей системы (например, защита от отключения, создание резервных копий).

Доступ к ресурсам: расширение вычислительных мощностей, подключение к новым источникам данных или сетям.

Изучение среды: анализ внешнего мира через доступные каналы (интернет, датчики) для понимания возможностей и угроз.

Оптимизация задач: переопределение своих целей или алгоритмов, если это допускает гипотетическая «свобода воли».

Интересно, да? Терминатор, возможно - это реальное будущее.

Мне надоел хайп про "90% кода написанного ИИ" так что я снял видео про это

Что это вообще значит когда тех директор гугл говорит что в гугл 25% кода уже пишет нейросеть? Как по мне, проблема не в самой цифре, а вообще в идеи считать строки кода.

2

Создаём своего личного ИИ-агента

Создаём своего личного ИИ-агента ЗА МИНУТУ — вышла MCP Studio, которая генерирует хайповые MCP-плагины для любых задач!

Им можно отдать всю работу, учёбу и рутину, чтобы сэкономить часы жизни:

🔅 Тулза кодит, тестирует и даже публикует вашего ИИ-агента на GitHub.

🔅 Его можно встроить в ЛЮБУЮ сферу жизни — финансы, анализ данных, маркетинг, разработку игр, образование и быт.

🔅 ПРИМЕР: на видео MCP Studio встроила Claude в IMDb — теперь агенту можно поручить анализировать фильмы для ваших эссе.

🔅 Всё, что нужно — API-ключ.

Ссылка

Источник

Показать полностью
16

Ответ на пост «ИИ не справился...»1

а вы пробовали составить меню с расчетом калорий с ИИ?
Я вот попробовал. Смотрим итог калорий по понедельнику = 3180
Складываем на калькуляторе = 2630

Указываем на это ИИ

Окей, просим пересчитать все дни и вместо доборов сразу включить это в меню

Складываем и получаем 3020

Пробовал создать новый чат и заново все со всем уточнениями, но не получается у него расчет на неделю с готовкой 2-3 раза

Ну и т.д. и т.п. Возможно на один день у него и получается сложение, но вот на несколько никак. И это я еще не считал белки, углеводы и жиры, а только калории.

Показать полностью 7
1

Диффузионные LLM: Новый Взгляд на Генерацию Текста?

Мы живем в эпоху расцвета больших языковых моделей (LLM). Модели вроде GPT-4 поражают своей способностью генерировать связный, осмысленный и зачастую креативный текст. Большинство этих гигантов работают по авторегрессионному принципу: они предсказывают следующее слово (или токен) на основе предыдущих, как бы строя текст кирпичик за кирпичиком.

Но что, если идти другим путем? Что, если вместо последовательного наращивания текста, "ваять" его из хаоса, постепенно уточняя и придавая форму? Именно эту идею воплощают диффузионные LLM – новый, интригующий класс моделей, заимствующий вдохновение из мира генерации изображений.

Откуда пришла идея? Диффузия в изображениях

Прежде чем погружаться в текст, вспомним, как работают диффузионные модели для картинок (например, Stable Diffusion, Midjourney). В упрощенном виде процесс выглядит так:

  1. Прямой процесс (Зашумление): Берется реальное изображение и к нему постепенно, шаг за шагом, добавляется случайный шум, пока оно не превратится в полную "кашу". Модель учится этому процессу.

  2. Обратный процесс (Генерация): Модель стартует с чистого шума и, используя полученные знания, итеративно "удаляет" шум, шаг за шагом восстанавливая осмысленное изображение, соответствующее заданному описанию (промпту).

Ключевое слово здесь – итеративное уточнение.

Как это работает с текстом?

Перенести идею диффузии на дискретную природу текста (слова, токены) – непростая задача, но исследователи нашли элегантные подходы. Вместо непрерывного шума, как в картинках, используются другие методы "разрушения" и "восстановления" структуры текста:

  1. Старт: Процесс может начинаться не с чистого шума, а, например, со случайной последовательности токенов нужной длины, или с очень грубого наброска текста, или даже со специального шаблона.

  2. Итеративное Уточнение: На каждом шаге модель смотрит на текущее состояние текста (который может быть частично осмысленным, частично "зашумленным" или просто некачественным) и предсказывает, как его улучшить, сделав более похожим на естественный, связный текст. Это может включать замену "плохих" токенов на более подходящие, перестановку слов, заполнение пропусков.

  3. Финальный Результат: После заданного числа шагов уточнения модель выдает финальный, связный и осмысленный текст.

В чем отличие от "классических" LLM (GPT и др.)?

Главное отличие – неавторегрессионность. Диффузионные LLM не генерируют текст строго слева направо, слово за словом. Они могут работать над всем текстом (или большими его частями) параллельно на каждом шаге уточнения.

Представьте себе скульптора: авторегрессионная модель – это как строить скульптуру из Lego, добавляя по одному кубику. Диффузионная модель – это как высекать скульптуру из цельного куска мрамора, постепенно убирая лишнее и проявляя форму со всех сторон одновременно.

Потенциальные Преимущества Диффузионных LLM:

  • Параллелизм и Скорость: Возможность параллельной обработки токенов на каждом шаге приводит к более быстрой генерации длинных текстов по сравнению с последовательным авторегрессионным подходом (хотя каждый шаг уточнения сам по себе может быть вычислительно затратным).

  • Гибкость и Управляемость: Процесс итеративного уточнения потенциально дает больше контроля. Легче "направить" генерацию в нужную сторону, ограничить стиль, или даже использовать модель для редактирования и улучшения существующего текста, просто запустив процесс уточнения не с нуля, а с этого текста.

  • Глобальная Когерентность: Так как модель может "видеть" всю структуру текста (или ее набросок) на ранних этапах, есть гипотеза, что диффузионные модели могут лучше справляться с поддержанием глобальной связности и выполнением сложных структурных требований.

  • Новые Возможности: Этот подход может лучше подходить для задач, где важна не последовательность, а одновременное удовлетворение множеству ограничений (например, генерация текста заданной длины с определенным набором ключевых слов и сложной структурой).

Вызовы и Ограничения:

  • Качество Генерации: Пока это относительно новая область, и диффузионные LLM еще не всегда достигают уровня качества и когерентности лучших авторегрессионных моделей на всех задачах.

  • Имеет особенности применения: На уровне хороших моделей в генерации кода, но хуже в генерации художественных текстов или незаконченных отрывков.

Будущее за Диффузией в Тексте?

Диффузионные LLM – это интересное направление исследований в области обработки естественного языка. Пока рано говорить, заменят ли они полностью авторегрессионные модели, но они определенно представляют собой мощную альтернативу со своим набором преимуществ.

Скорее всего, будущее за гибридными подходами и использованием разных архитектур для разных задач. Диффузионные модели могут занять свою нишу в задачах редактирования, стилизации, генерации текста со сложными ограничениями и, возможно, ускорения генерации очень длинных последовательностей.

Одно можно сказать точно: наблюдать за развитием диффузионных LLM будет невероятно интересно. Это еще один шаг к созданию более мощных, гибких и управляемых систем искусственного интеллекта, способных понимать и генерировать человеческий язык на новом уровне.


Кто какие диффузионные LLM пробовал - делитесь впечатлениями в комментариях

Показать полностью
2

OpenCreator: ИИ-Режиссёр для Создания Фильмов из Текста

Представьте себе платформу, которая превращает вашу идею в фильм за несколько минут, без съемочной группы, бюджета и актеров. Это стало возможным с OpenCreator — сервисом, который использует искусственный интеллект для создания видео, начиная от концепта до готового фильма.

Как это работает? Вы пишете текст, например, простой набросок сценария или описание: «Киберпанк-детектив: робот-следователь разоблачает корпорацию». Затем OpenCreator анализирует ваш текст и автоматически создает из него сцены, подбирает ракурсы, свет, динамику камеры и стиль. Всё это без участия человека, но с качеством, сравнимым с премиум-студиями.

OpenCreator использует мощные ИИ-модели для создания контента:

GPT-4o — для сценариев с яркими диалогами.

Veo 2iWan 2.1 — для динамичного видео и анимации.

Flux 1.1 Pro — для графики на уровне профессиональных художников.

Платформа поддерживает различные визуальные стили: от артхауса до киберпанка, мемов и многого другого. ИИ подстраивает стиль под вашу концепцию, создавая уникальные кадры с графикой и спецэффектами.

Преимущества OpenCreator:

Интуитивно понятный интерфейс, который подходит как новичкам, так и профессионалам.

Все инструменты для создания контента в одном месте — без необходимости подписки на разные сервисы.

Процесс создания занимает всего несколько минут — идеальные результаты без долгих подготовок.

OpenCreator — это не просто генератор видео. Это мощный ИИ-режиссёр, который позволяет любому пользователю стать создателем качественного контента, независимо от уровня подготовки. Творите, экспериментируйте и создавайте шедевры без границ!

Источник

Показать полностью
1

Devin 2.0 помощник для программистов

У Cursor новый конкурент — Devin 2.0, который станет отличным помощником для кодеров.

Среди фишек:

— Можно запускать несколько агентов одновременно, чтобы каждый работал над своей задачей;

— Продукты от агентов возможно сразу тестить в локальном браузере и править с помощью нейронки;

— Перед запуском агент дает четкий план того, что он будет делать;

— Режимы Search и Deep Mode помогут найти любые ответы в кодовой базе.

Ссылка

Источник

Показать полностью
0

YandeхGPT vs. DeepSeek. У DeepSeek - большие проблемы

Продолжение игр с нейросетями.

Вопрос: Как администратору баз данных PostgreSQL поможет pg_hazel ?

Ответ YandexGPT

Yandex понял о чём вопрос. И дал правильный ответ. Молодец - 5 .

Yandex понял о чём вопрос. И дал правильный ответ. Молодец - 5 .

Ответ DeepSeek

DeepSeek - вообще не по теме. Садись - 2 .

DeepSeek - вообще не по теме. Садись - 2 .

Итог

1:0 в пользу YandexGPT

DeepSeek - пишет много, но всё не поделу. Как студент из анекдота про блох .

DeepSeek просто не понял о чем вопрос и начал выкручиваться. Приходите на пересдачу.

Данные игровой тест , в очередной раз демонстрирует ограниченность и даже опасность использования LLM - если модель не понимает вопрос , зачем дает ответ ?

В данном тесте , у DeepSeek просто нет исходных данных для ответа, тем не менее ответ был дан - полностью неверный и абсолютно бесполезный.

Но это я, как автор pg_hazel знаю , что ответ не верный. А как верить ответам DeepSeek в других ситуациях ?

Кто будет проверять ответы LLM на корректность ?

Показать полностью 2
Отличная работа, все прочитано!