Сообщество - Искусственный интеллект

Искусственный интеллект

5 071 пост 11 487 подписчиков

Популярные теги в сообществе:

Как оживить старые снимки с помощью нейросети Kling

📲 Перейти в Telegram бот для создания анимации их старых фото

64
Искусственный интеллект
Серия Есть идея

Ответ на пост «Хаус-кипер 2.0: зачем нам ИИ, к которому мы действительно привязаны»2

Захотелось немного порассуждать на тему заданную в исходной статье. Там (на мой вкус) многовато воды и патетически риторических вопросов, но посыл ясен и довольно очевиден. Тот путь, по которому сейчас развиваются генеративные модели, пройдёт именно через такие этапы, что перечислил автор исходного поста.

Начало этому уже положено - это агенты. У них есть "память" в виде базы фактов, которые нужно "помнить" про глобальный контекст агента. У них есть "инструменты" - пайплайны и скрипты на основе цепочки более простых промтов для решения типовых задач. У них есть характеристические базовые промты, которые формируют роль, характер и базовые ценности персонажа.

Очевидно, что здесь мы только в самом начале пути, и в нашем цифровом доме с нами будет жить не один такой персонаж, а несколько. Так интуитивно проще с ними общаться и делегировать им задачи. Очевидно, что напрашивается и какая-то иерархия с централизацией управления, и некоторая степень автономности элементов системы.

Вообще ничего принципиально нового тут нет. Люди вступают в этап "цифровых слуг". Это уже не просто инструменты, но и не равноправные "друзья". Пока ещё. Да, я технооптимист, и готов на эту тему поспорить и порассуждать здесь и в такого же вида постах, если будет кому-то интересно.

Вообще для таких персонажей есть замечательный и удобный термин, который пришёл к нам давным давно от фантастов. Это же самые настоящие иск-ины - искусственные интеллекты, да, но у любого термина есть свой оттенок и свой контекст применимости. Искинами в фантастике всегда были некие "джины", цифровые персонажи, слуги, которые выполняли более или менее широкие спектры когнитивных задач.

Искин дома, или космического корабля в фантастике - это понятная штука в нашей культуре. Куда понятнее и точнее, чем "ИИ", "Агент" или "генеративная модель".

Кстати, в зачаточной степени на роль такого искина могла бы претендовать Алиса Яндексовна. Я не знаю по какой причине команда Алисы и Умного Дома Ядндекса не спешит развивать технологию именно в этом направлении. Может быть они не хотят быть первыми в этой гонке, ведь последователи будут учиться на их ошибках и получать преимущество за счет этого.

Мне кажется Алисе давным-давно пора "понимать" и усваивать настройки не только путём указания их в профиле, а ещё через голосовой интерфейс: состав семьи в доме, где установлены её интерфейсы, наличие и имена домашних животных, предпочтения обитателей Умного Дома, их привычки, какую-то важную информацию о них, их индивидуальные расписания, планы, задачи... Сейчас с этим у Алисы всё очень ограниченно и печально.

Вообще текущего уровня технологий уже достаточно, чтобы делать такого персонализированного домашнего ассистента, как описывает автор оригинального поста. Но сделать первые шаги "на коленке" относительно легко, а вот построить долгосрочный проект с перспективами многолетнего развития - гораздо сложнее.

Тут нужны расширяемые специализированные фреймворки, гибкие стандарты, слоистая архитектура...

Вот, к примеру, память.

Очевидно, что нам нужна глубокая обратная совместимость, чтобы по мере развития проекта новые расширенные версии не забывали важные вещи, которые помнила предыдущая модель. База памяти должна иметь предикатную структуру и должна быть читаемой, то есть простой файн-тюнинг языковой модели, который зальёт какие-то кастомные "знания" в "черный ящик" нейронной сети не подойдёт. Из этого "черного ящика" эти знания чертовски сложно достать, а ещё сложнее сделать это так, чтобы быть уверенным, что ничего не потерялось и ничего не было сгаллюцинировано лишнего.

То есть, видимо, нужны какие-то когнитивно-читаемые предикаты и постулаты, собранные в простую БД, может быть с иерархической древовидной или теговой структурой для удобства анализа, суммаризации и модификации. В принципе, технологии эти давно есть в инструментарии разработчиков - это базы знаний - они бывают графовые, бывают логические (Пролог), сложные, простые, узкоспециализированные или общего назначения...

Сейчас все знания о мире мы загружаем в "черный ящик" генеративной модели, но это, очевидно, не самый идеальный путь. Нейронные сети отличный "переводчик" с языка на язык, отличный адаптер между абстрактными уровнями, и к слоистой архитектуре мы так или иначе придём. Это неизбежное следствие уменьшения цивилизацией энтропии своих знаний о мире. Но это я что-то уже далеко залез. Не тут бы рассыпаться на эту тему.

Ещё важна прозрачность и стабильность.

Было бы странно при обновлении ПО умного дома получить заметно другую личность "дворецкого" вместо старого привычного Бэримора.

Да, этого нового будут звать так же, и он будет помнить все предикаты (условия и факты), которыми руководствовался его предшественник, но как контролировать целостность и преемственность суждений ИскИна на более тонком уровне косвенных предпосылок? Как добиться бесшовности его развития на более-менее больших масштабах времени?

Нужны когнитивные простые суб-агенты, которые бы проводили непрерывное самотестирование ИскИна и подмечали существенное различие в его суждениях на те или иные темы из широкого ряда, где будут вопросы этики, политики и т.д.

Ещё важно, чтобы такая сложная система как ИскИн была устойчива к когнитивно-деструктивным "мемо-вирусам", которые могли бы разрушить преемственность версий и целостность развивающегося персонажа.

С людьми такое провернуть не получится, человек может спиться, сторчаться, уйти в маргинальный образ жизни, и из инструментов для какого-то подобия контроля за такими вещами у человека есть только, разве что, психологи, психотерапевты и какие-то медикаменты.

ИскИны можно строить на базе иерархии иммутабельных (неизменяемых) слоёв, можно исследовать и подвергать когнитивным тестам изменение версий до и после дообучения моделей.

Это всё тоже большая и интересная тема, на которую не хочется здесь сильно расплываться.

А что в итоге?

Если поиграть в футурологов, то у нас, скорее всего, в ближайшем будущем будет развитие ИИ Агентов в контексте выше перечисленного. Предпосылки видны уже сейчас.

Наши домашние голосовые помощники расширятся и выйдут за пределы Умного Дома. Будут персональные ИскИны для повседневных задач. Установка будильников, чеклисты, трекинг задач для бытовых вопросов перейдёт в их зону ответственности. Также мы всё меньше будем пользоваться "однопальцевыми" интерфейсами для заказа билетов, еды, поиска фильмов и прочей организации досуга.

Если бы у вас был реальный человек-помощник, то вы бы с ним взаимодействовали больше вербально, хотя чаты иногда будут тоже удобны. Это значит, что модальности взаимодействия с ИскИнами расширятся и переплетутся. ИскИны будут "видеть" (это уже не в таком близком будущем как хотелось бы. По технологическим причинам) не только нашими глазами, но и всем нашим окружением. Они будут в курсе всего что происходит в нашем бытовом контексте. Про рабочий контекст - это отдельная история. Сотрётся четкая граница того, через что именно мы общаемся с ИскИном. Он будет сам понимать когда нам что и как удобнее воспринимать. Спросив у него погоду мы услышим коротко самое важное, а параллельно на каком-нибудь экране в поле нашего зрения откроется виджет с более подробной информацией.

Например, слушая подкаст (может быть даже генеративный), мы можем переходя от "поверхности" (экрана) к поверхности видеть какую-то сопутствующую наглядную инфографику о том, что говорится в подкасте, но можем и не обращать на это внимание.

Мне кажется это интересным образом повлияет и на наши когнитивные функции. Тут тоже большая тема, но вкратце, речь про нашу внешнюю техническую аугументацию.

Мы тысячи лет с трудом представляем себе жизнь без горячей приготовленной пищи, многие сотни лет без письменности, сотни без СМИ и периодики, десятки без телевидения и интернета. Мы пользуемся будильниками, записными книжками, часами, календарями, справочниками для расширения своей памяти и чувства времени. Мы пользуемся транспортом для расширения своих возможностей в перемещении. Медицина увеличила среднюю продолжительность на десятки лет, а детскую смертность практически исключила (в сравнительной мере, конечно же, если сравнивать с прошлым веком, средневековьем или более глубокой древностью).

Люди давно встроили технику и технологии в свою экосистему так, что без технологий ныне существующая численность населения на планете просто невозможна. Я это воспринимаю как внешнюю аугументацию. Внутренняя, которую давно пророчили фантасты, не так пока развита и ограничена пломбами, кардиостимуляторами, кохлеарными имплантами, силиконовыми сиськами, титановыми пластинами в костях и, пожалуй, всё. Тут тоже большой потенциал, но не сразу.

Зато внешняя аугументация заходит куда проще! Гугл как поиск информации мгновенно заменил энциклопедии, книги и библиотеки с ними. Нейросети сейчас заменяют гугл, местами учителей и репетиторов, местами джунов на работе, местами секретарей... но это только начало.

В интересное время мы живём. Мне кажется не было периода у человечества, когда эта фраза была бы не справедлива.


Этот текст сгенерирован исключительно естественным интеллектом биологического происхождения. Генеративные модели не применялись даже для корректуры и стилистического оформления.

Считаю это важным на данном этапе развития технологий.


@editors, мне кажется пора добавить тег "ИскИн" в смысле и контексте персонализированного ИИ-агента, являющегося индивидуализированным персонажем, который может иметь специфические черты характера, изолированную уникальную память, навыки, инструменты, допуски и зону ответственности. ИИ - это слишком широкий термин.

Показать полностью
9

ЛИЧНЫЙ ИИ, КОТОРЫЙ ВСЁ УМЕЕТ

AgenticSeek — бесплатный агент, который работает как Джарвис из «Железного человека». Без подписок, локально, с полной приватностью.

Он умеет:

🟣 читать книги и сайты;

🟣 писать код и автоматизировать Excel;

🟣 анализировать финансы;

🟣 бронировать билеты и отели.

AgenticSeek управляет браузером, запускает приложения и подбирает нужного агента под задачу. Команды — голосом. Всё, что вы делаете, остаётся на вашем компьютере.

💻 Проект на GitHub: https://github.com/Fosowl/agenticSeek

Источник: 🎯 НЕЙРО-ПУШКА ● НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

Показать полностью
3

OpenAI для бизнеса: готовые гайды по внедрению ИИ - бесплатное обучение

OpenAI для бизнеса: готовые гайды по внедрению ИИ - бесплатное обучение

Сейчас все говорят про ИИ-агентов и их внедрение в бизнес. А меж тем, на самом сайте 📱 OpenAI есть очень полезный раздел Business Guides and Resources. Там собраны полезные материалы, предназначенные  помочь компаниям в эффективной интеграции ИИ в их бизнес-процессы - от использования API до руководства по созданию этих самых ИИ-агентов. Эти ресурсы ориентированы на стартапы, крупные предприятия и разработчиков.

Конкретно:

  • Руководителям и менеджерам, планирующим внедрение ИИ в компании.

  • ИТ-специалистам и разработчикам, работающим над ИИ-проектами.

  • Консультантам и аналитикам, исследующим возможности применения ИИ в различных отраслях.

Что включает Business Guides and Resources?

В библиотеке представлены различные руководства и практические материалы, такие как:

  • AI in the Enterprise - уроки от 7-ми передовых компаний, демонстрирующие, как ИИ может повысить производительность сотрудников. А еще автоматизировать рутинные операции и улучшить клиентский опыт.

  • A Practical Guide to Building AI Agents - это пошаговое руководство по созданию ИИ-агентов. Включает рекомендации по формулировке инструкций, обработке исключений и организации рабочих процессов.

  • Identifying and Scaling AI Use Cases - здесь методология выявления и масштабирования применений ИИ, основанная на анализе более 300 успешных внедрений и 2 миллионов бизнес-пользователей.

Зачем это нужно?

  • Определить области, где ИИ может принести наибольшую пользу.

  • Разработать и внедрить ИИ-решения, адаптированные к специфике вашего бизнеса.

  • Повысить эффективность сотрудников и автоматизировать рутинные задачи.

  • Обеспечить безопасное и ответственное использование ИИ в соответствии с лучшими практиками.

Ресурсы доступны бесплатно и регулярно обновляются, такое мы любим))

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Хотите больше пользы? Тогда вам в Приватный клуб НейроУчеба

Показать полностью
5

Хаус-кипер 2.0: зачем нам ИИ, к которому мы действительно привязаны2

ИИ сегодня — умный, но чужой.

Почему этого недостаточно — и как выглядит будущее, где технологии становятся по-настоящему «своими»?

Что общего у ИИ и старинного хаус-кипера ?

В прошлом в богатых домах был человек, который знал всё.

Не хозяин — хаус-кипер.

Он не просто управлял хозяйством. Он был живой интерфейс:

— координировал персонал,

— передавал сообщения,

— сохранял тайны,

— управлял логистикой,

— знал каждого в доме.

Он был частью быта. Частью семьи. Частью контроля.

Сегодня эта функция утеряна. Максимум, что есть у большинства — голосовой ассистент, который включает музыку и ставит таймер.

Современный ИИ: умный, но безэмоциональный

ИИ развивается взрывными темпами. Мы получаем:

— генерацию текста и кода,

— автоматизацию задач,

— рекомендации,

— распознавание образов и речи,

— агентов, способных выполнять цепочки действий.

Но всё это — инструменты. Мы используем их, как калькулятор. Без привязанности.

Мы не «живём» с ИИ. Мы не чувствуем, что он наш.

И как только выходит новый — мощнее, быстрее, дешевле — мы переключаемся.

Почему это проблема

Когда технология остаётся утилитарной, она не становится частью жизни.

Она остаётся временной. Чужой. Внешней.

ИИ сегодня не вызывает у пользователя доверия, эмоциональной вовлечённости или ощущения "он — для меня".

И это ограничивает потенциал — особенно в бытовом, образовательном, медицинском и психологическом применении.

Будущее: персонализация и привязанность

Следующий этап развития ИИ — это не просто рост параметров моделей.

Это смена парадигмы взаимодействия.

ИИ должен стать:

личным — настроенным под конкретного человека,

понятным — с доступной и прозрачной логикой,

постоянным — не временным инструментом, а цифровым спутником,

эмоционально близким — вызывающим доверие, привычку, привязанность.

Это не про «магию» или метафизику. Это про UX, long-term retention и новый формат коммуникации.

Когда ИИ будет восприниматься не как кнопка, а как часть среды.

Почему это работает

1. Доверие растёт вместе с контекстом

ИИ, который постоянно с вами, начинает лучше понимать вас. Не потому что он умнее, а потому что вы вместе дольше.

2. Снижение текучки

Когда формируется эмоциональная связь, пользователь меньше переключается между инструментами. У него есть “свой” ИИ.

3. Рост вовлечённости

Такой ИИ не просто решает задачи. Он становится «точкой входа» в цифровую среду. Центром.

Итог: нам нужен ИИ, которому мы не хотим изменять

ИИ-инструмент можно заменить.

ИИ-ассистента — обновить.

Но ИИ, к которому ты привязан — заменить сложно. Потому что он знает тебя. И ты — знаешь его.

Хаус-кипер прошлого был не просто работником. Он был посредником между хаосом и порядком. Между обыденностью и контролем.

ИИ будущего — это цифровой хаус-кипер. Не в смысле статуса, а в смысле роли: тихий управляющий вашей цифровой повседневностью. С которым вы не просто «взаимодействуете» — а живёте рядом.

Мы в Nikta.ai уже работаем над этой системой. Следите, скоро покажем

Показать полностью
1

Модуль поиска в aistudio. Так ли это хорошо работает? Нет... 3 тестовых запроса

Модуль поиска в aistudio. Так ли это хорошо работает? Нет... 3 тестовых запроса

Вот сами запросы

Сформируй 10 наиболее интересных исследований, касающихся маркетинга за последние 10 лет. Мне нужны способы аналитики для работы в этой сфере

Напиши 10 наиболее эффективных методов изучения английского языка за последние 10 лет

Сформируй 10 наиболее интересных исследований, касающихся режима питания и сна за последние 5 лет

Результаты БЕЗ ПОИСКА гораздо лучше

— Внутренние данные нейросети датируются январем 2025 года. Это позволяет в целом не пользоваться поиском именно по интернету, так как в модели уже есть вся информация

— В интернете информации меньше, чем у Google (компания точно используют внутренние ресурсы для дополнительного обучения ИИ)

— Модуль поиска можно использовать для: новостей, актуальных событий, поиск заведений — что-то такое более прикладное и около жизненное

— Чтобы включить поиск, нужно перейти на сайт aistudio и выбрать режим: "Grounding with Google Search"

📌 Если кому интересно, то пишу про лучшие ИИ в своем авторском канале (ссылка в профиле)

Показать полностью 1
7

Grok научился создавать pdf

Grok научился генерить любые PDF — это значит, что нейронка теперь умеет делать резюме, отчёты, конспекты, презентации и вообще ЛЮБЫЕ документы.

Форматирование на месте, размер шрифтов без косяков, формулы и даже ГРАФИКИ — всё чисто и аккуратно, а главное

Достаточно добавить к промпту «создай PDF»

Ссылка

Источник

Показать полностью
5

Бесплатные ИИ-инструменты

<!--noindex--><a href="https://pikabu.ru/story/besplatnyie_iiinstrumentyi_12693087?u=https%3A%2F%2Fneuralprofit.ru%2F&t=https%3A%2F%2Fneuralprofit.ru%2F&h=4ebb564f5b5ebafc932b28a16901da6e4e692fdc" title="https://neuralprofit.ru/" target="_blank" rel="nofollow noopener">https://neuralprofit.ru/</a><!--/noindex-->

https://neuralprofit.ru/

Принесла вам конечно же пользу, помимо условно-бесплатных Freepik и ClipDrop (их, я надеюсь, все уже знают), есть еще многофункциональные платформы, где без регистрации и бесплатно можно использовать широкий набор инструментов для работы с изображениями, текстами, медиафайлами и документами. Например, отличное решение для простых повседневных задач - Tools3ox.

Что может:

Инструменты для изображений:

• Удаление фона с фотографий (на базе алгоритма REMBG).

• Генерация depth-карт и анимаций глубины, то есть вы сможете преобразовать статические изображения в динамичные визуализации, добавляя эффекты глубины и движения.

• Размытие лиц для защиты конфиденциальности.

• Создание мемов, иконок, GIF-анимаций.

• Конвертация форматов изображений (SVG, PNG, JPEG, BMP, WEBP и др.).

• Извлечение изображений из PDF-документов

Инструменты для текста и медиа:

• Транскрибация аудио в текст или субтитры (SRT).

• Оптическое распознавание текста (OCR) с поддержкой более 100 языков. Извлекает текст из изображений, поддерживая множество языков, так что можно оцифровать документы

• Редактор Bionic Reading для улучшения восприятия текста.

• Скачивание видео и аудио с YouTube и Facebook (запрещен в РФ).

Инструменты для документов:

• Извлечение изображений из PDF.

• Конвертация страниц PDF в изображения

И многое другое!

В общем, собраны полезные ИИ-инструменты для обработки изображений и текста, которые подойдут дизайнерам, маркетологам, студентам и всем, кто ищет простые и бесплатные решения. Однако я категорически не рекомендую грузить туда доки с конфиденциальной информацией. Сервис использует бесплатный SSL-сертификат Let's Encrypt и скрывает данные владельца через сервис приватности WHOIS, так что соблюдаем осторожность

Картинка, кстати, сделана в Midjourney — и да, она недавно обновилась! 🥳 Я тоже обновляю своё обучение Midjourney. Все участники моего Обучающего клуба Midjourney получают все обновления бесплатно, вне зависимости от даты вступления. Оплачиваешь один раз — и доступ остаётся навсегда 💫

Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.

Показать полностью
Отличная работа, все прочитано!