Сообщество - Искусственный интеллект

Искусственный интеллект

5 055 постов 11 479 подписчиков

Популярные теги в сообществе:

Цифровая трансформация и ИИ-тификация

Чем только компании не занимаются под видом цифровой трансформации. Разбираем, что это такое и из каких элементов состоит этот процесс.

Первым делом следует определить термин "трансформация". Так вот, четкого определения нет! В генетике, лингвистике, электронике, бизнесе и праве термин определяет разные процессы, но есть одна общая составляющая, которую и возьмем за основу.

Трансформация - это переход из одного состояния в другое

Это означает, что прежде чем затевать трансформацию бизнеса, необходимо определить два состояния: 1) из которого происходит трансформация и 2) во что будет трансформирована компания.

Таким образом, трансформация в бизнесе, это смена бизнес-модели, структуры или рынка с определенной целью, а цифровая означает, что эти изменения происходят с помощью технологий.

В цифровой экономике, основными направления трансформации являются:

  • Переход от торгово-производственной модели на сервисную

  • Переход от корпоративной организационной стриктуры на экосистему

  • Замена маркетинга на продуктовый подход

  • и т.п.

Казалось бы, очевидная вещь, но по факту ни одна из корпораций не указывает два этих состояния в своих стратегиях, и поэтому трансформация сводится к бессмысленному внедрению IT-систем и ИИ.

Нет смысла улучшать то, что само по себе устарело концептуально

Дмитрий Трофимов, Управляющий директор департамента развития корпоративного бизнеса Сбербанка под цифровой трансформацией понимает: "Цифровая трансформация — новая грань для бизнеса, и она может быть любой." Стратегия цифровой трансформации Яндекса ориентирована на персонализацию и непрерывную адаптацию к потребностям, интересам и предпочтениям пользователей и т.д.

Так во что трансформируется бизнес?

Необходимость трансформации

Любой рынок со временем насыщается и бизнес вынужден искать новые источники дохода. Возрастает гиперконкуренция - всё что вы сделаете, мгновенно скопируют. Никто больше не позволит создавать уникальные товары или услуги, а конкуренция становится чересчур затратной и нецелесообразной.

Единственными залогами роста в условиях неопределенности становятся: скорость развития, команда лидеров и лояльность клиентов

Скорость обеспечивает наличие продуктовой стратегии и отлаженные процессы генерации гипотез, лидерство формирует децентрализована организационная структура, а лояльность возникает на базе качественного уровня сервиса.

Трансформация, это часть долгосрочного стратегического планирования. Важно учитывать, что это длительный и болезненный процесс, который необходимо инициировать заранее. Предстоит провести аудит потенциала текущего бизнеса, разработать Карту Возможностей, избавиться от сопротивления корпоративных козлов и многое другое.

Почему же трансформацию называют цифровой? Потому что, такие изменения происходят с помощью технологий, точнее, технологических направлений:

  • Информатизация - обогащение компании данными и знаниями

  • Механизация - обеспечение работников механизмами

  • Роботизация - замена рабочего на механизмы

  • Оцифровка - перевод аналоговых данных в цифровые (кассеты, книги, документы и т.п.)

  • Цифровизация - избавиться от бумаги

  • Автоматизация - избавиться от рутины

  • ИИ-тификация - избавиться от человека

ИИ-тификация, это новый подход в цифровой трансформации, цель которого - избавиться от сотрудников. При Автоматизации сотрудник получает цифровые инструменты вроде CRM и т.п. но сохраняет за собой функции управления, ИИ же принимает все решения самостоятельно и сотруднике просто нет потребности.

Многие путают, внедрение ИИ и ИИ-тификацию. Так в CRM можно внедрить элементы ИИ, но в бизнес смысле это будет все та же автоматизация только более продвинутым инструментом.

Одна из проблематик в цифровой трансформации, это фокус на технологиях, а не на целях. Внедрение IT не является трансформацией и далеко не обязательно. Трансформировать бизнеса можно и без каких-либо технологических новшеств.

Вначале трансформация, потом автоматизация и цифровизация

Если Совет Директоров осознает неизбежность изменений, то к цифровой трансформации следуют привлекать экспертов высшего уровня. Ведь создается плацдарм для дальнейшего долгосрочного развития и если изначально заложить некорректный фундамент, то времени и ресурсов перестроиться просто может не хватить.

Специализируюсь на стратегии, цифровой трансформации и продуктовых подходах. Подписывайтесь на VC канал Ivano Digital и в Телеграм: Ivano Digital.

Показать полностью 1
4

ИИ предсказывает движение планет. Но плохо

Учёные смоделировали 10 миллионов солнечных систем. Без каких-либо ухищрений – просто поставили в центр каждой системы звезду, вокруг поместили планеты разных масс и запустили всё это дело вращаться по закону Ньютона. Возможно, на седьмой день они почили от дел своих, но в статье об этом не упоминается

Дальше на каждую из солнечных систем натравили нейросеть-трансформер. Она должна была предсказывать движения планет. Похожим образом тренируется модель в основе ChatGPT. Справилась ли нейросеть? Да, предсказание траекторий планет было идеальным. Но вот законы, которые она предложила для объяснения движения – совсем не похожи на тот, что вы учили в школе. Например, один из них выглядит как cos(cos(m)). Возможно, именно по этому закону сейчас вращается в могиле Ньютон


Кроме того, несмотря на идеальное предсказание траектории планет, предсказанные силы у нейросети выглядят ну очень абсурдно. На видео силы показаны стрелками: слева – настоящий закон, справа – предсказанный трансформером. Для других солнечных систем предсказания, как правило, вовсе не работали

Стартапер в области ИИ утверждает, что 10 миллионов примеров – это слишком мало. Физик отвечает, что у Ньютона был один

Помимо физиков и программистов, случай обсуждают и биологи. Сейчас много шума вокруг моделей, обещающих решить все проблемы биологии, если научиться предсказывать поведение генов. Верно ли это предположение? Как показывает этот пример (и ещё больше в статье), даже отличные предсказания не означают понимание

человек наук будет держать в курсе, когда ИИ достигнет человеческого мастерства в ошибках

Показать полностью
4

Проблема с генерацией персонажей и стиля. Нужна помощь. Lora

Проблема с генерацией персонажей и стиля. Нужна помощь. Lora

Привет! Я создаю геймифицированный проект, основанный на уникальном визуальном мире — с маскотами, лором, уровнями, скинами, кастомизацией и мини-комиксами.

Я уже придумал визуальную концепцию и лор, прописал сезоны и развитие маскотов, написал сценарии мини-комиксов, однако упёрся в создание контента.

Ввиду скромных бюджетов (делаю на свои деньги) решил обратиться к AI для генерации картинок и персонажей.

Я уже 3 месяца в свободное от работы время пытаюсь стабильно генерировать персонажей с помощью LoRA / Stable Diffusion / ComfyUI и сервисов типа SeeArt, однако у меня это не получается.

Моя цель — создать два стабильных визуальных стиля:

  • Главный герой маскот

  • Визуальный стиль

Прошу помощи либо вашего совета🙏

Что я уже пробовал?

  1. DALLE и Sora.

Начинал с базовых AI, получил набор базовых генераций, благодаря которым у меня есть чёткое представление о том, как всё должно выглядеть — датасет, сценарии и готовая вселенная.

Однако, сколько я не пытался рисовать целые комиксы либо отдельные сцены, постоянно прыгало освещение, стиль либо фильтр – а особенно персонажи. Задался вопросом как это можно стабилизировать? Так я узнал о Lora.

2. ComfyUI, kohya

Месяц я пытался развернуть ComfyUI, kohya на своем компьютере (GTX 3070Ti) при помощи ChatGPT, однако без познаний в кодинге постоянно лезли какие-то ошибки и я бросил это.

3. Civitai + Seeart

Дальше я обратился к готовым сервисам для создания Lora.

Еле как сгенерировал два отдельных датасета под персонажа и под визуальный стиль (по 17 картинок) и пошел перебирать различные настройки для создания Lora через Civitai, weights, shakker.

Сначала делал на основе FLUX-модели, однако все время получал не то. Когда попробовал SDXL начал получать +/- подходящие Lora.

В итоге через пару недель сделал Lora через shakker и загрузил в seeart.

Дальше пару недель я перебирал все возможные настройки, ControlNet функции, ослаблял либо усиливал силу моих Lora – в итоге сделал несколько выводов:

Canny (ControlNet) – просто накладывает моего идеального маскота поверх изображения без понимания композиции кадра

Depth (ControlNet) – нарушает форму пина хотя рисует окружение в нужной мне стилистике.

Остальные ControlNet функции тоже оказались для меня не актуальными.

Рабочая доска в Miro

Рабочая доска в Miro

Пока так и не удалось добиться:

  • Стабильного визуального стиля (от изображения к изображению меняется форма, стиль, пропорции)

  • Контроля над персонажем (невозможно повторить одного и того же маскота в нужной позе/ракурсе)

  • Производства комиксов с единой стилистикой

Я не художник и не ML-инженер, но у меня есть чёткое представление о том, как всё должно выглядеть — референсы, сценарии и готовая вселенная.

Понимаю, что можно развернуть системы типа ComfyUI на арендованном GPU и углубится в создание персональных инструментов, однако чувствую, что уже много потратил на это времени.

Помогите советами:

  1. Действительно ли реализация подобной идеи через AI затрачивает столько усилий или только я хожу "вокруг да около"?

  2. Какая модель и есть ли точные решения для того, чтобы это развернуть на моем либо арендованном GPU, чтобы мог создавать сцены, комиксы как на конвеере?

  3. Есть ли инженеры-фрилансеры, которые занимаются разработкой и установкой SD с кастомной LoRA/ControlNet, чтобы я дальше сам мог генерировать сцены с персонажами?

Либо вообще стоит нанять AI-художника для создания сцен / персонажей и не тратить свое время? Сколько это стоит?

Буду очень признателен вашей обратной связи!

Показать полностью 2
1

HaircutAI подбор стрижек

Примеряем новую стрижку до похода в барби-шоп — подъехал сервис HaircutAI, который работает как личный стилист

Нужно просто загрузить фото, а дальше все сделает нейромагия — ИИ проанализирует черты лица, и выдаст варианты стрижек, которые будут смотреться идеально

Ссылка

Источник

Показать полностью
4

Аудио-подкасты в NotebookLM

Новые форматы аудио-подкастов завезли в NotebookLM.

Теперь можно выбрать один из форматов:

- Deep Dive — глубокий разбор материала.

- Brief — короткое саммари на 1-2 минуты с ключевыми моментами.

- Critique — для конструктивного фидбека.

- Debate — дискуссия между двумя спикерами, показывающая разные точки зрения.

Поддерживает русский язык, потестить можно бесплатно.

Ссылка

Источник

Показать полностью
4

Ответ на пост «Генератор рассказов Visual Story Writing»1

А ведь давно уже напрашивается что-то вроде IDE (Интегрированная среда разработки) для писателей. Мне придумалось что-то эдакое лет ещё десять назад, но тогда у нас не было таких LLM и всю разметку тегами текста пришлось бы делать человеку.

Сейчас же с нынешними возможностями обработки естественного языка генеративными моделями можно автоматизировать огромное количество писательской рутины.

Давайте набросаем тезисный перечень фич такого редактора для художественной литературы.

- Книга как проект

Литературное произведение в ходе написания представляет собой каталог с файлами и подкаталогами. Внутри исходники, а итоговый текст собирается и компилируется из этих исходников в любой момент или даже в фоновом режиме.

- Декларативный подход к базовым основам произведения

В "исходниках" книги для формализованного описания миров, локаций, персонажей и прочего можно использовать декларативную систему "фактов" в виде формальных предикатов.

- Структурный подход и модульность

Какие-то сущности, например мир, локация или персонаж могут использоваться в серии книг. Тогда декларативное описание их можно выделить в подключаемый модуль и использовать в разных литературных (и не только) произведениях. Наверно такой подход был бы очень удобным для написания фан-фиков.

- Версионность

Раз книга наша представляется в виде исходников с декларативными и структурированными описаниями, то напрашивается использование классических или специализированных систем управления версиями, типа git или mercurial. Тогда вся работа над книгой будет концептуально разбита на цепочку поэтапных атомарных изменений, а реализация отдельных эпизодов и пробных вариантов развития событий может быть выделена в отдельные ветви.

Кроме того, ветви можно по-разному тегировать, подвергать слиянию, а распределённость репозитория позволит работать над большими книгами в коллаборации нескольким авторам одновременно не мешая при этом друг другу.

Также сюда подпадают такие концепции как "канон", альтернативные концовки и прочее.

- Непрерывная публикация

Да, речь о чем-то вроде CI\CD. В ходе работы над книгой можно настроить пайплайны так, чтобы скомпилированный результат всегда был готов к публикации не только для главной ветки разработки книги, но и для побочных веток. Эти результаты можно сравнивать целиком или частями, подвергать аналитике с использованием LLM, устраивать голосования по выбору основной ветки развития сюжета, оценивать получившуюся целостность образа персонажа, или мира.

Таким образом можно разрабатывать художественные книги в режиме opensource или закрытым сообществом авторов (при этом не обязательно малочисленным). Тут напрашиваются своеобразные альфа- и бета-тестеры получающегося произведения, редакторы, ревьюеры и прочие неочевидные роли в импровизированной смежной отрасли разработки литературных произведений.

- Инструментарий и прочие полезности от индустрии разработки софта

Благодаря современным LLM (в том числе работающим локально, например через Ollama или lmstudio) IDE может отслеживать ссылки между терминами. Так можно контролировать упоминания локаций и персонажей, каких-то событий и прочих имён, дат, терминов и понятий, чтобы избегать анахронизмов, вписывать их в единую канву повествования, учитывать хронологию и логические причинно-следственные связи.

Таким образом, например, можно щёлкнуть по имени персонажа и быстро прыгнуть на декларативное описание его основных черт, его биографию, "журнал" памяти (времена и локации в которых персонаж узнал тот или иной факт).

Расширяемыми плагинами можно формировать различные дэш-борды по отдельным персонажам (и не только по персонажам), в которых на любой момент времени в таймлайне повествования можно посмотреть, закрепить или откорректировать какие-то характеристики, связанные факты, и прочее. Для ЛитRPG прямо находка будет!

В этом же разделе можно упомянуть различные интерактивные карты местностей и локаций, черпающие информацию из базы знаний проекта. Также карта будет отражать временно́е измерение с полосой прокрутки в рамках охватываемого историей мира или персонажа периода.

Фактически в проекте может быть сформирована своеобразная онтологическая и логическая база знаний, данные из которой будет доступны как языковой модели, анализирующей формируемое произведение, так и алгоритмам контроля логической и исторической целостности.

- Декомпиляция

Интересно, что предложенный выше инструментарий мог бы помочь не только писать новые произведения, но и подвергать деконструкции и всестороннему анализу готовые литературные произведения, сюжеты, сценарии...

Разобрать книгу на перечень персонажей, их характеристики, особенности, таймлайны. Найти анахронизмы, логические нестыковки, заблуждения, альтернативные трактовки, скрытые подтексты и смыслы.

А ещё можно автоматизировать аккуратную фрагментарную замену элементов сюжетной линии произведения. Этот аспект и такое применение может вызвать бурю негативных эмоций и понятное для меня отторжение большинства читателей, но большая сила - это большая ответственность, не оружие убивает и не инструмент ломает, а тот, кто им орудует. Даже если речь о здравом смысле.

Странно думать о том, что кто-то захочет перекомпилировать старую историю так, чтобы Чапаев доплыл, или чтобы Раскольников как-то более драматично разрешил свой внутренний конфликт...

А что если бы главный герой Гарри Поттера оказался девочкой? Или кошкой? Ну это, пожалуй, перебор... или нет?

- Универсальность

Пожалуй описанный инструментарий не реализовал бы все свои потенциальные возможности в одной лишь только литературе. Очевидно, его сильные стороны были бы востребованы и применимы в работе сценаристов, причем не только фильмов и сериалов, но и в игровой индустрии. Ещё такому инструменту порадовались бы, может быть, историки, чтобы анализировать старинные тексты и события. Может быть что-то пригодилось бы в RPG и D&D...

Всё выше написанное следует воспринимать исключительно как праздные фантазии разработчика, который любит почитывать фантастику, но за свою графоманскую жизнь с самой юности не написал ничего обособленного и художественного, что не поместилось бы в пару школьных тонких тетрадей убористым почерком.

Наверняка описанный мною тут флюгенхаймен убьёт всю теплоту и ламповость писательского творчества, или никак не повлияет на индустрию. Судить не мне. А если кто-то почерпнёт из моего словоблудия какие-то незнакомые ранее концепции, то буду счастлив, что именно я нагрузил вашу голову этой, возможно, бесполезной для вас информацией.

Традиционный дисклеймер:

Этот текст написан исключительно силами моего биологического естественного интеллекта без применения искусственных языковых моделей и чего-то, что ныне принято называть искусственным интеллектом. Просто графоманский выподверт исторгнутый по наитию. Не обессутьте за занудство.

Показать полностью
11

Генератор рассказов Visual Story Writing1

Вышел генератор рассказов Visual Story Writing — вместе с текстом создает интерактивную карту мира с путешествием всех героев.

Нейронка поможет придумать интересную историю: можно использовать ее как гейм-мастера для Dungeons and Dragons. Сюжет меняется на ходу, если передвинуть персонажа в новую локацию или связать его с новым предметом.

Пробуем здесь — нужно только сделать бесплатный API-ключ Gemini.

Источник

Показать полностью
7

Qwen3-Max-Preview

Alibaba только что запустили Qwen3-Max-Preview — и это их самый мощный релиз на сегодня!

Qwen3-Max-Preview

Qwen3-Max-Preview

Модель насчитывает более 1 триллиона параметров — серьёзный скачок вперёд. По бенчмаркам она уже обгоняет не только Qwen3-235B, но и тяжеловесов вроде Claude Opus 4 и DeepSeek V3.1.На AIME25 — результат 80,6%, что приближается к уровню o3-mini.Лучше всего показывает себя в математике и программировании — там она просто вне конкуренции.

👉 Попробовать уже можно: chat.qwen.ai А для полноценного опыта — скачайте приложение (сканируйте QR-код на сайте) — там больше функций и удобнее интерфейс.

Я давно использую Qwen для рутинных задач — работает быстро и бесплатно. Посмотрим на Qwen3-Max-Preview сможет ли он стать главным ИИ-инструментом…

Рассказываю о ИИ-инструментах в Cherry Studio Club — канале о практиках применения ИИ.

Показать полностью
Отличная работа, все прочитано!