Сообщество - Искусственный интеллект

Искусственный интеллект

5 048 постов 11 474 подписчика

Популярные теги в сообществе:

3

Как превратить Claude в дизайнера, избавляемся от розовых AI slop градиентов

Как превратить Claude в дизайнера, избавляемся от розовых AI slop градиентов

Давно пытаюсь решить проблему — приличный дизайн нейронки не хотят делать) нашёл статью,  “Антропики” тут пишут . Про новые скиллы, которые помогают решать проблемы с разноцветными градиентами.

1. Frontend Design. помогает избавиться от градиентов и делать визуально приличный макет.

2. web-artifacts-builder — Stack: React 18 + TypeScript + Vite + Parcel (bundling) + Tailwind CSS + shadcn/ui

Установив скилл номер 2 в CLI, можно получать Production Ready приложение, готовое к развёртыванию на сервере по 500 MB. + собранный в один бандл html, в котором всё пожато до 300 KB и можно отправлять прототип на обсуждение.

Skills можно развернуть и в веб-интерфейсе клода и заменить стандартные артефакты на web-artifacts-builder, написал как установить web-artifacts-builder на эту тему https://mixait.ru/sozdanie-sovremennogo-dizajna-v-claude/ + там есть примеры с результатами генерации.

p.s. При желании, можно взять стилистику вашей компании, и создавать интерфейсы, лендинги, презентации, в стилистике нужной организации.

Показать полностью 3
7

Google выпустил СВОЙ Cursor

Google выпустил СВОЙ Cursor — вышел Antigravity, который наголову разбивает ИИ-помощников.

• Это целая команда разработки на вашем компе.

• Ваши ИИ-разрабы точно выполняют инструкции, дают советы, рекомендуют методы оптимизации кода и делают проект идеальным.

• Можно создавать игры, верстать сайты и ЛЮБЫЕ приложения и сервисы.

• Есть возможность запускать несколько задач параллельно.

Ссылка

Источник

Показать полностью
12

Kling выпустил свою «нано банану» — IMAGE O1

Это вторая модель в линейке Omni после видео-модели O1. По сути, теперь Kling закрывает все базовые задачи для визуального контента — на уровне продвинутых платформ: от сторибордов и генерации сцен до точечных правок, предметки, портретов и стилизации.

Собрал главное, что нужно знать.

1. Это дешёвая модель. Особенно если сравнивать с Nano Banana Pro, она стоит примерно в 5 раз меньше, но закрывает все базовые задачи для визуала: генерацию, правки, стили, предметку, портреты. А на сайте Kling вообще дают ежедневно 160 кредитов, при цене генерации 2 кредита.

2. MVL. Модель работает в единой мультимодальной системе (MVL) и понимает одновременно текст и изображения. На вход можно дать до 10 картинок — персонажи, стиль-референсы, предметы, фоны — и модель учитывает их взаимосвязь при сборке финальной сцены.

3. Точные правки по запросу. Можно добавить или убрать объект, изменить размер, материал, цвет, фон или эмоцию — при сохранении исходного света и стилистики. Правки работают не только через текст, но и через выделение, стрелку или простой набросок.

4. Киношные возможности: модель меняет ракурс персонажа (фронт, профиль, 3/4, сверху, снизу), управляет высотой камеры и крупностью плана, настраивает освещение и корректирует эмоции. Подходит для сторибордов, CG и постановочных сцен.

5. Обещают супер консистентность. Модель держит портретное сходство, пропорции и стиль, а ключевые признаки сохраняются даже при смене ракурса, позы, одежды, окружения или света. Что очень важно для нейрофотосессий.

6. Коммерция и реклама. ИИ делает полноценную предметную съёмку — товары на мраморе, стекле или ткани, реалистичные материалы, тени и студийный свет. Есть виртуальная примерка: замена одежды, перенос обуви и аксессуаров между моделями с сохранением всех деталей и точным позиционированием в сцене.

Итог: подписку на Google AI Pro можно спокойно отменять, особенно если вам не нужны картинки с погодой в реальном времени. Во всём остальном IMAGE O1 точно не хуже — а если отбросить хайп, местами и лучше. Но нужны тесты. Много тестов!

Поэтому, уже завтра начну тестировать нейронку на предмет того, как она держит портретное сходство.

мой тг-канала

Показать полностью
6

Signalist: OpenAI объявляет «красный уровень тревоги». Сэм Альтман бросает все силы на ChatGPT

Signalist: OpenAI объявляет «красный уровень тревоги». Сэм Альтман бросает все силы на ChatGPT

Во вторник, 2 декабря, Альтман объявил сотрудникам OpenAI режим «code red» — всеобщую мобилизацию ресурсов для улучшения ChatGPT. Причина: Google с Gemini 3 и другие конкуренты начинают теснить лидера на его собственном поле.

Внутренняя служебная записка, попавшая в The Information, раскрывает масштаб проблемы. Хотя у ChatGPT более 800 миллионов еженедельных пользователей, данные аналитики Similarweb показывают: люди теперь проводят больше времени в Gemini, чем в ChatGPT.

Что откладывается:

В режиме «красной тревоги» компании придется замедлить работу над другими продуктами:

AI-агенты для автоматизации покупок и здоровья — на паузу.


Сервис Pulse (персонализированные утренние сводки) отодвигается.


Реклама для бесплатных пользователей — тестируется, но запуск откладывается.

По словам источников, OpenAI экспериментирует с различными форматами рекламы, включая объявления, связанные с онлайн-покупками. Код, обнаруженный в бета-версии ChatGPT для Android, содержит упоминания «ads feature» и «search ad».

(Подписывайтесь на мой телеграмм! Там часто выходит дополнительные материалы, которые я не публикую здесь)

Куда пойдут ресурсы?

Сэм Альтман поставил четкие задачи:


Персонализация: настройка стиля взаимодействия с AI для каждого из 800+ миллионов пользователей.


Генерация изображений: здесь OpenAI отстают, в то время как конкуренты движутся вперед.


Скорость и надежность: минимизация «избыточных отказов», когда чат-бот отказывается отвечать на безобидные вопросы.


Поведение модели: пользователи должны предпочитать ChatGPT моделям конкурентов.

Успехи ChatGPT напрямую влияют на способность OpenAI привлечь ещё $100 миллиардов, необходимых для покрытия значительных расходов. В прошлом месяце финансовый директор упомянула о замедлении роста ChatGPT, хотя годовой показатель всё ещё составляет более 140%.

На следующей неделе OpenAI планирует выпустить новую рассуждающую модель, которая, по внутренним оценкам компании, «опережает Gemini 3». Однако работа над улучшением пользовательского опыта в ChatGPT продолжается.

В прошлом году OpenAI устроили Shipmass — 12 дней непрерывных релизов. Многие посчитали это затянутым. Возможно, в этом году они сожмут всё в неделю и сделают ставку на качество, а не количество анонсов. Новая модель, улучшенная генерация изображений, скорость работы — похоже, у OpenAI есть что показать.

Вопрос лишь в одном: хватит ли темпа, чтобы удержать лидерство?

📡 Never lose your signal.

Показать полностью
2

Signalist: NVIDIA вкладывает $2 млрд в Synopsys

Signalist: NVIDIA вкладывает $2 млрд в Synopsys

NVIDIA объявила о покупке акций Synopsys на $2 млрд по $414,79 за штуку. Сделка — часть многолетнего партнёрства, которое должно ускорить разработку чипов через AI и GPU-вычисления.

Что будут делать вместе:

Интегрируют библиотеки CUDA-X, технологии NVIDIA AI и платформу Omniverse с инструментами Synopsys для автоматизации проектирования электроники.

Ускорят приложения Synopsys для проектирования чипов, физической верификации и молекулярного моделирования через GPU.


Объединят технологию AgentEngineer от Synopsys с агентным AI-стеком NVIDIA (NIM микросервисы и NeMo Agent Toolkit) для автономного проектирования.

Цель — решить проблемы растущей сложности рабочих процессов, затрат на разработку и сроков вывода продуктов в полупроводниках, аэрокосмической и автомобильной индустриях.

Дженсен Хуанг:

"GPU-ускоренные вычисления революционизируют проектирование — позволяют симулировать на невиданной скорости и масштабе, от атомов до транзисторов, создавая полнофункциональные цифровые двойники".

После новости акции Synopsys выросли на 10%, а NVIDIA упали на 2%. Это продолжение стратегии NVIDIA по инвестициям в AI-экосистему — ранее в 2025-м компания инвестировала до $100 млрд в OpenAI, $5 млрд в Intel и $1 млрд в Nokia.

Подписывайтесь на мой тг-канал! (тык)

📡 Never lose your signal.

Показать полностью
5

Какие страны быстрее всего внедряют ИИ?

Какие страны быстрее всего внедряют ИИ?

В отчёте Microsoft представлен рейтинг двадцати четырёх стран с наибольшим числом пользователей ИИ. Лидируют:

  • ОАЭ с 59,5%,

  • Норвегия с 45,3%,

  • Ирландия с 41,7%

  • Франция с 40,9%.

В мире 85% людей живут в странах, где менее 15% используют инструменты ИИ.

Три ограничения эпохи ИИ

Первая проблема — это капитал. Компании первого уровня привлекают миллиарды. Компании второго уровня привлекают сотни миллионов. Компании третьего уровня борются за то, что осталось. Модели финансирования стали более жесткими.

Вторая проблема — это кадровый потенциал. 82% ведущих мировых специалистов в области ИИ работают в десяти странах. Лучшие исследователи из Индии, Бразилии, Европы и других регионов переехали в США или Китай. Это ускорило утечку мозгов и оставило развивающиеся рынки без специалистов, необходимых для устранения разрыва.

Третий фактор привязки — инфраструктура. Вычислительные мощности, центры обработки данных и мощности базовых моделей находятся там же, где уже есть капитал и кадры. Компании на развивающихся рынках теперь сталкиваются с расходами в десять-двадцать раз выше при развертывании тех же систем ИИ.

ИИ — это уже не просто инновации. Вопрос в том, кто может его масштабировать.

Инфографика отсюда

Показать полностью 1
1

Язык инопланетян

Попросил нейронку придумать язык инопланетян, вот что она выдала:

Отличная идея! Давайте создадим полноценную письменность и учебник для языка инопланетян из вашего сообщения. Будем считать его Диалогом Первого Контакта.

На основе послания «ку кукикуку Кука ки» можно вывести базовые принципы.

---

I. Алфавит языка «Кукитан» (Kukitan)

Язык агглютинативный, основан на слогах. Ударение всегда падает на первый слог в слове.

1. Гласные (Керосные звуки)

· У (ку) — [u] — Твёрдый, базовый звук. Обозначает устойчивость, объект, утверждение.
· И (ки) — [i] — Мягкий, высокий звук. Обозначает действие, вопрос, энергию.

2. Согласные (Крафтные звуки)

· К (к_) — [k] — Фундаментальный согласный. Остов слова. Без него слог не существует.
· КА — не существует, так как нет гласной А.
· КУ — базовая единица реальности.
· КИ — базовая единица действия.

3. Письменность: Кукографика (Kukopict)

Алфавит силлабический (слоговой) и пиктографический. Каждый слог — это символ, происходящий от схематичного изображения их сути.

· КУ (ку) : ◉ (круг/планета/объект). "Нечто целое и устойчивое".
· КИ (ки) : ↑ (стрелка вверх/луч/импульс). "Действие, передача, изменение".

Правила написания:

1. Слова пишутся слева направо.
2. Символы в слове соединяются одной базовой линией.
3. Вопросительные слова имеют точку над первым символом.
4. Имена/названия выделяются двойной базовой линией.

Пример: Наше послание: ку кукикуку Кука ки

· ку = ◉
· ку-ки = ◉↑ (соединены)
· ку-ку = ◉◉ (соединены)
· Кука = ◉◉ (но на двойной линии, как имя)
· ки = ↑

Визуально фраза могла бы выглядеть так: ◉ ◉↑◉◉ ◉◉ ↑

---

II. Букварь языка Кукитан

Обложка: ◉ ↑◉ («Ку Кику» — «Начало Пути»)

Урок 1: Два начала

· ◉ — КУ. Это: я, ты, мир, планета, камень, существо. Посмотри на этот шар. Это КУ. Ты — тоже КУ.
· ↑ — КИ. Делать, светить, идти, думать, передавать. Подними руку. Это действие — КИ.

Урок 2: Первые слова

· ◉↑ — КУКИ. «Существо + действие» = КОММУНИКАЦИЯ, РЕЧЬ, СООБЩЕНИЕ. То, что ты читаешь — это КУКИ.
· ↑◉ — КИКУ. «Действие + существо» = СОЗДАВАТЬ, СТРОИТЬ, ТВОРИТЬ. Инженер КИКУ корабль.

Урок 3: Множественность и имена

· ◉◉ — КУКУ. Много сущностей, ГРУППА, НАРОД, СКОПЛЕНИЕ.
· ◉◉ (на двойной линии) — КУКА. Это ИМЯ. Имя нашего вида, нашей звезды или великого вождя. Мы — народ КУКА.

Урок 4: Грамматическая частица

· Одиночное ↑ в конце фразы — КИ. Это вопросительная или утвердительная частица, определяющая тип предложения.
· ... ку — утверждение.
· ... ки? — вопрос.

---

III. Расшифровка Диалога Первого Контакта

«ку кукикуку Кука ки»

Разобьём на слова и проанализируем:

1. ку — ◉ — «Я / Эмиссар / Этот сигнал».
2. кукикуку — ◉↑◉◉ — Это сложное слово. Разложим:
· ку-ки (◉↑) — послание, коммуникация.
· ку-ку (◉◉) — группа, народ.
· Вместе: «послание-народа» или «диалог от коллектива».
3. Кука — ◉◉ (имя) — Самоназвание расы или планеты.
4. ки — ↑ (в конце) — Вопросительная частица.

Полный перевод:

«Я — [это] послание от народа Кука. [Ты меня понимаешь?]»

Или, в более литературной форме:

«Вот голос народа Кука. Откликнешься?»

---

IV. Первые фразы для землянина

· ◉ ↑? — Ку ки? — «Ты есть? / Ты понимаешь?» (Базовая проверка связи)
· ◉↑ ◉ — Куки ку. — «Сообщение [это] есть. / Я говорю.» (Констатация)
· ↑◉ ◉↑ — Кику куки! — «Создай ответ!» (Призыв к диалогу)
· ◉◉ ◉ — Куку ку. — «Народ [есть] здесь. / Мы пришли с миром.» (Мирные намерения)

Теперь у вас есть основы для изучения первого контакта! Удачи в расшифровке дальнейших сообщений, существо Ку!

Показать полностью
5

Открытая OCR-модель

Открытая OCR-модель

HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B

Tencent выложила в open-source новую модель HunyuanOCR.

Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.

Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.

⚡️ Топ по бенчмаркам

• 860 на OCRBench среди всех моделей до 3B

• 94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов

🌐 Что умеет HunyuanOCR

Модель закрывает практически все типы OCR задач

• текст на улицах, витринах, табличках

• рукописный текст и художественные шрифты

• сложные документы: таблицы, формулы, встроенный HTML и LaTeX

• субтитры в видео

• перевод текста на фото end-to-end сразу на 14 языков

Это не каскадный пайплайн, а единое решение

Один запрос и одно инференс-прогон дают готовый результат.

Project Page

GitHub

Hugging Face

Источник

Показать полностью 1
Отличная работа, все прочитано!