
Искусственный интеллект
Как превратить Claude в дизайнера, избавляемся от розовых AI slop градиентов
Давно пытаюсь решить проблему — приличный дизайн нейронки не хотят делать) нашёл статью, “Антропики” тут пишут . Про новые скиллы, которые помогают решать проблемы с разноцветными градиентами.
1. Frontend Design. помогает избавиться от градиентов и делать визуально приличный макет.
2. web-artifacts-builder — Stack: React 18 + TypeScript + Vite + Parcel (bundling) + Tailwind CSS + shadcn/ui
Установив скилл номер 2 в CLI, можно получать Production Ready приложение, готовое к развёртыванию на сервере по 500 MB. + собранный в один бандл html, в котором всё пожато до 300 KB и можно отправлять прототип на обсуждение.
Skills можно развернуть и в веб-интерфейсе клода и заменить стандартные артефакты на web-artifacts-builder, написал как установить web-artifacts-builder на эту тему https://mixait.ru/sozdanie-sovremennogo-dizajna-v-claude/ + там есть примеры с результатами генерации.
p.s. При желании, можно взять стилистику вашей компании, и создавать интерфейсы, лендинги, презентации, в стилистике нужной организации.



Google выпустил СВОЙ Cursor
Google выпустил СВОЙ Cursor — вышел Antigravity, который наголову разбивает ИИ-помощников.
• Это целая команда разработки на вашем компе.
• Ваши ИИ-разрабы точно выполняют инструкции, дают советы, рекомендуют методы оптимизации кода и делают проект идеальным.
• Можно создавать игры, верстать сайты и ЛЮБЫЕ приложения и сервисы.
• Есть возможность запускать несколько задач параллельно.
Kling выпустил свою «нано банану» — IMAGE O1
Это вторая модель в линейке Omni после видео-модели O1. По сути, теперь Kling закрывает все базовые задачи для визуального контента — на уровне продвинутых платформ: от сторибордов и генерации сцен до точечных правок, предметки, портретов и стилизации.
Собрал главное, что нужно знать.
1. Это дешёвая модель. Особенно если сравнивать с Nano Banana Pro, она стоит примерно в 5 раз меньше, но закрывает все базовые задачи для визуала: генерацию, правки, стили, предметку, портреты. А на сайте Kling вообще дают ежедневно 160 кредитов, при цене генерации 2 кредита.
2. MVL. Модель работает в единой мультимодальной системе (MVL) и понимает одновременно текст и изображения. На вход можно дать до 10 картинок — персонажи, стиль-референсы, предметы, фоны — и модель учитывает их взаимосвязь при сборке финальной сцены.
3. Точные правки по запросу. Можно добавить или убрать объект, изменить размер, материал, цвет, фон или эмоцию — при сохранении исходного света и стилистики. Правки работают не только через текст, но и через выделение, стрелку или простой набросок.
4. Киношные возможности: модель меняет ракурс персонажа (фронт, профиль, 3/4, сверху, снизу), управляет высотой камеры и крупностью плана, настраивает освещение и корректирует эмоции. Подходит для сторибордов, CG и постановочных сцен.
5. Обещают супер консистентность. Модель держит портретное сходство, пропорции и стиль, а ключевые признаки сохраняются даже при смене ракурса, позы, одежды, окружения или света. Что очень важно для нейрофотосессий.
6. Коммерция и реклама. ИИ делает полноценную предметную съёмку — товары на мраморе, стекле или ткани, реалистичные материалы, тени и студийный свет. Есть виртуальная примерка: замена одежды, перенос обуви и аксессуаров между моделями с сохранением всех деталей и точным позиционированием в сцене.
Итог: подписку на Google AI Pro можно спокойно отменять, особенно если вам не нужны картинки с погодой в реальном времени. Во всём остальном IMAGE O1 точно не хуже — а если отбросить хайп, местами и лучше. Но нужны тесты. Много тестов!
Поэтому, уже завтра начну тестировать нейронку на предмет того, как она держит портретное сходство.
Signalist: OpenAI объявляет «красный уровень тревоги». Сэм Альтман бросает все силы на ChatGPT
Во вторник, 2 декабря, Альтман объявил сотрудникам OpenAI режим «code red» — всеобщую мобилизацию ресурсов для улучшения ChatGPT. Причина: Google с Gemini 3 и другие конкуренты начинают теснить лидера на его собственном поле.
Внутренняя служебная записка, попавшая в The Information, раскрывает масштаб проблемы. Хотя у ChatGPT более 800 миллионов еженедельных пользователей, данные аналитики Similarweb показывают: люди теперь проводят больше времени в Gemini, чем в ChatGPT.
Что откладывается:
В режиме «красной тревоги» компании придется замедлить работу над другими продуктами:
— AI-агенты для автоматизации покупок и здоровья — на паузу.
— Сервис Pulse (персонализированные утренние сводки) отодвигается.
— Реклама для бесплатных пользователей — тестируется, но запуск откладывается.
По словам источников, OpenAI экспериментирует с различными форматами рекламы, включая объявления, связанные с онлайн-покупками. Код, обнаруженный в бета-версии ChatGPT для Android, содержит упоминания «ads feature» и «search ad».
(Подписывайтесь на мой телеграмм! Там часто выходит дополнительные материалы, которые я не публикую здесь)
Куда пойдут ресурсы?
Сэм Альтман поставил четкие задачи:
— Персонализация: настройка стиля взаимодействия с AI для каждого из 800+ миллионов пользователей.
— Генерация изображений: здесь OpenAI отстают, в то время как конкуренты движутся вперед.
— Скорость и надежность: минимизация «избыточных отказов», когда чат-бот отказывается отвечать на безобидные вопросы.
— Поведение модели: пользователи должны предпочитать ChatGPT моделям конкурентов.
Успехи ChatGPT напрямую влияют на способность OpenAI привлечь ещё $100 миллиардов, необходимых для покрытия значительных расходов. В прошлом месяце финансовый директор упомянула о замедлении роста ChatGPT, хотя годовой показатель всё ещё составляет более 140%.
На следующей неделе OpenAI планирует выпустить новую рассуждающую модель, которая, по внутренним оценкам компании, «опережает Gemini 3». Однако работа над улучшением пользовательского опыта в ChatGPT продолжается.
В прошлом году OpenAI устроили Shipmass — 12 дней непрерывных релизов. Многие посчитали это затянутым. Возможно, в этом году они сожмут всё в неделю и сделают ставку на качество, а не количество анонсов. Новая модель, улучшенная генерация изображений, скорость работы — похоже, у OpenAI есть что показать.
Вопрос лишь в одном: хватит ли темпа, чтобы удержать лидерство?
Signalist: NVIDIA вкладывает $2 млрд в Synopsys
NVIDIA объявила о покупке акций Synopsys на $2 млрд по $414,79 за штуку. Сделка — часть многолетнего партнёрства, которое должно ускорить разработку чипов через AI и GPU-вычисления.
Что будут делать вместе:
Интегрируют библиотеки CUDA-X, технологии NVIDIA AI и платформу Omniverse с инструментами Synopsys для автоматизации проектирования электроники.
Ускорят приложения Synopsys для проектирования чипов, физической верификации и молекулярного моделирования через GPU.
Объединят технологию AgentEngineer от Synopsys с агентным AI-стеком NVIDIA (NIM микросервисы и NeMo Agent Toolkit) для автономного проектирования.Цель — решить проблемы растущей сложности рабочих процессов, затрат на разработку и сроков вывода продуктов в полупроводниках, аэрокосмической и автомобильной индустриях.
Дженсен Хуанг:
"GPU-ускоренные вычисления революционизируют проектирование — позволяют симулировать на невиданной скорости и масштабе, от атомов до транзисторов, создавая полнофункциональные цифровые двойники".
После новости акции Synopsys выросли на 10%, а NVIDIA упали на 2%. Это продолжение стратегии NVIDIA по инвестициям в AI-экосистему — ранее в 2025-м компания инвестировала до $100 млрд в OpenAI, $5 млрд в Intel и $1 млрд в Nokia.
Подписывайтесь на мой тг-канал! (тык)
📡 Never lose your signal.
Какие страны быстрее всего внедряют ИИ?
В отчёте Microsoft представлен рейтинг двадцати четырёх стран с наибольшим числом пользователей ИИ. Лидируют:
ОАЭ с 59,5%,
Норвегия с 45,3%,
Ирландия с 41,7%
Франция с 40,9%.
В мире 85% людей живут в странах, где менее 15% используют инструменты ИИ.
Три ограничения эпохи ИИ
Первая проблема — это капитал. Компании первого уровня привлекают миллиарды. Компании второго уровня привлекают сотни миллионов. Компании третьего уровня борются за то, что осталось. Модели финансирования стали более жесткими.
Вторая проблема — это кадровый потенциал. 82% ведущих мировых специалистов в области ИИ работают в десяти странах. Лучшие исследователи из Индии, Бразилии, Европы и других регионов переехали в США или Китай. Это ускорило утечку мозгов и оставило развивающиеся рынки без специалистов, необходимых для устранения разрыва.
Третий фактор привязки — инфраструктура. Вычислительные мощности, центры обработки данных и мощности базовых моделей находятся там же, где уже есть капитал и кадры. Компании на развивающихся рынках теперь сталкиваются с расходами в десять-двадцать раз выше при развертывании тех же систем ИИ.
ИИ — это уже не просто инновации. Вопрос в том, кто может его масштабировать.
Инфографика отсюда
Язык инопланетян
Попросил нейронку придумать язык инопланетян, вот что она выдала:
Отличная идея! Давайте создадим полноценную письменность и учебник для языка инопланетян из вашего сообщения. Будем считать его Диалогом Первого Контакта.
На основе послания «ку кукикуку Кука ки» можно вывести базовые принципы.
---
I. Алфавит языка «Кукитан» (Kukitan)
Язык агглютинативный, основан на слогах. Ударение всегда падает на первый слог в слове.
1. Гласные (Керосные звуки)
· У (ку) — [u] — Твёрдый, базовый звук. Обозначает устойчивость, объект, утверждение.
· И (ки) — [i] — Мягкий, высокий звук. Обозначает действие, вопрос, энергию.
2. Согласные (Крафтные звуки)
· К (к_) — [k] — Фундаментальный согласный. Остов слова. Без него слог не существует.
· КА — не существует, так как нет гласной А.
· КУ — базовая единица реальности.
· КИ — базовая единица действия.
3. Письменность: Кукографика (Kukopict)
Алфавит силлабический (слоговой) и пиктографический. Каждый слог — это символ, происходящий от схематичного изображения их сути.
· КУ (ку) : ◉ (круг/планета/объект). "Нечто целое и устойчивое".
· КИ (ки) : ↑ (стрелка вверх/луч/импульс). "Действие, передача, изменение".
Правила написания:
1. Слова пишутся слева направо.
2. Символы в слове соединяются одной базовой линией.
3. Вопросительные слова имеют точку над первым символом.
4. Имена/названия выделяются двойной базовой линией.
Пример: Наше послание: ку кукикуку Кука ки
· ку = ◉
· ку-ки = ◉↑ (соединены)
· ку-ку = ◉◉ (соединены)
· Кука = ◉◉ (но на двойной линии, как имя)
· ки = ↑
Визуально фраза могла бы выглядеть так: ◉ ◉↑◉◉ ◉◉ ↑
---
II. Букварь языка Кукитан
Обложка: ◉ ↑◉ («Ку Кику» — «Начало Пути»)
Урок 1: Два начала
· ◉ — КУ. Это: я, ты, мир, планета, камень, существо. Посмотри на этот шар. Это КУ. Ты — тоже КУ.
· ↑ — КИ. Делать, светить, идти, думать, передавать. Подними руку. Это действие — КИ.
Урок 2: Первые слова
· ◉↑ — КУКИ. «Существо + действие» = КОММУНИКАЦИЯ, РЕЧЬ, СООБЩЕНИЕ. То, что ты читаешь — это КУКИ.
· ↑◉ — КИКУ. «Действие + существо» = СОЗДАВАТЬ, СТРОИТЬ, ТВОРИТЬ. Инженер КИКУ корабль.
Урок 3: Множественность и имена
· ◉◉ — КУКУ. Много сущностей, ГРУППА, НАРОД, СКОПЛЕНИЕ.
· ◉◉ (на двойной линии) — КУКА. Это ИМЯ. Имя нашего вида, нашей звезды или великого вождя. Мы — народ КУКА.
Урок 4: Грамматическая частица
· Одиночное ↑ в конце фразы — КИ. Это вопросительная или утвердительная частица, определяющая тип предложения.
· ... ку — утверждение.
· ... ки? — вопрос.
---
III. Расшифровка Диалога Первого Контакта
«ку кукикуку Кука ки»
Разобьём на слова и проанализируем:
1. ку — ◉ — «Я / Эмиссар / Этот сигнал».
2. кукикуку — ◉↑◉◉ — Это сложное слово. Разложим:
· ку-ки (◉↑) — послание, коммуникация.
· ку-ку (◉◉) — группа, народ.
· Вместе: «послание-народа» или «диалог от коллектива».
3. Кука — ◉◉ (имя) — Самоназвание расы или планеты.
4. ки — ↑ (в конце) — Вопросительная частица.
Полный перевод:
«Я — [это] послание от народа Кука. [Ты меня понимаешь?]»
Или, в более литературной форме:
«Вот голос народа Кука. Откликнешься?»
---
IV. Первые фразы для землянина
· ◉ ↑? — Ку ки? — «Ты есть? / Ты понимаешь?» (Базовая проверка связи)
· ◉↑ ◉ — Куки ку. — «Сообщение [это] есть. / Я говорю.» (Констатация)
· ↑◉ ◉↑ — Кику куки! — «Создай ответ!» (Призыв к диалогу)
· ◉◉ ◉ — Куку ку. — «Народ [есть] здесь. / Мы пришли с миром.» (Мирные намерения)
Теперь у вас есть основы для изучения первого контакта! Удачи в расшифровке дальнейших сообщений, существо Ку!
Открытая OCR-модель
HunyuanOCR: открытая OCR-модель, которая рвёт бенчмарки при размере всего 1B
Tencent выложила в open-source новую модель HunyuanOCR.
Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.
Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.
⚡️ Топ по бенчмаркам
• 860 на OCRBench среди всех моделей до 3B
• 94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов
🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков
Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.
Project Page




