Математические постановки задач обучения LLM, RL, федеративная оптимизация. Александр Безносиков
Градиентный спуск изобрёл Коши в 1847 году. Метод тяжёлого шарика из 1964-го сейчас в PyTorch. Adam — это momentum + адаптивность. Искусственный интеллект — не магия, а красивые математические трюки. Разбираемся, какие именно.
Александр Безносиков — кандидат физ.-мат. наук, заведующий четырьмя лабораториями (МФТИ, МФТИ-Яндекс, ИСП РАН, Иннополис), лауреат премий «Лидеры ИИ» и Yandex ML Prize, автор 75+ статей — показывает математику под капотом ML: от оптимизации до дифференциальной приватности и обучения с подкреплением.
Как математика защищает интернет: от часов до криптографии. Роман Сизов
Вы отправляете сообщения, заходите в банк, передаёте личные данные — по открытым каналам. Почему это безопасно? Ответ не в программировании, а в математике. Модульная арифметика, RSA, протокол Диффи-Хеллмана, эллиптические кривые — всё это построено на идеях, которые можно объяснить на пальцах.
Роман Сизов — математик, криптограф, специалист по информационной безопасности, победитель олимпиад по высшей математике, участник CTF-соревнований — разбирает, как передать секрет по открытому каналу и почему криптосистемы всё равно ломаются.
OCR Тест Gemini, Claude и GPT 5.1 на рукописной математике
Продолжаю развивать нужное приложение для трекинга прогресса в решении задач по математике и физике. Идея в том, чтобы не просто ставить галочку «сделано», а считать время сессий, ловить «инсайты» (моменты озарения) и получать за это очки.
Но есть одна боль: вбивать формулы в телефон — это одна из причин почему это приложение не было сделано раньше. LaTeX на мобилке набирать практически невозможно, а обычный текст превращается в кашу. Поэтому я решил прикрутить фичу: сфоткал тетрадь — и приложение само перегнало рукописное решение в текст.
Чтобы выбрать, какая нейронка будет крутиться под капотом, я написал бенчмарк и устроил прожарку популярным моделям через OpenRouter. В видео выше — подробный разбор полетов, а ниже — краткая выжимка результатов (спойлер: дорого — не всегда лучше).
Условия задачи
Скормил нейросетям фотографию своего решения алгебраической задачи с корнями, степенями и сокращениями. Почерк у меня понятный вроде... так что нейросетям должно было быть легко.
Задача моделей:
Распознать условие.
Понять ход решения.
Перевести всё это в красивый Markdown.
Аутсайдеры
Сразу отсеялись несколько кандидатов:
OpenAPI GPT-5.1 CodexMax: Наделал кучу ошибок, не смог распознать корень 12-й степени из 128.
Claude Haiku 4.5: Чуть лучше, но приняла мою рукописную единицу за семерку. И степень корня неправильно распозналась. В математике это фатально.
Mistral Small 3.1: Вообще не поняла, что происходит на картинке. Забавно, что её "младшая" версия (Ministral 3B) справилась даже лучше - это мило, но все равно плохо.
Битва титанов и вопрос цены
В финал вышли модели от Google, и тут началось самое интересное — экономика.
Gemini 2.5 Pro Справилась хорошо. Распознала всё, включая разложение числа на степени двойки. Хотя и без особых пояснений (что могло косвенно следовать из промпта задания)
Плюс: Высокая точность, понимает логику.
Минус: Это «думающая» модель. Она долго обрабатывала запрос и сожрала 10 центов (~9-10 рублей) за одну фотку. Для частого использования в приложении — неоправданно дорого.
Gemini 3 Flash Preview А вот это — мой фаворит.
Точность: Почти идеальная. Она распознала каракули и даже дополнила некоторые моменты, где я сократил решение в уме, не расписывая это на бумаге.
Ум: Она не просто переписала текст, а объяснила, откуда взялся модуль числа (корень из квадрата) и почему при раскрытии модуля появился минус. Что я не стал расписывать т.к. это очевидно.
Цена: И самое приятное — запрос стоил 0.4 цента (~40 копеек).
Итог
Разница в цене колоссальная: 10 рублей против 40 копеек при сопоставимом (а местами и лучшем) качестве. Flash Preview работает на "автомате" и ассоциациях, не уходя в глубокие раздумья, но для разбора рукописного текста этого оказалось достаточно.
Пока остановился на ней. Если у вас есть опыт с другими моделями для OCR рукописного текста (особенно формул) — делитесь в комментах, интересно потестить что-то еще.
Задача про полоски с дырками
Приветствую всех любителей математики.
Предположим, что есть полоска бумаги, с расположенными в ряд клетками.
Пусть, для начала, количество клеток 12.
Берём вилку, у которой два зуба, с "дыркой" между зубьями h=1 (такой вилкой можно проколоть, например, клетки 1 и 3 или 4 и 6, т.е. между клеток с проколами окажется целая клетка) и проходимся с ней по полоске с клетками. При этом необходимо соблюдать условие - между дырками - соседними "ударами" вилки - должно быть две целых клетки (интервал равен 2)
Потом этой же вилкой проходимся второй раз по этой же полоске, но с интервалом 4.
При этом пытаемся расположить удары вилок так, чтобы было проколото наибольшее количество клеток, т.е. первый удар вилкой мы можем делать в любом месте, а последующие - с обозначенным интервалом вправо (и влево, если это необходимо).
Теперь возьмём новую полоску, на которой 20 клеток.
И пройдёмся по ней вилкой с первыми условиями. Но теперь добавим ещё одну вилку, у которой два зуба, с дыркой h=3 и пройдёмся по полоске так же два раза с интервалами 6 и 8 соответственно для каждого раза. Так же, как и прежде, пытаемся расположить удары всех вилок так, чтобы было проколото наибольшее количество клеток, т.е. первый удар вилкой при очередном проходе мы можем делать в любом месте, а последующие - с обозначенным интервалом вправо (и влево, если это необходимо).
По следующей полоске, на которой 28 клеток, проходятся уже три вилки (каждая по два раза) с "дырками" 1,3 и 5 с интервалами 2 и 4, 6 и 8, 10 и 12 (соответственно). Так же, стараемся проколоть наибольшее количество клеток.
Если для последующих полосок мы будем соблюдать те же условия:
- увеличиваем количество клеток на полоске на 8
- увеличиваем количество вилок на одну
- увеличиваем дырку на новой вилке на 2
- проходимся каждой вилкой два раза
- увеличиваем интервалы на 4 (от интервалов последней вилки)
То какие из утверждений будут верны:
1. невозможно проколоть все клетки на любой полоске
2. начиная с некоторой полоски все последующие могут быть проколоты полностью
3. при любом увеличении полоски, среди полностью проколотых, найдётся такая, которую невозможно проколоть полностью.
Ну что, будем пробовать нарезать и прокалывать полоски ?
Удачи в решении !
Произведение десятичных цифр натурального числа равно 14. Может ли такое число быть точным квадратом?
Произведение десятичных цифр натурального числа равно 14. Может ли такое число быть точным квадратом?



