140

Ответ на пост «Нейросеть считает количество пальцев»

Коротко для людей, которые думают что это магия:


1) нейронки это математическая модель. Это значит что они не принимают решения самостоятельно, а просто делают математические операции над числами. x+y=z - это тоже модель, с двух чисел х и y мы получаем другое число z


2) весь прикол в поиске этих моделей, раньше это был действительно сложный процесс, но сейчас даже нормальный студент первого курса(it специальности) без особой базы сможет взять уже готовые фреймворки и натренировать сеть. Есть уже большое колво инструментов для распознавания образов и жестов в свободном доступе


3) половина "дата саентистов" и "ai специалистов" вообще не понимают что они делают, и их рабочий процесс выглядит следующим образом(грубо говоря): собирают 100 картинок собак, вводят разные параметры в фрейморк распознавания образов и он сам ищет что то там общее между картинками и выводит готовую модель. Далее берут других 100 картинок, и проверяют нашла ли готовая модель всех собак на новой партии картинок. Если нет - меняют параметры фреймворка(случайным образом), скармливают больше картинок, и заново тестируют полученную модель, и так пока модель не будет выдавать приемлемое количество совпадений


4) работал на нескольких проектах с распознаванием жестов(спортивные тренажеры, игрушки) и там "спецы" работали именно так как описано в пункте 3, они реально не вдупляли что там происходит в их работе, и потом продукт просто продавался пользователям. А потом выходила новая ревизия продукта с другими сенсорами, и внезапно отличающиеся данные ломали все нейронки, они так же заново делали новые под новое железо :)

Показать полностью
452

Нейросеть считает количество пальцев

Ответ на пост Модель искусственного интеллекта переводит язык жестов


Поскольку некоторые люди в комментариях не поверили в то, что в этой технологии нет ничего революционного, что она доступна всем, кто хоть немножко программирует, и что UNILAD просто ловят хайп на пустом месте, то я решил записать короткое видео.

Писал на Python, модель нейросети - BlazeHand. На весь код - ушло 20 минут, 60 строчек. А дальше уже добавляйте любые жесты.

Ну и пару мыслей на эту тему. Перестаньте уже употреблять термин "искусственный интеллект" где ни попадя. В оригинальном посте даже тэг стоит. Это не он даже близко. Любая нейросеть тренируется на выполнение только одной задачи, и чем она конкретнее, тем лучше. Мы приблизимся к реальному ИИ, когда одна нейросеть сможет выполнять несколько задач, а в этом направлении разработки только ведутся. И хотя не факт, что под капотом полноценного ИИ будут нейросети.

p.s. @dzubeikibagami, привет, как дела? Как оказалось, мне всё таки было не лень.

Показать полностью
Отличная работа, все прочитано!