Нейросеть проводит диагностику лучше большинства врачей
Пока живые врачи убеждают пациентов (и друг друга заодно), что искусственный интеллект никогда-никогда их не заменит, интеллект этот продолжает развиваться. Да так, что уже сейчас не оставляет кожаным ни единого шанса во многих областях.
Несколько дней назад ребята и девчата из Google DeepMind представили результаты сравнения работы специализированной медицинской нейросети AMIE и привычных нам пока человеческих докторов.
TL:DR; кожаные проиграли практически везде.
Суть эксперимента: специально нанятые актёры-пациенты имитировали встречу пациента с докторами нескольких специализаций в текстовом чате. «Пациенты» одновременно общались и с AMIE и с живыми докторами. В 105 сценариях были разобраны три случая:
Проблемы с кожей. Пациенты скидывали в чат фото дефектов кожи и просили посмотреть, что там;
ЭКГ. Высылалась кардиограмма, по которой нужно было определить наличие или отсутствия проблем с сердцем;
Общие анализы. В чат закидывали сканы, фото и PDF-файлы с результатами нескольких анализов и прошлых консультаций с просьбой максимально полно их расшифровать.
Исследование, как водится, было рандомизированным и слепым. Ни врачи, ни пациенты не знали, с кем общаются. Качество ответов точно также отслеживало 18 живых докторов контрольной группы из разных стран. В общем, подыграть мясным или железным никто не мог:
Как и было сказано, нейросеть заборола реальных врачей практически везде. Её ответы были более подробны, эмпатичны, понятливы. Пациенты чувствовали, что на той стороне находится кто-то, кто действительно хочет решить их проблемы, оттого их мотивация для дальнейшего лечения сильно возросла. В общем, ИИ мастерски втёрся в доверие к глупым людишкам.
Но эмпатия и доверие — это хоть и важная составляющая лечения, но не главная. Важнее правильно поставленный диагноз и назначенное лечение с последующим контролем.
Как и в предыдущем случае, тут AMIE тоже оказалась на высоте.
Во-первых, нейросеть в разы лучше людей работала с некачественными фото и документами. Там, где люди требовали предоставить более качественный материал, нейросеть всё распознавала.
Во-вторых, точность и полнота рекомендаций у нейросети были выше, опять же — в разы.
В-третьих, результаты диагностики точно также превосходили человеческие, причём во всех категориях. Мало того, когда нейросеть или живой врач «галлюционировали» и видели в документах то, чего там на самом деле нет, нейросеть всё равно выдавала более точный итоговый диагноз.
Из минусов: хотя исследование чётко показывает, что AI лучше людей, речь идёт о консультациях в чате. Если бы приём проводился оффлайн, врач имел бы возможность полноценно осмотреть пациента, и, возможно, его результаты были бы лучше.
С другой стороны, врачи, которые проводят полноценный осмотр в нынешнее время тоже большая редкость. К тому же, нейросеть ровно также может запросить больше фото поражённых участков, если ей что-то непонятно.
В качестве базовой системы ИИ выступала Gemini 2.0 Flash – мультимодальная нейросеть, специально натренированная выполнять медицинские сценарии. Представили её в декабре 2024 года и даже на тот момент она сильно отставала от лидеров рынка. Сейчас уже во всю тестируется версия 2.5, которая лучше и понимает, и отвечает на вопросы.
Учитывая скорость развития нейросетей, прогноз остаётся прежним — через 3 года подавляющее большинство врачей можно будет заменить на искусственный интеллект. К тому времени AI достигнет настоящей универсальности, и сможет, например, полноценно общаться не только в чате текстом, а генерировать виртуальные личности докторов, с которыми можно будет общаться привычным образом.
P.S. Ещё у меня есть бессмысленные и беспощадные ТГ-каналы (ну а как без них?):
Вот тут про молекулярную биологию, биотех и новых исследованиях: https://t.me/nextmedi;
Мой личный, куда сваливается наука и всякое гиковское: https://t.me/deeplabscience.












