Что такое «глубокое обучение»?

Для начала вспомним, что такое вообще искусственный интеллект (ИИ) и машинное обучение. Итак, самый широкий из них, а также знакомый почти каждому из нас — ИИ. В самом словосочетании уже лежит разгадка: пытаясь создать интеллект, мы обучаем компьютер выполнять человеческую работу. Например, сыграть с нами партию в шахматы или помочь подобрать покупки на основе тех, что мы совершали раньше. Разумеется, это «интеллект» лишь в довольно поверхностном смысле: он умеет выполнять некоторые узкие задачи, которые раньше считались посильными только человеку. Создание полноценной интеллектуальной машины — пока что дело будущего. Однако, например, в диагностике заболеваний такой узко-заточенный «интеллект», хорошо натренированный на большом количестве примеров решения одной и той же задачи, действительно может превосходить человека в точности (и уж точно превосходит его в скорости и неутомимости).

Машинное обучение, то есть создание гибких компьютерных моделей на основе больших массивов данных, позволяет ИИ развиваться и усваивать ценный опыт. Здесь уже не нужно прописывать все инструкции в коде: машина будет учиться сама, однако учитель ей не помешает — кто-то должен указывать на ошибки. Правда, у такой системы есть и проблемы. Она не способна мыслить абстрактно. Она может прочесть печатный текст, но рукописный, если она не обучалась на нем дополнительно, останется для нее темным лесом. Любые изменения в написании относительно исходных обучающих данных ставят ее в тупик. Как говорится, «это мы не проходили, это нам не задавали» и точка.

Здесь-то и приходит на помощь глубокое обучение. Слышали про нейросеть? Это один из методов машинного обучения. Модель вдохновлена устройством нашего мозга, взаимодействием нейронов. Так вот, глубокое обучение использует сложные искусственные нейросети, которые тоже потребляют огромный объем данных и решают задачи более эффективно. Они даже способны создавать что-то новое на примере изученного: картины, рассказы или музыку.

Схема отношений ИИ, машинного и глубокого обучения. Источник: РБК

При чем здесь коронавирус?

Мы уже упомянули, что нейросети хорошо работают с фотографиями. Исследователи решили воспользоваться этой способностью глубокого обучения, чтобы определять COVID-19 по рентгеновским снимкам грудной клетки при помощи Матлаб. Это поможет врачам получить альтернативное мнение во время диагностики заболевания у пациентов. Сеть «накормили» двумя видами снимков: «здоровые легкие» и «легкие с COVID-19», чтобы она смогла впоследствии выделять последнюю группу. Программа также визуально выделяет результаты работы алгоритма. Это поможет докторам понять, на каком основании сеть приняла решение.

Алгоритм также испытали на рентгеновских снимках с другими болезнями, например с разными типами пневмонии. Этот эксперимент подтвердил, что сеть справляется с задачей и уверенно определяет COVID-19 с точностью 97%.

Бочка дегтя в ложке меда

Если вам кажется, что все выглядит слишком радужно, вы не одиноки. Ведь идеальный алгоритм, способный определять вирус практически в ста процентах случаев — настоящая находка. Казалось бы, его должны срочно начать использовать в больницах. Сейчас попробуем разобраться, почему этого не произошло.

Сначала, обратим внимание на аналогичные ситуации, а именно на достижения глубокого обучения в медицине за последние годы.

  • В 2016 году группа исследователей из Лондона опубликовала метод диагноза диабетической ретинопатии[1] c 86% точностью. Тренировка проводилась на 80,000 фотографий глазного дна.
  • В том же году ученые из Уганды оценили работу сверточных нейронных сетей (CNN) с микроскопическими мазками крови, используя подборку в 10,000 объектов.
  • Двое ученых из Японии попробовали разработать алгоритм для классификации узелков в легких, используя подборку из 550,000 сканов КТ.

Итак, 2020 год, а нейросеть учат определять случаи COVID-19 на барабанная дробь 50 рентгеновских снимках. Нет, не тысяч. Эта подборка смехотворно мала. Более того, в работе использовались лишь снимки с тяжелыми случаями вируса, когда последствия болезни уже сильно отразились на легких. Так что сеть не сможет предупредить вас о надвигающейся опасности — только об уже наступившей.

На этом проблемы не заканчиваются, ведь модель для выявления COVID-19 основана на ResNet-50. Это уже натренированная сеть, которой учителя «скармливали» картинки повседневных объектов, вроде дорожных знаков. Это значит, что она реагирует на геометрические формы и цветовые сочетания, которых просто нет на рентгенах. Именно поэтому большинство нейросетей, используемых в медицине, тренируют с нуля. А здесь взяли модель общего пользования, «уточнили» (это называется fine-tuning) на смехотворно маленькой выборке — и не провели достаточно большого тестирования на разных пациентах.

Ну и на сладкое: эффективность сети проверялась на фотографиях, которые использовали для ее обучения. Благодаря этому модель показала себя с лучшей стороны, а весь проект был выполнен буквально за неделю. Но с точки зрения стандартов Data Science — это полный зашквар и вообще ничего не доказывает. Так что пока этот «прорыв» остается лишь удачной рекламой. Но и делать вывод, что анализ данных не поможет в диагностике COVID-19, тоже было бы неправильно. Просто магии не бывает: сначала надо накопить сотни тысяч снимков для полноценной модели, натренировать ее — и хорошенько протестировать на выборке, которая не использовалась в обучении.

Визуализация объектов с ResNet

Примечания:

[1]Ретинопатия — поражение внутренней оболочки глаза — сетчатки.

Источники

  1. Deep Learning for Medical Imaging: COVID-19 Detection
  2. Detecting COVID-19 with 97% accuracy: beware of the AI hype!
  3. Что такое deep learning и почему о нем все говорят?
  4. Искусственный интеллект — Что это такое и почему это так важно
  5. Как работают искусственный интеллект, машинное и глубокое обучение
  6. MATLAB for Deep Learning