Перспективы нейронных сетей и глубокого машинного обучения в создании решений для здравоохранения

В работе приведен обзор перспектив применения нейронных сетей и глубокого машинного обучения в создании систем искусственного интеллекта для здравоохранении. Приводится определение и пояснения по тех-нологиям машинного обучения и нейронных сетей. Представлен обзор уже реализованных проектов применения искусственного интеллекта, а также дается прогноз наиболее перспективных, по мнению автора, направлений развития в ближайшее время.

Введение

На сегодняшний день искусственный интеллект (ИИ) считается важнейшей сферой ИТ-исследований и ведущим драйвером прорывного индустриального роста, который в последнее время называют «Индустрией 4.0».

Как электричество изменило и привело к новой промышленной революции в XIX веке, так искусственный интеллект и информационные технологии воспринимаются сегодня как источник глубокой трансформации общества и экономики в XXI веке.

Согласно данным IDC объём рынка решений, основанных на технологиях ИИ, в 2016 году в денежном выражении составил приблизительно 7,9 млрд. долл. В 2017-м, как ожидается, он вырастет на 59,3% и достигнет 12,5 млрд. долл. Аналитики полагают, что до конца текущего десятилетия среднегодовой темп роста (CAGR) окажется на уровне 54%. В результате в 2020 г. объём отрасли превысил 46 млрд. долл. Наибольшую долю этого рынка составят так называемые «когнитивные» приложения, которые автоматически изучают данные и составляют различные оценки, рекомендации или прогнозы, используя методы искусственного интеллекта. Рынок решений на базе искусственного интеллекта в области здравоохранения и наук о жизни, по оценкам Frost & Sullivan, также будет расти до 40% в год, достигнув в 2021 г. уровня 6,6 млрд. долл..

Искусственный интеллект имеет длинную историю, начинающуюся с теоретических работ Тьюринга по кибернетике, датированных началом XX века. Хотя концептуальные предпосылки появились еще ранее, с философских работ Рене Декарта «Рассуждение о методе» (1637) и работы Томаса Гоббса «Человеческая природа» (1640).

Летом 1956 года в Университете Дартмута в США прошла первая рабочая конференция с участием таких ученых, как Маккарти, Минский, Шеннон, Тьюринг и другие, которые впоследствии были названы основателями сферы искусственного разума. В течение 6 недель ученые обсуждали возможности реализации проектов в сфере искусственного интеллекта. Именно тогда и появился сам термин Artificial Intelligence (AI) – искусственный интеллект.

В начале 80-х гг. ученые в области теории вычислений Барр и Файгенбаум предложили следующее определение ИИ: «Искусственный интеллект – это область информатики, которая занимается разработкой интеллектуальных компьютерных систем, то есть систем, обладающих возможностями, которые мы традиционно связываем с человеческим разумом, – понимание языка, обучение, способность рассуждать, решать проблемы и т. д.».

Постенно, по мере развития, понимание термина ИИ уточнялось и изменялось. И в 2017 г. Джефф Безос, CEO Amazon уже так пишет об ИИ: «За последние десятилетия компьютеры автоматизировали многие процессы, которые программисты могли описать через точные правила и алгоритмы. Совре-менные техники машинного обучения позволяют нам делать то же самое с задачами, для которых намного сложнее задать четкие правила».

Фактически в настоящее время на базе методов искусственного интеллекта создаются и развиваются различные программные системы, главной особенностью которых является способность решать интеллектуальные задачи так, как это делал бы размышляющий над их решением человек. К наиболее популярным направлениям применения ИИ относятся прогнозирование различных ситуаций, оценка любой цифровой информации, включая неструктурированные данные, с попыткой дать по ней заключение, а также анализ информации с поиском скрытых закономерностей (data mining).

Считается, что в настоящее время ИИ не под силу в полной мере сымитировать сложные процессы высшей нервной деятельности человека, такие как проявление эмоций, любовь, творчество, которые относятся к сфере так называемого «сильного ИИ», где прорыв ожидается не ранее 2030–2050 годов. Хотя такие попытки уже предпринимаются: например, создание с помощью нейронных сетей музыкальных произведений, распознавание эмоций с перспективой их генерации и даже попытки наделить человекоподобных роботов свободой воли при взаимодействии с людьми.

Пока удается успешно решать задачи так называемого «слабого ИИ», выступающего в роли кибернетического автомата и работающего по предписанным человеком правилам. Постепенно растет число успешно внедренных проектов, т.н. «среднего ИИ», где ИТ система имеет элементы адаптивного самообучения, совершенствуясь по мере накопления первичных данных, по-новому реклассифицируя текстовые, графические, фото/видео, аудио данные и т. п.

О нейронных сетях и машинном обучении

На сегодняшний день накоплены и систематизированы самые разнообразные подходы в применении статистических и математических алгоритмов для построения систем ИИ, таких как байесовские методы, логистическая регрессия, метод опорных векторов, решающие деревья, ансамбли алгоритмов и т. д.. В 2005–2008 годах в исследованиях по ИИ произошел качественный скачок. Математический научный мир стал активно изучать подход, основанный на модели обучения многослойных нейронных сетей, ставших фундаментом развития другой теории – глубокого машинного обучения. А ИТ-отрасль стала разрабатывать первые прикладные системы на базе этих подходов и активно изучать их. В последнее время ряд зарубежных экспертов пришли к выводу, что большинство современных и действительно удачных реализаций – это решения, построенные на технологии глубоких нейронных сетей (deep neural networks) и глубокого машинного обучения (deep learning).

Нейронные сети (neural networks) основаны на попытке воссоздать «упрощенную» модель нервных систем в биологических организмах. У живых существ нейрон – это электрически возбудимая клетка, которая обрабатывает, хранит и передает информацию с помощью электрических и химических сигналов через синаптические связи. Нейрон имеет сложное строение и узкую специализацию. Соединяясь друг с другом для передачи сигналов с помощью синапсов, нейроны создают биологические нейронные сети. В головном мозге человека насчитывается в среднем около 65 миллиардов нейронов и 100 триллионов синапсов. По сути – это и есть базовый механизм обучения и мозговой деятельности всех живых существ, т.е. – их интеллект.

Именно способность биологических нервных систем обучаться «на своих ошибках» легла в основу идеи создать искусственный интеллект по данному принципу. В результате одним из подходов стала концепция «искусственного нейрона» – математической функции, которая преобразует несколько входных фактов в один выходной, назначая для них веса влияния. Каждый искусственный нейрон может взять взвешенную сумму входных сигналов и в случае, если суммарный вход будет превышать определенный пороговый уровень, передать двоичный сигнал дальше.

Математическая модель единичного нейрона (персептрона) была впервые предложена в 1943 году американскими нейрофизиологами и математиками Уорреном Мак-Каллоком и Уолтером Питтсом, они же предложили и определение искусственной нейронной сети. Физически модель при помощи компьютера была смоделирована в 1957 году Френком Розенблаттом. Можно сказать, что искусственный нейроны – это одна из самых старейших идей практической реализации ИИ (рисунок ниже).

Искусственный нейрон

Искусственные нейроны объединяют в сети – соединяя выходы одних нейронов с входами других. Соединенные и взаимодействующие между собой искусственные нейроны образуют искусственную нейронную сеть – определенную математическую модель, которая может быть реализована на программном или аппаратном обеспечении. Говоря совсем упрощенно, нейронная сеть – это просто программа – «черный ящик», которая получает на вход данные и выдает ответы. Будучи построена из очень большого числа простых элементов, нейронная сеть способна решать достаточно сложные задачи.

В настоящее время существует множество моделей реализации нейронных сетей. Есть «классические» однослойные нейронные сети, они применяются для решения простых задач. Однослойная нейронная сеть идентична в математическом смысле обычному полиному, весовой функции, традиционно применяемой в экспертных моделях. Число переменных в полиноме равно числу входов сети, а коэффициенты перед переменными равны весовым коэффициентам синапсов.

Есть математические модели, в которых выход одной нейросети направляется на вход другой, и создаются каскады связей, так называемые многослойные нейронные сети (MNN, multilayer neural network), и один из более развитых ее вариантов, созданного специально для распознавания образов на изображениях – сверточные нейронные сети (CNN, convolutional neural network).

MNN обладают большими вычислительными возможностями, но и требуют огромных вычислительных ресурсов. С учетом размещения ИТ систем в облачной инфраструктуре, многослойные нейросети стали доступны большему числу пользователей. Например, в 2016 году компания Digital Reasoning из США, занимающаяся когнитивными вычислительными технологиями, создала и обучила нейронную сеть, состоящую из 160 миллиардов цифровых нейронов. Это значительно мощнее нейросетей, имеющихся в распоряжении компаний Google (11,2 миллиарда нейронов) и Национальной лаборатории США в Ливерморе (15 миллиардов нейронов).

Другой интересной разновидностью нейросетей являются нейронные сети с обратной связью (RNN, recurrent neural network), когда выход со слоя сети подается обратно на один из входов. У таких платформ есть «эффект памяти», и они способны отслеживать динамику изменений входных факторов. Простой пример – улыбка. Человек начинает улыбаться с еле заметных движений мимических мышц глаз и лица, прежде чем явно покажет свои эмоции. RNN позволяет обнаружить такое движение еще на ранних фазах, что бывает полезно для прогнозирования поведения живого объекта во времени посредством анализа серии изображений или конструировании последовательного потока речи на естественном языке.

Машинное обучение (machine learning) – это процесс машинного анализа подготовленных статистических данных для поиска закономерностей и создания на их основе нужных алгоритмов (настройки параметров нейронной сети), которые затем будут использоваться для прогнозов.

Различают 3 основных подхода к машинному обучению:

– обучение с учителем;
– обучение с подкреплением;
– обучение без учителя (самообучение).

В обучении с учителем используются специально отобранные данные, в которых уже известны и надежно определены правильные ответы, а параметры нейронной сети подстраиваются так, чтобы минимизировать ошибку. В этом способе ИИ может сопоставить правильные ответы к каждому входному примеру и выявить возможные зависимости ответа от входных данных. Например, коллекция рентгенологических снимков с указанными заключениями будет являться базой для обучения ИИ – его «учителем». Из серии полученных моделей человек в итоге выбирает наиболее подходящую, например, по максимальной точности выдаваемых прогнозов.

Нередко подготовка таких данных и ретроспективных ответов требует большого человеческого вмешательства и их ручного отбора. Также на качество полученного результата влияет субьективность человека-эксперта. Если по каким-либо соображениям он не рассматривает при тренировке всю совокупность выборки и ее атрибутов, его понятийная модель ограничена текущим уровнем развития науки и техники, указанной «слепотой» будет обладать и полученное ИИ решение.

Важно отметить, что нейросети являются функцией с нелинейными преобразованиями и обладают гиперспецифичностью – результат работы алгоритма ИИ будет непредсказуем, если на вход будут поданы параметры, выходящие за границы значений обучающей выборки. Поэтому важно обучать ИИ систему на примерах и частотности, адекватных последующим реальным условиям эксплуатации. Сильно влияет географический и социо-демографический аспект, что, в общем случае, не позволяет использовать без потери точности математические модели, натренированные на популяционных данных других стран и регионов. За репрезентативность обучающей выборки также отвечает эксперт.

Самообучение применяется там, где нет заранее заготовленных ответов и алгоритмов классификации. В этом случае ИИ ориентируется на самостоятельное выявление скрытых зависимостей и поиск онтологии. Машинное самообучение позволяет распределить образцы по категориям за счет анализа скрытых закономерностей и «автовосстановления» внутренней структуры и природы информации. Это позволяет исключить ситуацию системной «слепоты» врача или исследователя. Допустим в ситуации, когда они разрабатывают модель ИИ прогноза сахарного диабета 2-го типа, сосредотачивая основное внимание на показателях глюкозы в крови или весе пациента. Однако одновременно они вынужденно игнорируют всю другую информацию из истории болезни, которая также могла бы быть полезна. Глубокий подход к обучению позволяет тренировать ИИ на многомиллионной базе пациентов и проанализировать любой тест, который когда-либо был записан о пациенте в его электронной медицинской карте.

Механизмы глубокого машинного обучения (deep learning) используют, как правило, многослойные нейросети и очень большое число экземпляров объектов для тренировки нейронной сети. Число записей в обучающей выборке должно насчитывать сотни тысяч или даже миллионы примеров, а когда ресурсы не ограничены – и больше.

К примеру, для того, чтобы научить ИИ распознавать лицо человека на фотографии, команде разработчиков в Facebook потребовались миллионы изображений с мета-данными и тегами, говорящими о наличии лица на фото. Успех Facebook в реализации функции распознавания лиц как раз лежал в огромном количестве исходной для обучения информации: в социальной сети имеются аккаунты сотен миллионов людей, которые выкладывали гигантское количество фотографий и при этом указывали на них лица и отмечали (идентифицировали) людей. Глубокое машинное обучение на основе такого количества данных позволило создать надежный искусственный интеллект, который теперь за считанные миллисекунды не просто обнаруживает лицо человека на изображении, но и достаточно часто угадывает – кто именно изображен на фотографии.

Большое количество записей обучающей выборки необходимо ИИ и для создания необходимых правил классификации. Чем больше разнородных данных будет загружено в систему на этапе машинного обучения, тем точнее будут выявлены эти правила, и тем в конечном итоге точнее будет результат работы ИИ. Например, при обработке рентгенограмм и МРТ многослойные нейросети способны по изображениям составить представление об анатомии человека и его органах. Вместе с тем придумать в своей компьютерной классификации названия органов, аналогичные классической врачебной терминологии, компьютеры не смогут. Поэтому им на первых порах требуется «переводчик» с внутреннего машинного словаря на профессиональную лексику. Для подготовки мотивированного суждения нужен человек-эксперт, либо, как ни парадоксально, другая нейросеть, натренированная на задачи написания корректных расшифровок и заключений на естественном человеческом языке.

Метод обучения с учителем более удобен и предпочтителен в тех ситуациях, когда есть накопленные и достоверные ретроспективные исходных данные: обучение на их основе потребует меньше затрат времени и позволит быстрее получить работающее ИИ-решение. Там, где возможность получить базу данных с сопоставленной информацией и ответами на нее отсутствует – необходимо применять методы самообучения на основе глубокого машинного обучения; такие решения не будут нуждаться в надзоре человека.

Нам представляется, что исследователям и стартапам, только начинающим знакомиться с ИИ и ищущим возможности его применения в здравоохранении, целесообразно начать именно с методов машинного обучения с учителем. Это потребует меньше затрат (временных, финансовых) на создание прототипа работающей системы и практическое освоение методик ИИ. Функционирующую систему ИИ под конкретную задачу в этом случае можно получить быстрее. В настоящее время на рынке есть большое число качественных библиотек программного кода для искусственных нейросетей, таких как TensorFlow https://www.tensorflow.org/ для математического моделирования, OpenCV http://opencv.org/ для задач распознавания изображений, поставляемых бесплатно, по лицензии «свободное программное обеспечение».

Кроме практического эффекта в повышенной точности, которая сегодня может достигать 95%, системы ИИ в момент обработки данных имеют и высокую скорость работы. Неоднократно проводились эксперименты, например, по распознаванию образов с разных ракурсов, в которых соревновались человек и компьютер. Пока темп показа изображений был невысокий – 1–2 кадра в минуту, человек безусловно выигрывал у машины. При анализе изображений патологии ошибка человека составляла не более 3,5%, а компьютер давал ошибку диагностики 7,5%. Однако, при повышении темпа до 10 кадров в минуту и выше у человека ослабевала реакция, наступала утомляемость, что приводило к полному браку в работе. Компьютер же непрерывно учился на своих ошибках и в следующей серии только повышал точность работы. Перспективным оказался режим парной работы человека и компьютера, при котором удалось повысить точность диагностики на 85% на относительно высокой для человека скорости демонстрации изображений.

Разумеется, нельзя говорить об эффективном построении моделей ИИ и их точности, если отсутствует необходимая отечественная оцифрованная информация для их обучения. Поэтому критически важно, пусть даже в режиме не полного отказа от классического бумажного документооборота, а дублирования медицинского документооборота и в бумажной, и в электронной форме, начинать накапливать российские банки электронных медицинских данных. И дать возможность использовать их в обезличенном виде, без разглашения персональных данных пациентов, для создания и совершенствования отечественных ИИ решений.

Чем отличается создание ИИ от обычной разработки ПО?

Главное отличие методов искусственного интеллекта, построенных на базе нейронных сетей и машинного обучения, от обычного программирования состоит в том, что при создании ИИ программисту не нужно знать все зависимости между входными параметрами и тем результатом, который должен получится (ответом). Там, где такие зависимости хорошо известны или где есть надежная математическая модель для решения определенной задачи – целесообразно создавать систему на базе обычных методов алгоритмического программирования. Например, расчет статистического отчета или формирование реестра на оплату медицинской помощи вряд ли стоит реализовывать на основе методов искусственного интеллекта – современные программные продукты справляются с такими задачами вполне надежно и в приемлемое время, а стоимость их создания и развития будет ниже, чем на базе ИИ.

Использование технологий глубокого машинного обучения искусственный нейронных сетей оправдано там, где невозможно задать четкие правила, формулы и алгоритмы для решения задачи. Например, ответ на вопрос «есть ли на рентгенологическом снимке патология?». Такой подход предполагает, что вместо создания программ для расчета заранее заданных формул, машину обучают с помощью большого количества данных и различных методов, которые дают ей возможность самостоятельно выявить эту формулу на основе эмпирических данных и тем самым научиться выполнять задачу в будущем. При этом команда разработчиков трудится именно над подготовкой данных и обучением, а не над попыткой написать программу, которая будет как-то анализировать снимок по заранее заданным алгоритмам и получать ответ – так есть на нем аномалия или нет?

Появился целый класс информационных систем, получивших обозначение «IT+DT+AI+IOT» или Цифровые платформы, построенных на данной парадигме. Сокращение «IT» в них обозначает всеобщую цифровизацию процессов и компьютеризацию рабочих мест, «DT» – накопление данных и использование технологий мощной обработки информации, а «AI» – говорит о том, что на накопленных данных будут создаваться роботизированные алгоритмы ИИ, которые будут действовать как в партнерстве с человеком, так и самостоятельно. Сокращение «IOT» означает «интернет вещей» (internet of things) – вычислительная сеть, состоящая из физических предметов («вещей»), оснащённых встроенными технологиями для взаимодействия друг с другом или с внешней средой. Создание цифровых платформ для нужд здравоохранения стоит в числе стратегических приоритетных задач перед развитыми экономиками мира, включая Россию.

Какие именно задачи можно поручать ИИ?

Andrew Ng, лидер команды Google Brain (Google Brain team) и бывший директор лаборатории искусственного интеллекта Стэнфорда (Stanford Artificial Intelligence Laboratory), говорит о том, что в настоящее время СМИ и шумиха вокруг ИИ иногда придают этим технологиям нереалистическую силу. На самом деле реальные возможности применения ИИ достаточно ограничены: современный ИИ пока способен давать точные ответы лишь на простые вопросы.

Совместно с большим объемом исходных данных для обучения именно реальная и посильная постановка задачи являются важнейшим условием будущего успеха или провала ИИ проекта. Пока ИИ не может решать сложные задачи, непосильные и врачу, вроде создания фантастического прибора, самостоятельно сканирующего человека, способного поставить ему любой диагноз и назначить эффективное лечение. Сейчас ИИ способен скорее отвечать на более простые вопросы, например, оценить – присутствует ли инородное тело или патология на рентгенологическом снимке или ультразвуковом изображении? Имеются ли раковые клетки в цитологическом материале? и т. д. Но неуклонный рост точности диагностики посредством ИИ модулей заставляет задуматься. В публикациях уже заявлялись полученные значения точности ИИ до 93% при обработке радиологических изображений, МРТ, маммограм; до 93% точности при обработке пренатальных УЗИ; до 94,5% в диагностике туберкулеза; до 96,5% в предсказании язвенных инцидентов.

По мнению эксперта Andrew Ng реальные возможности ИИ на данное время можно оценить таким простым правилом: «Если обычный человек может выполнить мысленную задачу за секунды, то мы можем, вероятно, автоматизировать ее с помощью ИИ или сейчас, или в ближайшем будущем».

Конкретные алгоритмы или даже решения – не самое сложное и затратное в успехе ИИ в медицине. Примеры успешных идей публикуются открыто, а программное обеспечение уже сейчас доступно по модели СПО. Например, DeepLearning4j (DL4J) – https://deeplearning4j.org/, Theanohttp://deeplearning.net/software/theano/, Torchhttp://torch.ch/, Caffehttp://caffe.berkeleyvision.org/ и ряд других.

На самом деле основными барьерами перед массовым применением ИИ в здравоохранении являются следующие 2 аспекта:

1. Наличие большого количества данных для обучения.
2. Профессиональный и креативный подход к тренировке ИИ.

Без выверенных и качественных данных ИИ не будет работать, именно они являются первой серьезной сложностью для внедрения. Без талантливых людей простое применение готовых алгоритмов к подготовленным данным также не будет давать результат, т.к. ИИ необходимо будет настроить на понимание этих данных для решения конкретной прикладной задачи.

Обзор практического опыта в создании систем на базе нейронных систем и машинного обучения

Здравоохранение считается одним из основных направлений, которое может позволить выйти на действительно эффективный уровень развития ИИ на базе нейронных сетей и машинного обучения. Предполагается, что использование ИИ может массово повысить точность диагностики, облегчить жизнь пациентам с различными заболеваниями, повысить скорость разработки и выпуска новых лекарств и т. д. Пожалуй самым крупным и наиболее известным примером применения ИИ в медицине является американская корпорация IBM и ее когнитивная система IBM Watson, состоящая из 90 серверов с восьмиядерными процессорами и суммарным объемом оперативной памяти более 15 терабайт.

Первоначально это решение подготовили для применения в онкологии. Для этого IBM Watson два года обучали, загрузив в ее нейронную сеть 605 тысяч медицинских документов из 25 тысяч электронных историй болезни, взятых из обработанного гигантского архива исследовательского центра Memorial Sloan Kettering Cancer Center в Нью-Йорке. Кроме этого, при обучении IBM Watson было проанализировано 30 млрд. медицинских снимков, для чего корпорации IBM пришлось купить компанию Merge Healthcare за 1 млрд. долл. Дополнительно к этому процессу потребовалось добавиться 50 млн. анонимных электронных медицинских карт, которые IBM получила в свое распоряжение, купив стартап Explorys.

Существует общее заблуждение, что в своей работе IBM Watson берет данные конкретного пациента и затем на основании самых лучших клинических рекомендаций и методик обследования и лечения, собранных со всего мира, назначает индивидуальное и эффективное лечение, заменяя тем самым врача и делая за него его работу.

Но на самом деле принцип работы состоит в следующем: предварительно медицинская сестра собирает и подготавливает все доступные по пациенту медицинские данные. Затем лечащий врач нажимает на кнопку «Спросить Ватсона», данные передаются в систему для анализа. Ватсон перерабатывает эту информацию и, используя предварительно обученную нейронную сеть, ищет с ее помощью похожие прецеденты, из них берет назначенное лечение, которое затем выдает врачу как собственные клинические рекомендации по лечению пациента. За это больницы платят от 200 до 1000 долларов на каждого пациента. По заявлениям и различным, большей частью рекламным, публикациям в результате созданная система назначает правильное (то есть соответствующее современным рекомендациям) лечение в 90% случаев.

Основная проблема состоит в том, что «доктор Ватсон» никогда не проходил клинических испытаний. Нет ни одного независимого клинического исследования робота. Все статьи, в которых говорится о его эффективности, написаны клиентами системы, в соавторах обязательно значится инженер из IBM. По сути, созданная система не соответствует требованиям доказательной медицины, т.к. с клинической точки зрения не было проведено соответствующих научных экспериментов и исследований.

Кроме того, назначаемое IBM Watson лечение совпадает с той терапией, которую на практике назначали врачи из медицинских учреждений, чьи медицинские данные использовались при создании и обучении нейронной сети машины. В них точность работы системы доходит до 95%. Но, например, в Датских больницах врачи провели свое изучение системы и выяснили, что у них уровень совпадений составляет всего 33% и отказались от использования решения. Врачи за пределами США обращают внимание, что рекомендации Ватсона не берут в расчет особенности национального здравоохранения и врачебной практики. В Южной Корее робот часто назначает лечение, которое не покрывает национальная система страхования, на Тайване пациентом принято назначать меньшие дозы лекарств, предотвращая побочные эффекты.

Таким образом, система способна показать свою эффективность скорее только там, где были взяты данные для ее обучения, т.к. на самом деле эти данные (включая медицинские статьи из журналов) и все алгоритмы супер-компьютера «вбивали» сотрудники Memorial Sloan Kettering Cancer Center. И это создает сразу две проблемы: во-первых, не все ученые и врачи в других больницах и тем более странах согласны с подходами этого исследовательского центра, и не все считают его абсолютным авторитетом в онкологии. Во-вторых, количество данных, которыми оперирует Ватсон, не очень велико на самом деле, и было бы гораздо больше, если бы их действительно сгружали в систему все больницы, подключенные к нейросети. «Предположим, у вас есть 10000 пациентов с раком легких. Это на самом деле не очень много. Если бы их было больше, вы могли бы увидеть паттерны, группы пациентов, которые определенным образом отвечают или не отвечают на терапию, у которых определенные токсические реакции. Это позволило бы создать более персонализированную и точную медицину. Но мы не можем этого сделать, если у нас не будет способа собирать эти данные», – говорит доктор Линда Чинь (Lynda Chin), которая занималась установкой и обучением Ватсона в техасской больнице MDAnderson до того, как уволилась, а эта организация прекратила сотрудничество с IBM.

Но тем не менее созданная система находит свое применение. Так, она достаточно эффективно работает в странах, в которых вообще нет онкологов. В Монголии, например, есть больница UBSongdoв Улан-Баторе, в которой 100% назначений проходит через робота (и назначения выполняются, по возможности). В противном случае пациентов лечили бы врачи общей практики без онкологического опыта, а так пациентам доступен самый передовой американский клинический опыт.

Несмотря на объективные сложности и выявляемые проблемы, IBM не сдается и расширяет свои исследования и попытки создания систем на базе ИИ для здравоохранения. В 2014 году IBM объявила о сотрудничестве с Johnson & Johnson и фармацевтической компанией Sanofi для работы над обучением Watson пониманию результатов научных исследований и клинических испытаний. По утверждению представителей компании, это позволит существенно сократить время клинических испытаний новых лекарств, а врачи смогут давать лекарства, наиболее подходящие конкретному пациенту.

В том же 2014 году IBM объявила о разработке еще одного программного обеспечения – системы Avicenna, способной интерпретировать неструктурированный медицинский текст и изображения. Для каждого типа данных используются отдельные алгоритмы. Так что в итоге Avicenna сможет понимать медицинские снимки и записи и будет выполнять функции ассистента радиолога. Над похожей задачей работает и другой проект IBM–$5edical Sieve. В данном случае речь идет о развитии искусственного интеллекта «медицинского ассистента», который сможет быстро анализировать сотни снимков на предмет отклонения от нормы. Это поможет радиологам и кардиологам заняться теми вопросами, в которых искусственный интеллект пока бессилен.

Недавно разработчики IBM совместно с Американской кардиологической ассоциацией приняли решение расширить возможности Watson, предложив помощь системы и кардиологам. По задумке авторов проекта, в рамках этого проекта система будет анализировать огромное количество медицинских данных, имеющих отношение к тому либо иному пациенту. В число этих данных входят изображения с УЗИ, рентгеновские снимки и все прочая графическая информация, позволяющая уточнить диагноз человека. В самом начале возможности Watson будут использоваться для поиска признаков стеноза аортального сердечного клапана. При стенозе отверстие аорты сужается за счет сращивания створок её клапана, что препятствует нормальному току крови из левого желудочка в аорту. Проблема в том, что выявить стеноз клапана не так и просто, несмотря на то, что это очень распространённый порок сердца у взрослых (70–85% случаев среди всех пороков). Watson попытается определить, что он «видит» на медицинских изображениях: стеноз, опухоль, очаг инфекции или просто анатомическую аномалию, а затем дать соответствующую оценку лечащему врачу, чтобы ускорить и повысить качество его работы.

Совместно с Boston Children’s Hospital, занимающимися редкими детскими болезнями, IBM Watson хотят обучить ставить более точные диагнозы; для этого система будет искать необходимую информацию в клинических базах данных и научных журналах, которые хранятся в медицинском облаке Watson Health Cloud.

Отметим, что проект IBM Watson, как и любой новаторский продукт, изначально не ставил перед создателями явные экономические цели. Затраты на этапы создания его компонент обычно превышали плановые, а его содержание весьма обременительно, если сравнивать с традиционными бюджетами в здравоохранении. Скорее на данное время его можно рассматривать как некий испытательный полигон, на котором можно обкатывать перспективные ИТ технологии, выявлять и обсуждать возникающие сложности и вдохновлять исследователей на новые продукты. А затем уже проверенные и испытанные прототипы следует переводить в серийное производство, добиваясь более высоких показателей цена-качество и пригодности к эксплуатации в реальных условиях.

Еще одним гигантом ИТ-отрасли, который занялся разработкой и исследованием перспектив нейронных сетей и машинного обучения в создании ИИ для здравоохранения, является американская корпорация Google. Ее система DeepMind Health, по заявлениям разработчиков, способна за несколько минут обработать сотни тысяч медицинских записей и выделять из них нужную информацию. Хотя этот проект находится еще на ранней стадии, DeepMind уже сотрудничает с Глазной больницей Мурфильдса (Великобритания) с целью повышения качества лечения. Используя миллион анонимизированных, полученных с помощью томографа изображений глаз, исследователи стараются создать алгоритмы на базе технологий машинного обучения, которые бы помогали обнаружить ранние признаки двух глазных заболеваний – влажной возрастной макулярной дистрофии и диабетической ретинопатии. Похожим занимается и другая компания, входящая в Google – Verily. Специалисты этой фирмы используют искусственный интеллект и алгоритмы поисковика Google для того, чтобы проанализировать, что же делает человека здоровым.

Но не только крупные корпорации занимаются темой ИИ для здравоохранения. Постепенно в мире появляются различные небольшие исследовательские группы и стартапы, которые предлагают инновационные идеи и создают прототипы соответствующих систем. Например, исследовательской группе в компании Emergent удалось выявить пять новых биомаркеров, на которые могут быть нацелены новые лекарства при лечении глаукомы. По словам ученых, для этого в систему ИИ вводится информация о более чем 600 тыс. специфических последовательностей ДНК 2,3 тыс. пациентов и данные о генных взаимодействиях.

Израильская компания MedyMatch Technology, в штате которой насчитывается всего 20 человек, разработала на базе обученной нейронной сети и Big Data решение, благодаря которому врачи могут точнее диагностировать инсульт. Для этого в режиме реального времени система MedyMatch сравнивает снимок мозга пациента с созданной базой знаний на основе сотен тысяч расшифрованных изображений. Известно, что инсульт может быть вызван несколькими причинами, в том числе кровоизлиянием в головной мозг и тромбом. Соответственно, каждый из этих случаев требует разного подхода в лечении. Однако по статистике, несмотря на улучшение в области КТ, количество ошибок при постановке диагноза за последние 30 лет не изменилось и составляет приблизительно 30%. То есть почти в каждом третьем случае врач назначает пациенту неверное лечение, что приводит к печальным последствиям. Система MedyMatch способна отследить мельчайшие отклонения от нормы, которые не всегда способен заметить специалист, таким образом сводя вероятность ошибки в постановке диагноза и назначении лечения к минимуму.

Все больше внимания в последнее время уделяется попыткам применять технологии ИИ не только при создании решений для врачей, но и для пациентов. Например, мобильное приложение британской компании Your. MD, запуск которого произошел в ноябре 2015 года. Эта программа использует технологии машинного обучения и обработки естественного языка. Это позволяет пациенту просто сказать, к примеру: «У меня болит голова», – а затем получить от смартфона рекомендации по последующим действиям. Для этого система искусственного интеллекта Your.MD подключена к самой большой в мире базе данных: в ней учтено 1,4 млн. симптомов, на идентификацию которых потребовалось более 350 тыс. часов. Каждый симптом был проверен специалистом британской системы здравоохранения. Искусственный интеллект выбирает наиболее подходящий симптом, основываясь на уникальном профиле владельца смартфона.

Другая компания, Medtronic, предлагает приложение, способное предсказать критическое снижение уровня сахара за три часа до события. Для этого Medtronic используют технологии когнитивной аналитики, а также данные глюкометров и инсулиновых помп. С помощью приложения люди смогут лучше понимать влияние ежедневной активности на диабет. В рамках еще одного интересного проекта, на этот раз совместного с диагностической компанией Pathway Genomics, создано приложение OME, объединяющее когнитивную и прецизионную медицину с генетикой. Цель приложения – предоставить пользователям персонализированную информацию для повышения качества жизни. Первая версия приложения включает в себя рекомендации по диете и упражнениям, сведения по метаболизму, которые зависят от генетических данных пользователя, карту с привычками пользователя и информацией о его состоянии здоровья. В будущем должны добавиться электронные медицинские карты, информация о страховке и другие дополнительные сведения.

Кроме исследований в области прямого клинического применения, элементы ИИ пытаются использовать и во вспомогательных процессах медицинской организации. Например, осуществляются попытки обучить ИИ в части автоматической диагностики качества работы медицинской информационной системы, в вопросах обеспечения информационной безопасности. Появляются предположения, что системы ИИ могут помочь с выдачей рекомендаций по своевременной настройке справочников, тарифов или даже заметить аномальное поведение сотрудника и порекомендовать его руководителю направить его на обучение работе с системой, так как возникли подозрения в его невысоком профессионализме и замедленной реакции.

Обзор наиболее перспективных направлений

Изучив множество публикаций и исследований в области применения методов машинного обучения на основе нейронных сетей, мы выделили несколько наиболее перспективных, на наш взгляд, направлений в создании и развитии систем искусственного интеллекта для здравоохранения:

1. Автоматизированные системы диагностики, например, системы для автоматического анализа рентгенологических или МРТ-снимков на предмет выявления патологии, микроскопический анализ биологического материала, автоматическая расшифровка ЭКГ, электроэнцефалограмм и т.д. Хранение в медицинских информационных системах большого количества уже расшифрованных результатов диагностического обследования в электронном виде, когда имеются не только сами данные, но и формализованное заключение по ним, позволяет создавать действительно надежные и ценные программные продукты, способные если не заменить врача, то оказать ему эффективную помощь. Например, самостоятельно выявлять и обращать внимание на рутинную патологию, сокращать время и стоимость обследования, внедрять аутсорсинг и дистанционную диагностику.

2. Системы распознавания неструктурированных медицинских записей и понимания естественного языка могут оказать существенную помощь как врачу, так и пациенту. Начиная от уже обычной расшифровки речи и превращении ее в текст в качестве более продвинутого интерфейса общения с медицинскими информационными системами (МИС), обращения в Call-центр или голосового помощника – и далее до таких идей, как автоматический анализ врачебных записей и медицинских документов и последующая постановка предварительного диагноза с выводом рекомендаций по тактике обследования и лечения. В этом направлении мы ожидаем множество прорывных и интересных идей, таких как языковой перевод при поступлении иностранца, синтез речи при прочтении записей из МИС, робот-регистратор в приемном отделении больницы или регистратуре поликлиники, способный отвечать на простые вопросы и маршрутизировать пациентов и т.д.

3. Системы анализа и предсказания событий также являются вполне решаемыми уже сейчас задачами для ИИ, которые могут дать существенный эффект. Например, оперативный анализ изменений заболеваемости позволяет быстро предсказать изменение обращаемости пациентов в медицинские организации или потребность в лекарственных препаратах. Результаты работы ИИ, обученного на предсказание событий, могут позволить более эффективно управлять ресурсами, включая закупки расходных материалов, оснащение оборудованием и т.д.

4. Системы автоматической классификации и сверки информации помогают связать информацию о пациенте, находящейся в различных формах в различных информационных системах. Например, построить интегральную электронную медицинскую карту из отдельных эпизодов, описанных с разной детальностью и без четкого или противоречивого структурирования информации. Перспективной является технология машинного анализа содержимого контента социальных сетей, интернет-порталов с целью быстрого получения социологической, демографической, маркетинговой информации о качестве работы системы здравоохранения и отдельных лечебных учреждений.

5. Автоматические чат-боты для поддержки пациентов могут оказать существенную помощь в повышении приверженности пациентов здоровому образу жизни и назначенному лечению. Мы ожидаем развития в попытках создать чат-ботов, которые могут научится отвечать на рутинные вопросы, подсказывать тактику поведения пациентов в простых ситуациях, соединять пациента с нужным врачом в телемедицине, давать рекомендации по диете и т.д. Такое развитие здравоохранения в сторону самообслуживания и большей вовлеченности пациентов в охрану собственного здоровья без визита к врачу может сэкономить существенные финансовые ресурсы.

More from my site

  • Код для word2vec в Numpy и Theano