Жизненный цикл систем поддержки принятия врачебных решений как медицинских технологий

Актуальным определением системы поддержки принятия врачебных решений (СППВР) следует считать следующее: «СППВР – это программное обеспечение, позволяющее путем сбора и анализа информации влиять на принятие врачом решения при обследовании пациента, диагностике, назначении лечения с целью снижения ошибок и повышения качества оказываемой медицинской помощи».

Различными исследователями и разработчиками определения СППВР и их типы даются несколько поразному, однако нам кажется целесообразной следующая их классификация (см. врезку).


До настоящего времени не получены убедительные доказательства эффективности и безопасности информационно-справочных СППВР, преимущественно разработанных для повышения соответствия врачебной практики клиническим рекомендациям, в улучшении клинических исходов пациентов. Проведены десятки, и возможно даже сотни, рандомизированных контролируемых испытаний (РКИ), однако большинство систематических обзоров (СО) не позволяют сделать вывод об эффективности таких систем. Показано некоторое улучшение первичной и вторичной профилактики в результате применения СППВР: по результатам 28 РКИ выявлен сниженный относительный риск новых случаев острых заболеваний (инфаркт миокарда, острое нарушение мозгового кровообращения, пневмония и др.) 0,82, 95% ДИ (0,68; 0,99). Полезность СППВР на основе встраивания КР для профилактики нескольких состояний показана и в систематическом обзоре, однако в него включены неконтролируемые (оценка «до-после») и нерандомизированные исследования, следовательно, полученные доказательства имеют низкий уровень достоверности.

Что касается иСППВР, то таких исследований пока меньше, однако уже выполнены несколько СО. В СО изучены 39 исследований СППВР по ведению острой и хронической боли, основанных на искусственных нейронных сетях (ИНС), статистических методах машинного обучения, деревьях решений, логических методах и др. Хотя получены отдельные отличные результаты (в основном с использованием ИНС), в целом качество таких систем пока нельзя считать хорошим. СО включает 10 исследований разных дизайнов, оценивавших способы выявления пациентов с риском увеличения интервала QT с применением методов предиктивной аналитики, и какой-либо определенный вывод сделан не был. Тридцать исследований разных дизайнов, включенные в СО, обобщены с целью оценки качества диагностики рассеянного склероза с использованием систем на основе нечеткой логики, ИНС, формализации правил и других методов. Наилучшие результаты получены с использованием ИНС – чувствительность составила 97%, точность – 99%. Что касается ИИ в области анализа медицинских изображений, то преимущество алгоритмов, построенных на глубоком машинном обучении, над врачебными оценками отсутствует. Этот вывод сделан по результатам мета-анализа, включившем 82 исследования. Таким образом, сплошных успехов иСППВР тоже пока не наблюдается, а качество имеющихся доказательств низкое.

СППВР для врача фактически играют роль «второго мнения», которое он может учесть или не учесть при выработке своего решения, недаром такие системы также называют рекомендательными. Поскольку в настоящее время многие врачи стараются практиковать в соответствии с концепцией доказательной медицины, СППВР рассматривается ими как любая другая медицинская технология (МТ), потенциально влияющая на состояние больного, и которая, соответственно, должна иметь научное обоснование своей эффективности и безопасности.

Жизненный цикл медицинских технологий

Конечно, степень влияния СППВР на решение врача требует специального изучения, но в дальнейшем мы будем исходить из предположения ее максимального влияния на решение врача. Это позволит рассматривать СППВР в контексте необходимости максимизации ее эффективности и безопасности.

Рассмотрим жизненный цикл МТ в применении к СППВР, прежде всего интеллектуальным. Типичный жизненный цикл МТ представлен на рисунке выше.

I. Разработка и производство

Первая стадия – разработка и производство – с нашей точки зрения, должна включать следующие этапы.

1. Постановка задачи совместно с врачами (в зарубежных документах этому этапу примерно соответствует процесс установки валидных клинических ассоциаций). Необходимо определить, какие именно решения предполагается «поддерживать», и почему это актуально. Инициативное моделирование, которое особенно свойственно «чистым» математикам-неофитам в медицине, получающим в руки «большие данные», без согласования постановки задачи с врачами, как мы полагаем, обречено на неудачу.

Для того чтобы оценить новизну и актуальность решаемой задачи, необходимо выполнить СО – поиск всех имеющихся решений в данной проблемной области. Например, если разрабатывается система диагностики, должны быть изучены все имеющиеся способы диагностики, сопоставлены их операционные характеристики (чувствительность, специфичность, прогностические ценности) с учетом преваленса изучаемых состояний в целевой популяции. Вполне возможно, что уже разработаны и другие иСППВР, поскольку в настоящее время выполняется все возрастающее число работ по прикладным задачам математического моделирования. Источниками информации должны служить базы данных научных публикаций (как минимум – Кокрейновская библиотека, MEDLINE, Научная электронная библиотека), клинические рекомендации (национальные и зарубежные). Поддерживаемые врачебные решения можно разделить на следующие типы:

1. Диагностика (включая дифференциальную).

2. Прогнозирование:

– клинических событий (с целью их первичной и вторичной профилактики);
– эффективности лечения (в интересах его персонализации).

Задача диагностики в имитирующих иСППВР обычно решается применением методов машинного обучения «с учителем», задача прогнозирования – как методами «с учителем», так и «без учителя» (data mining).

Для этих двух типов задач актуальность определяется обычно разными факторами.

В случае диагностики актуальность разработки иСППВР обычно определяется недостатками имеющегося способа диагностики – он может быть неточный, дорогой, инвазивный, слишком длительный, требующий специальной квалификации врачей и т.д. В задачах прогнозирования частой является ситуация полного отсутствия способа прогноза.

В соответствии с концепцией ДМ на этапе постановки задачи должны быть определены целевая популяция, способ контроля и оцениваемый исход. Определение целевой популяции осуществляется путем формулирования критериев включения и исключения случаев. Именно для такой популяции разрабатывается иСППВР, и именно к такой популяции может впоследствии применяться разработка (в ДМ это называется обобщаемостью результатов исследования). Пример: результаты, полученные на добровольцах, пришедших на скрининг, не могут быть перенесены на общую популяцию.

При определении целевой популяции важно также учитывать условия оказания медицинской помощи будущей СППВР – скорая помощь, поликлиника, диспансер, больница, научный центр и т.п. Очевидно, что популяции систематически отличаются в зависимости от места оказания врачебной помощи. Например, преваленс идентифицируемого состояния при скрининге является низким, при диагностике – высоким.

Контролем в задачах диагностики следует выбрать «золотой стандарт» – наиболее точный из имеющихся способов идентификации, который следует использовать как верифицирующий изучаемые состояния. В задачах прогнозирования таким контрольным идентификатором выступает собственно прогнозируемое событие, которое должно определяться по заранее сформулированным критериям. Например, идентификация рецидива заболевания должна выполняться по критериям, принятым в клинических рекомендациях. В задачах поиска подгрупп пациентов контрольная идентификация не требуется (применяется машинное обучение «без учителя»).

Оцениваемый исход (состояние, нозология) в задачах диагностики и прогнозирования должен быть определен на основании принятых критериев диагностики, чтобы верификация выполнялась надежно. Негативный пример: разрабатывается система анализа медицинских изображений для выявления патологических образований. Системе удалось выявить дополнительные (по отношению к результатам врача) случаи, которые были расценены врачами как вероятно позитивные, что представляется разработчиками как успех системы. На самом деле, верификация пока не выполнена, и нельзя исключить, что вновь выявленные случаи являются ложноположительными.

Важнейшим компонентом этапа постановки задачи является согласование с врачами подхода к разработке иСППВР – имитирующего или моделирующего. Имитирующие модели неинтерпретируемы и часто поэтому заведомо неприемлемы для врачей. Этим недостатком не обладают моделирующие рассуждения экспертные системы.

2. Разработка дизайна исследования

В контексте разработки имитирующих иСППВР под дизайном исследования следует понимать способ сбора данных. Для моделирующих иСППВР, основанных на знаниях, данные не нужны.

Первой задачей является определение способа формирования несмещенной (репрезентативной) выборки из целевой популяции. Рекомендуемые способы формирования выборки – случайный и сплошной. Эти способы могут быть использованы в исследованиях любого дизайна – одномоментных, проспективных, ретроспективных. Главное, чего нужно избегать – произвольное формирование выборки, которая с большой вероятностью будет смещенной. В идеале желательно организовывать многоцентровое исследование, с тем, чтобы данные были репрезентативны по отношению не к одному источнику (медицинской организации), а к нескольким организациям одного уровня медицинской помощи.

При разработке диагностических систем очень важно предусмотреть сбор позитивных и негативных случаев из общей целевой популяции, с учетом фактического преваленса идентифицируемого состояния. Частой ошибкой, приводящей к систематическому смещению результатов, является набор позитивных случаев из клиники, а негативных – из контрольной группы здоровых лиц. При разработке систем прогнозирования обязательна синхронизация когорты пациентов (клинические случаи должны быть наблюдаемы с одного и того же момента в истории заболевания, например, с момента постановки диагноза, с момента выполнения хирургической операции). В случае поиска подгрупп пациентов также важно понимать происхождение данных и их репрезентативность. Если используются данные ранее выполненного клинического или популяционного исследования, то известны критерии включения и исключения пациентов. Если же используется просто цифровой архив медицинской организации, то качество этих данных будет заведомо спорным и зависящим от характеристик этой конкретной организации.

Для любой разработки, использующей данные, методы генерации данных должны быть гармонизированы или синхронизированы. Например, лабораторные тесты должны быть выполнены одинаковыми лабораторными методами, используемые клинические шкалы и опросники должны быть валидизированными, томографы – иметь близкие технические характеристики. Следует обратить внимание и на возможность исторического смещения в данных – изменения критериев оценки состояний, способов диагностики и т.п.

Важно определить, что является объектом исследования – пациент, его орган, курс лечения и т.д. Например, в задачах офтальмологии часто объектом исследования служит глаз, в онкологии – курс химиотерапии, что создает фактически непреодолимые трудности в анализе данных, смешивая независимые (пациентов) и зависимые наблюдения (парные органы, курсы терапии). В таких задачах рекомендуется зафиксировать объект по отношению к пациенту (например, всегда включать данные от «более больного» глаза), брать в анализ случайный курс терапии и т.п. Это позволит избегать нарушения предположения основных многомерных методов анализа данных о независимости объектов выборки, а также обоснованно присовокупить к данным организменные показатели (пол, возраст, вес, АД и проч.).

Заранее должен быть продуман способ обработки пропусков в данных. При использовании ретроспективных данных часто случаи с пропусками просто не включают в выборку, что вносит систематическое смещение в данные, а, следовательно, и в результаты.

Немаловажным компонентом дизайна является расчет необходимого объема выборки, который в подобных задачах в основном определяется приемлемой точностью оценок эффективности разрабатываемого продукта.

Разработка дизайна исследования заканчивается разработкой протокола сбора данных.

3. Сбор данных. В проспективном или одномоментном исследовании качество данных является более высоким, т.к. меньше пропусков в данных, больше единообразие измерений и т.п. В ретроспективном дизайне эти проблемы неустранимы.

4. Построение «решателя» с использованием различных методов машинного обучения («с учителем» или «без учителя»), методов извлечения и представления экспертных знаний. Любая модель имеет смысл, если она с приемлемым качеством описывает реальность. Не останавливаясь здесь на методах, перечислим основные критерии (метрики) качества разрабатываемой модели:

а) статистически значимая сопряженность резуль-татов применения модели и «золотого стандарта»;

б) оценки чувствительности (в машинном обу-чении обычно называется откликом (англ. recall) и специфичности – устойчивых, не зависящих от преваленса идентифицируемого состояния в вы-борке, операционных характеристик модели, и их доверительных интервалов (95%, а лучше – 99%);

в) оценки прогностической ценности положительного и отрицательного результата (ПЦПР и ПЦОР соответственно) – зависящих от преваленса операционных характеристик модели – и их ДИ (99%, 95%). В машинном обучении ПЦПР обычно называется английским термином precision. В случае, если выборка репрезентативна по отношению к целевой популяции в отношении преваленса (так происходит обычно при использовании сплошного или случайного метода формирования выборки), эта проблема практически отсутствует. Однако если в исследование отдельно набирались позитивные и негативные случаи, поправка на преваленс необходима. Прогностические ценности крайне важны, т.к. именно с ними работает врач, оценивая результат конкретного больного с учетом вероятности гипер- и гиподиагностики;

г) точность модели. Под этим обычно понимают отношение суммы истинно-положительных и истинно-отрицательных результатов к общему числу наблюдений в выборке. В машинном обучении эта метрика обычно называется accuracy. Иногда под точностью понимают среднее между Ч и С. Для точности также могут быть рассчитаны ДИ (99%, 95%);

д) в некоторых случаях для выбора оптимальной отрезной точки необходимым бывает проведение ROC-анализа. Критериями оптимальности выбора могут быть минимизация ошибок I или II рода, оптимизация их соотношения, максимизация их суммы (критерий Юдена) и т.п. Обычно в задачах диагностики оптимизируется Ч, в задачах скрининга – С. При прогнозировании часто предпочтение отдается гипердиагностике.

О том, какие значения эффективности можно считать успехом разработки, единого мнения не существует. Обычно полагают, что модель приемлема, если ее точность равна или превышает 85%. По нашему мнению, модель хороша, если ДИ для любой из оценок эффективности лежит в диапазоне 85%–100%. При этом очевидно, что если любой ДИ включает 50%, то модель вовсе неработоспособна, и проще бросать монетку.

5. Аналитическая (техническая) валидизация полученной модели. Может выполняться с использованием кросс-валидации, скользящего экзамена, независимой тестовой выборки (при построении экспертных систем обучающая выборка не нужна, но тестовая обязательна). Поскольку известно, что многие модели, полученные в результате применения машинного обучения, являются переобученными (т.е. настроенными на конкретные данные, использованные при обучении), то может применяться и анализ чувствительности к данным. Для этого проводится новое разделение исходной выборки на обучающую и тестовую (процедура shuffle), заново строится модель и оцениваются ее характеристики. Далее устанавливается точность совпадения результатов старой и новой моделей. Процесс может повторяться сколь угодно много раз. Заменой такого трудоемкого процесса является оценка неопределенности (ДИ) характеристик модели, о чем было сказано выше.

6. Программная реализация модели возможна в форме модуля локальных информационных систем, облачного сервиса, отдельного программного продукта (веб-приложения, мобильного приложения). Важно, чтобы в интерфейсе пользователю-врачу предоставлялись решающие правила на естественном языке, а также – обязательно – значения операционных характеристик модели. В качестве последних предпочтительны прогностические ценности – показатели, с которыми работает врач, показывающие степень уверенности системы в выдаваемом заключении, и диапазоны их неопределенности (ДИ).

7. Публикация результатов не менее, чем в двух профильных рецензируемых научных журналах – в журнале в соответствии с рассматриваемой медицинской проблемой и в журнале по медицинской информатике (например, в журнале «Врач и информационные технологии»). Как и всегда, желательно выбирать наиболее высокоимпактные профильные журналы, как международные, так и российские.

Для моделирующих (экспертных) СППВР актуальны этапы 1, 4–7, для информационно-справочных – этапы 1, 5–7.

На этом этап разработки и производства может считаться законченным, однако, как следует из рисунка выше – это лишь первая стадия ЖЦ МТ. Успешная разработка диагностических и прогностических систем лишь означает, что разработанный на основе модели программный продукт работает правильно, однако ценность такой системы на данном этапе неизвестна.

II. Клинические исследования (клиническая валидация)

С позиций доказательной медицины (ДМ) независимо от актуального порядка регистрации ПО в национальной юрисдикции за производством МТ должны последовать клинические испытания СППВР. Они необходимы для создания доказательной базы данной МТ. Именно ей могут (или не могут, если испытания проведены плохо) доверять врачи, практикующие ДМ.

Клинические испытания – трудоемкий и длительный этап ЖЦ МТ. Финансовые затраты обычно ложатся на производителя МТ, который становится спонсором КИ. Доля клинических исследований III фазы (РКИ) в общем бюджете разработки фармацевтических продуктов достигает 70%. Вряд ли имеет смысл сопоставлять общие бюджеты разработки фармацевтических субстанций и ИТ продуктов, но средняя стоимость РКИ составляет 19 млн. долл.. Таким образом, коммерческая ИТ-компания, разработавшая СППВР, должна профинансировать его клинические испытания. Она может это сделать за счет собственного бюджета либо получить грант в каком-либо фонде. РФФИ, РНФ в своих документах декларируют, что занимаются финансированием только фундаментальных исследований, в то время как клинические испытания – исключительно прикладные исследования. Фонды Сколково, РВК, Бортника финансируют прикладные исследования, от них можно пробовать получать финансирование. Если же продукт произведен в академическом учреждении, то в это случае должен быть доступен механизм получения финансирования клинических испытаний. Решением в таких ситуациях представляется прямое проектное государственное финансирование (путем госзаказа или госзакупки) через ведомство (Минздрав, Минобрнауки и др.) либо инициативное обращение академической организации за финансированием в институты инновационного развития.

В испытаниях диагностических СППВР необходимо оценить не правильность работы системы (что должно было быть ранее оценено при разработке и аналитической валидации), а ее эффективность и безопасность в сравнении с рутинно используемым методом. При этом проверке может быть подвергнута одна из гипотез:

– гипотеза превосходства по эффективности, безопасности – при предполагаемой замене старой МТ на СППВР либо при использовании СППВР в дополнение (параллельно или последовательно) к старому способу диагностики;

– гипотеза неуступающей эффективности (или эквивалентности) по эффективности, безопасности – при планировании замены инвазивного, дорогого или другого недостаточно хорошего диагностического теста на СППВР.

Для прогностических систем цель испытаний – это обычно доказательство преимущества персонализированного ведения пациента над рутинным (стандартным) ведением на основе оценки рисков исходов. Часто рутинная практика представляет собой отдельную МТ, совокупность МТ или даже отсутствие какой-либо МТ. До проведения испытания врачами на основе полученных при разработке системы решающих правил должна быть сформулирована персонализированная тактика ведения пациентов, которая и будет представлять собой испытываемое вмешательство.

После формулировки гипотезы следует рассчитать необходимый объем выборки с целью обеспечения достаточной статистической мощности испытания. Он делается на основе ряда параметров, основным из которых является клинически значимая величина эффекта, которую должны определить врачи.

Приведем основные черты дизайна испытаний для разных типов поддерживаемых решений (таблица ниже).

Основные черты дизайна клинических испытаний
для разных типов интеллектуальных СППВР

Прогностические СППВР подлежат испытанию в РКИ, проведение которых является организационно сложным. В частности, должна быть обоснованной их этичность, в том числе соблюдаться принцип эквипойза. Заметим, что в то же время для диагностических систем РКИ не только не нужны (о необходимости РКИ для диагностических методов неверно пишут многие авторы), но и невозможны, поскольку изучается одна группа – выборка из целевой популяции пациентов.

Чтобы избегать систематических смещений в клинических испытаниях, рекомендуется пользоваться опросниками для оценки методологического качества РКИ и одномоментных исследований диагностических тестов, а при подготовке публикации пользоваться шаблонами CONSORT и STARD соответственно.

Итак, клинические испытания должны закончиться оценкой эффективности и безопасности СППВР, публикации должны появиться в профильных научных изданиях.

III. Государственная регистрация

В соответствии с Основами законодательства Российской Федерации об охране здоровья граждан (статья 43) в практике здравоохранения можно использовать только разрешенные к применению методы профилактики, диагностики, лечения, скрининга. СППВР, будучи ПО, в соответствии с действующими регуляторными нормами в РФ рассматриваются как программные медицинские изделия. Как заявлено на официальном веб-сайте Росздравнадзора, регистрация медицинских изделий – государственная процедура, цель которой разрешить выпуск на российский рынок качественных и безопасных изделий. Из этого вероятно можно сделать вывод, что если пребывание на рынке (т.е. коммерциализация продукта) не предусмотрена, то регистрация не является обязательной. Одновременно частью 4 статьи 38 Федерального закона от 21.11.2011 № 323-ФЗ «Об основах охраны здоровья граждан в Российской Федерации» установлено, что на территории Российской Федерации разрешается обращение медицинских изделий, зарегистрированных в порядке, установленном Правительством Российской Федерации, уполномоченным им федеральным органом исполнительной власти. Что означает термин «обращение», в законе не определено. Вместе с тем, программные медицинские изделия необходимо подвергать обязательной государственной регистрации с присвоением ему определенного класса риска. Для проведения же регистрации в соответствии с действующими документами РФ и ЕАЭС необходимо, помимо других испытаний, провести и клинические испытания с целью оценки безопасности и эффективности. Более ранний документ этого направления – Приказ Министерства здравоохранения РФ от 9 января 2014 г. № 2н «Об утверждении Порядка проведения оценки соответствия медицинских изделий в форме технических испытаний, токсикологических исследований, клинических испытаний в целях государственной регистрации медицинских изделий». В США в настоящее время ведется дискуссия о том, как именно следует определять СППВР.

Реальная практика в настоящее время, повидимому, сводится к тому, что коммерческие СППВР проходят этап регистрации, в то время как свободно распространяемые – нет. В Государственном реестре медицинских изделий нам не удалось обнаружить зарегистрированные СППВР, однако не исключено, что мы выполнили неоптимальный поиск.

Таким образом, пока необходимость и порядок регистрации программных СППВР остаются неопределенными.

IV. Клинико-экономический анализ

Клинико-экономический анализ (КЭА) выполняется обычно со следующими целями:

– для включения клинико-экономического обоснования МТ в клинические рекомендации;
– для включения МТ в ограничительные перечни МТ, гарантированно закупаемых государством либо иным плательщиком.

КЭА основан на результатах сравнительных клинических исследований. При этом если клинические испытания носят международный характер, т.е. обычно их результаты валидны во всех странах мира, то КЭА выполняется исключительно на национальном уровне. Это связано с тем, что организационно-экономические аспекты систем здравоохранения в разных странах мира несопоставимы – действуют разные системы страхования, лекарственного обеспечения, стандарты помощи и т.п.

КЭА выполняется обычно не путем анализа «сырых» данных, а методами моделирования (деревья решений, марковские модели и др.). В модели учитываются следующие виды затрат: прямые медицинские (постоянные, переменные), прямые немедицинские, непрямые, нематериальные.

Основными методами КЭА являются оценка минимизации затрат (при равной эффективности и безопасности сравниваемых вмешательств) и анализ соотношения затрат и эффективности (при разных эффективности и безопасности).

Соответственно, если по результатам клинического испытания СППВР предлагается использовать взамен неоптимального способа диагностики (дорогого, инвазивного, длительного, требующего специальной квалификации и т.п.), и при она обладает не меньшей или эквивалентной эффективностью и безопасностью, то может проводиться оценка минимизации затрат. Это послужит аргументом в пользу внедрения такой СППВР. Если же СППВР более эффективна, но дороже, чем рутинная технология, то следует проводить анализ соотношения эффекта и затрат. Если СППВР более эффективна, но дешевле рутинной технологии, то КЭА не требуется, и такая технология называется доминирующей.

V. Оценка медицинских технологий и дальнейшее продвижение

Комплексная экспертиза – оценка медицинских технологий (ОМТ) – включает (но может не ограничиваться) рассмотрение как научных обоснований эффективности и безопасности технологий, полученных в клинических исследованиях, так и результатов КЭА. В РФ ОМТ выполняется пока только для лекарственных препаратов при формировании Перечня ЖНВЛП, однако в перспективе она должна охватить все типы вмешательств, финансируемых государством. При успешных результатах ОМТ можно рассчитывать на включение СППВР в клинические рекомендации и финансирование их закупок государством или иными плательщиками (ведомствами, страховыми компаниями и др.).

Заключение

Любые СППВР, и прежде всего интеллектуальные, должны рассматриваться как медицинские технологии (независимо от требований регулятора). В их жизненном цикле можно выделить стадии разработки, клинической валидации, государственной регистрации, клинико-экономического анализа и оценки медицинских технологий. Клиническая валидация заключается в получении доказательств улучшения исходов пациентов при применении СППВР и ее безопасности по сравнению с рутинно применяющимися методами. Клинико-экономический анализ и последующая комплексная оценка медицинских технологий могут обосновать включение СППВР в клинические рекомендации и финансирование закупок СППВР государством или иными плательщиками.

Пример: интеллектуальная СППВР для персонализации ведения пациентов с болезнью Иценко-Кушинга (БИК) после успешного нейрохирургического лечения

Этап 1 – разработка и производство иСППВР

Анализировались ретроспективно собранные данные 219 пациентов с БИК, которые получили эффективное нейрохирургическое лечение. Выборка сформирована сплошным методом. Когорта синхронизирована по дате хирургического лечения. Частота рецидивов к трем годам после операции составила 19,5%, 95% ДИ [14,4%; 24,5%] (оценка методом Каплана-Мейера).

Для построения математических моделей использовались статистические методы и методы ИНС. Статистическими методами построить модели приемлемой точности не удалось. Построена эффективная ИНС для прогнозирования ремиссии/рецидива в течение трех лет после успешной нейрохирургической операции.

Операционные характеристики ИНС составили:

– чувствительность – 75% [60%; 86%];
– специфичность – 97% [93%; 99%];
– прогностическая ценность положительного результата – 85% [71%; 94%];
– прогностическая ценность отрицательного результата – 93% [89%; 96%];
– общая точность модели составляет 92% [87%; 95%].

На основе предсказательных ценностей сформулированы два решающих правила:

– «Если математической моделью прогнозируется ремиссия, то пациент с вероятностью 93% [89%; 96%] будет иметь ремиссию в течение 3 лет».
– «Если математической моделью прогнозируется рецидив, то пациент с вероятностью 85% [71%; 94%] будет иметь рецидив в срок до 3 лет».

Далее выполнена программная реализация модели – разработано свободно доступное веб-приложение – http://medcalc.appspot.com. Планируется также встроить программный продукт в госпитальную МИС.

Статьи по результатам разработки приняты в печать в профильном журнале по эндокринологии и направлены в профильный журнал по информационным технологиям в медицине.

Этап 2 – Клиническое исследование

На основе построенных решающих правил может быть предложено модифицировать алгоритм послеоперационного ведения пациентов следующим образом: при прогнозе рецидива (таких пациентов около 20%) в течение трех лет после операции пациенту предлагается посещать врача не каждые 6 месяцев (так при стандартном ведении), а каждые 3 месяца. В то же время пациентам, для которых прогнозируется ремиссия (таких пациентов примерно 80%), предлагается посещать врача 1 раз в год. Таким образом, может быть реализована идея персонализации послеоперационного ведения пациентов.

Для оценки эффективности и безопасности СППВР необходимо будет провести РКИ со следующими параметрами:

– популяция – все пациенты с успешной ней-рохирургической операцией;
– вмешательство – послеоперационное ведение пациентов с использованием прогноза, предлагаемого СППВР (активный контроль каждые 3 мес. при прогнозе рецидива, каждые 12 мес. при прогнозе ремиссии);
– контроль – стандартное ведение пациентов (контроль каждые 6 мес.);
– оцениваемые исходы – любые госпитализации, связанные с основным заболеванием (инфаркт миокарда, ОНМК, тяжелые инфекции, болезни почек, низкотравматические переломы), летальность.

Проверяемые гипотезы:

1) Персонализированное ведение пациентов обладает не меньшей эффективностью и безопасностью, чем стандартное ведение.
2) Персонализированное ведение пациентов более эффективно и безопасно, чем стандартное ведение.

Этап 3 – Клинико-экономический анализ

Анализ может быть проведен путем моделирования на горизонте, например, 5 лет путем расчета коэффициента «затраты/эффективность» – отношения разности затрат при персонализированном и стандартном ведении пациентов к разности их эффектов. Учитываемые затраты могут быть определены на основе клинических рекомендаций или стандарта медицинской помощи. Обычно к ним как минимум относятся прямые медицинские затраты – на амбулаторные визиты, плановые и экстренные госпитализации, скорую и неотложную помощь. Также могут быть учтены немедицинские затраты, связанные с временной утратой трудоспособности, инвалидностью. Не исключено, что при КЭА обнаружится, что персонализированный подход представляет собой т.н. доминирующую технологию, превосходящую стандартную как по эффективности и безопасности, так и по затратам.

Андрей Никитенко
Андрей Никитенко
Задать вопрос эксперту
Понравилась статья? Поделить с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o