РАЗРАБОТКА И АПРОБАЦИЯ ПРОТОТИПА ЭКСПЕРТНОЙ СИСТЕМЫ ДЛЯ ДИАГНОСТИКИ ПОДАГРЫ |
02.10.2023 г. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.21045/2071-5021-2023-69-4-15
Осмоловский И.С., Зарубина Т.В. Резюме Актуальность. Подагра представляет собой ревматологическое заболевание, которое по различным источникам охватывает до 2% населения Российской Федерации. Патогенез заболевания связан с нарушением обмена мочевой кислоты и проявляется в отложении кристаллов моноурата натрия в различных тканях организма. Своевременная диагностика и лечение заболевания позволяет предотвратить развитие осложнений подагры и инвалидизации пациента, однако установка диагноза подагры по различным источникам занимает от 4 до 8 лет. Одним из возможных способов улучшить качество диагностики подагры является разработка и внедрение экспертной системы в части определения предварительного диагноза, назначения методов исследований и консультаций и постановки окончательного диагноза. Цель работы: разработать и апробировать прототип экспертной системы для диагностики подагры. Материалы и методы. В исследовании использовались методы системного анализа, включающие в себя методы декомпозиции, анализа и синтеза, методы инженерии знаний, в том числе методы представления знаний (фреймы, семантические сети), онтологический подход, методы нечеткой логики и иерархического структурирования, а также методы оценки эффективности, включая ROC-анализ. Результаты. Разработан прототип экспертной системы для диагностики подагры. Прототип состоит из базы знаний, логического решателя и подсистемы объяснений. Для разработки и последующего ведения базы знаний был создан специализированный инструмент - редактор базы знаний. Наполнение базы знаний осуществлялось с помощью двух информационных объектов, разработанных совместно с группой экспертов: номенклатуры медицинских понятий (495 основных и 679 синонимичных понятий) и логических схем (40 схем) для диагностики подагры. Структура базы знаний представляет собой сочетание фреймов и семантической сети и включает в свой состав 18 объектов (7 типов понятий и 11 типов связей). Для хранения базы знаний используется графовая система управления базами данных, что определило логику работы логического решателя и подсистемы объяснений. Логический решатель анализирует клинические данные пациента и ищет оптимальный путь, конечные точки которого являются рекомендациями прототипа экспертной системы. Подсистема объяснений использует этот путь для аргументации выбранного решения. Прототип экспертной системы апробирован на двух деперсонализированных выборках, содержащих сведения о 2183 пациентах, предоставленных Тюменским департаментом здравоохранения. Заключение. Разработан прототип экспертной системы, предназначенный для определения предварительного диагноза подагры, назначения методов исследований и консультаций для ее подтверждения и постановки окончательного диагноза. Прототип включает в свой состав 1174 понятия и 5 640 522 связи. Апробация прототипа экспертной системы с использованием ROC-анализа показала, что его чувствительность составила 91,3% ДИ [89,1%; 93,1%], специфичность – 85,4% ДИ [82,9%; 87,6%] и AUROC - 0,954 ДИ [0,944;0,963]. Область применения результатов. Результаты исследования могут быть использованы для интеграции прототипа экспертной системы в автоматизированное рабочее место врача медицинской информационной системы медицинской организации. Ключевые слова: Подагра; Экспертная система; СППВР; База знаний; Онтология; Редактор базы знаний.
Контактная информация: Осмоловский Иван Сергеевич, email:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
DEVELOPING AND TESTING A PROTOTYPE EXPERT SYSTEM FOR GOUT DIAGNOSIS Abstract Significance. Gout is a rheumatological disease that affects up to 2% of the population of the Russian Federation according to various sources. The pathogenesis of the disease is associated with a disturbance in uric acid metabolism and manifests itself in the deposition of monosodium urate crystals in various tissues of the body. Timely diagnosis and treatment of the disease can prevent the development of gout complications and disability of the patient, however, according to various sources, it takes from 44 to 8 years to diagnose gout. One possible way to improve the quality of gout diagnosis is to develop and implement an expert system for preliminary diagnosis, diagnostic techniques and consultations, and final diagnosis. The purpose of the study is to develop and test a prototype expert system for gout diagnosis. Material and methods. The study used system analysis methods, including decomposition, analysis and synthesis methods, knowledge engineering methods, including knowledge representation methods (frames, semantic networks), ontological approach, fuzzy logic, hierarchical structuring methods and effective evaluation methods, including ROC analysis. Results. A prototype expert system for gout diagnosis has been developed. The prototype consists of a knowledge base, a logical solver, and an explanation subsystem. A specialized knowledge base editor was created for the development and subsequent maintenance of the knowledge base. The knowledge base was filled using 2 information objects jointly developed with a group of experts: the nomenclature of medical concepts (495 basic and 679 synonymous concepts) and logical schemes (40 schemes) related to gout diagnosis. The structure of the knowledge base is a combination of frames and semantic networks and includes 18 objects (7 types of concepts and 11 types of relationships). A graph database is used to store the knowledge base that determines the logic of the logical solver and the explanation subsystem. The logical solver analyzes the patient's clinical data and searches the optimal path, the end points of which are the recommendations of the expert system prototype. The explanation subsystem uses this path to argue the selected solution. The prototype expert system was tested on two depersonalized samples containing 1725 patients provided by the Tyumen Healthcare Department. Conclusion. A prototype expert system has been developed to determine the preliminary diagnosis of gout, prescribe diagnostic techniques and consultations for its verification, and make a final diagnosis. The prototype includes 1174 concepts and 5,640,522 relationships. Testing of the prototype expert system with ROC-analysis showed that its sensitivity was 91.3% CI [89.1%; 93.1%], specificity was 85.4% CI [82.9%; 87.6%], and AUROC was 0.954 CI [0.944; 0.963]. Scope of application. The research results can be used to integrate the prototype expert system into the doctor’s automated workplace of a medical information system in a medical organization. Keywords: gout; expert system; knowledge base; ontology; intelligent knowledge base editor.
Corresponding author: Osmolovsky Ivan Sergeevich, email:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
Введение Подагра (МКБ-10: М10.0, МКБ-11: FA25.0) – заболевание, связанное с нарушением обмена пуринов, которое приводит к отложению кристаллов моноурата натрия и воспалению различных тканей организма [1–3]. В долгосрочной перспективе подагра может привести к различным осложнениям и инвалидизации пациента из-за рецидивов острого артрита и формирования подагрических тофусов. Своевременная диагностика и лечение могут снизить риск возникновения рецидивов и предотвратить инвалидизацию пациента [3,4]. В настоящее время среднее время между появлением первых симптомов и установлением диагноза подагры составляет 4,6 года [5], что может привести к необратимым изменениям в суставах и внесуставным осложнениям, затрудняющим лечение. Причины такой длительной диагностики разнообразны, включая нехватку специалистов. Так, согласно приказу Минздравсоцразвития от 15.05.2012 № 543н, медицинским организациям рекомендуется иметь одного врача-ревматолога на 30000 человек прикрепленного населения. Однако указанное требование не выполняется на практике, по данным ряда исследований [6,7]. Другой причиной длительной диагностики заболевания является то, что золотой стандарт – поляризационная микроскопия [3,4] – не является широко распространенным методом исследования в Российской Федерации [5]. Аналогичная ситуация характерна и для других стран, в том числе европейских [8]. В связи с этим врачи-специалисты вынуждены определять диагноз на основе менее точных клинических параметров, что приводит к врачебным ошибкам [9]. В настоящее время в научной литературе все чаще появляются статьи, описывающие варианты минимизации числа врачебных ошибок [10]. В качестве такого инструмента рассматривается разработка и внедрение в клинические процессы систем поддержки принятия врачебных решений [11], в том числе основанных на знаниях, например экспертные системы (ЭС) [12–15]. Основным компонентом ЭС принято считать базу знаний (БЗ). Разработка БЗ включает ряд этапов, которые изучаются инженерией знаний. Одним из таковых является выбор модели представления знаний. Среди моделей - семантические сети, представляющие собой ориентированный граф [12,14], фреймы, позволяющие создать типовые структуры и определяющие правила их наполнения [12,16] и другие. Еще одним этапом разработки БЗ является структурирование знаний, которое направлено на устранение неоднозначности, противоречивости, неполноты знаний. Формируемое поле знаний должно быть разделяемым профильным сообществом и обеспечивать функциональную совместимость прототипа ЭС с предоставляемыми данными от медицинских информационных систем медицинских организаций [17], поэтому все чаще в различных работах применяется онтологический подход. Основа онтологического подхода – описание системы понятий предметной области, то есть формирование терминологической базы с однозначной трактовкой каждого входящего в него термина [17,18]. Целью настоящего исследования является разработка и апробация прототипа ЭС в области диагностики подагры, направленного на оказание поддержки врачу при установке предварительного диагноза, назначении исследований и консультаций, постановке окончательного диагноза. Материалы и методы Группа экспертов (врачи-ревматологи, врачи-терапевты) состояла из 3 высококвалифицированных специалистов кафедры факультетской терапии имени академика А.И. Нестерова Российского национального исследовательского медицинского университета имени Н.И. Пирогова. Критерии для отбора экспертов были следующими: наличие ученой степени, опыт работы в области ревматологии более 8 лет, наличие цитируемых публикаций. Прототип экспертной системы для диагностики подагры был разработан с использованием Microsoft Visual Studio 2019 и языка программирования C#. В качестве технического решения для хранения базы знаний была использована графовая СУБД Neo4j. Апробация прототипа экспертной системы для диагностики подагры была основана на 2183 электронных медицинских записях, предоставленных департаментом здравоохранения Тюменской области, которые были преобразованы в формат структурированных электронных медицинских документов (CDA2.0, HL7 v3). 1001 медицинская запись была о пациентах с подагрой (группа подагры, первая выгрузка), 1182 медицинские записи были о пациентах с септическим артритом, артропатией пирофосфата, реактивным артритом, ревматоидным артритом, псориатическим артритом и другими заболеваниями, симптомы которых похожи на симптомы подагры (группа неподагры, вторая выгрузка), согласно мнению экспертов. Медицинские записи о пациентах были собраны за период с 01.01.2017 по 30.09.2022 года. Каждая медицинская запись содержит обезличенную информацию о пациенте. В ней указаны возраст и пол пациента, результаты консультации врачей (жалобы пациента, анамнез жизни, анамнез заболевания, объективный статус, диагноз и рекомендации), результаты лабораторных исследований (общий анализ крови, биохимический анализ крови, СОЭ или С-реактивный белок), а также инструментальных исследований (ультразвуковые и рентгенологические обследования, компьютерная и магнитно-резонансная томография пораженных суставов). Ни в одной медицинской записи не были указаны результаты поляризационной микроскопии, что не являлось ограничением для сбора данных. В ходе проведения исследования использовались методы системного анализа, включающие декомпозицию, анализ и синтез, и методы инженерии знаний, которые включали методы извлечения знаний (как коммуникативные методы, так и текстологические методы), методы структурирования знаний (методы иерархического структурирования, онтологический подход, методы нечеткой логики) и методы формализации знаний (семантические сети и фреймы). В основе методов нечеткой логики, которые использовались в ходе исследования, были применены методы фаззификации и дефаззификации [19], в том числе модифицированная Стэнфордская модель. Суть модификации заключается в ограничении исходного диапазона допустимых значений фактора уверенности [-1;1] в части отрицательных значений. То есть в работе использовался диапазон значений [0;1]. Для апробации информационных объектов использовался метод сопоставления, в рамках которого каждый эксперт работал с информационными объектами, основанными на федеральных клинических рекомендациях [1,4], независимо. Все эксперты начинали работу с идентичными копиями информационных объектов и вносили в нее изменения. Каждое свое действие эксперт подтверждал литературным источником, если такой имелся. Затем измененные объекты сопоставлялись между собой. В случае схожих правок они вносились в эталонные информационные объекты. В случае выявления отличающихся фрагментов методом мозгового штурма и общего голосования принималось решение о внесении или невнесении отличной информации в эталонные информационные объекты. Результаты Разработка прототипа экспертной системы Прототип экспертной системы для диагностики подагры состоит из двух компонентов: базы знаний (БЗ), включающей 1174 медицинских понятия и 5 640 522 связей, и программного обеспечения, включающего логический решатель. Разработка БЗ началась с первичной формализации диагностики подагры в виде номенклатуры медицинских понятий и логических схем [18]. Эти информационные объекты использовались для эффективного взаимодействия между инженером по знаниям и группой экспертов и позволили минимизировать технические вопросы, связанные с разработкой ЭС. Номенклатура медицинских понятий включает 495 основных и 679 синонимичных понятий. Последние связаны исключительно с основными понятиями и используются в системе с целью перенаправления логического решателя на основное понятие, которое в свою очередь используется в основе логических схем и впоследствии в логике БЗ. Особенностью синонимичных понятий является возможность их неограниченного расширения, которое не приводит к существенному изменению логики БЗ. Логические схемы в части постановки диагноза подагры использовались для проработки логики постановки диагноза, совместно с группой экспертов, на основе федеральных клинических рекомендаций[1,4]. В ходе проработки диагноза было определено 20 конечных диагнозов, которые описывают клинические стадии подагры и функциональные классы поражения суставов. Всего было разработано 40 логических схем, созданных на основе 52 понятий, которые собираются в результате осмотра пациента врачами (врач-терапевт, врач общей практики, врач-ревматолог и другие), проведения лабораторных (клинический анализ крови, биохимический анализ крови и другие) и инструментальных исследований (ультразвуковое, рентгенологическое исследование, компьютерная, магнитно-резонансная томография пораженного сустава и другие). В ходе формирования БЗ был создан редактор БЗ, помогающий инженеру по знаниям разработать и поддерживать в дальнейшем БЗ. Редактор состоит из четырех модулей: модуля обработки текстовых источников (разбиение их на семантические фрагменты и извлечение медицинских понятий), модуля работы с номенклатурой медицинских понятий (поддерживающий формирование собственно номенклатуры понятий, синонимичных и родовидовых связей между понятиями номенклатуры), модуля структуры БЗ и модуля редактора БЗ (обеспечивающий возможность точечного изменения БЗ инженером по знаниям и перенос знаний из информационных объектов (номенклатура медицинских понятий и логические схемы) в БЗ). Последний модуль осуществляет работу с графовой СУБД Neo4j, которая выступает в качестве технического решения для хранения и обработки БЗ. Редактор БЗ обеспечивает перенос всех извлеченных знаний в БЗ с поддержанием всех используемых инженером по знаниям и группой экспертов источников информации. Поддержание источников используется в рамках ЭС несколькими способами. Во-первых, источники информации позволяют ЭС обеспечивать качественную аргументацию каждой рекомендации, что является неотъемлемой составляющей доказательной медицины. Во-вторых, наличие источников информации позволяет в явном виде определять актуальность сведений в БЗ в случае выхода новых федеральных клинических рекомендаций. В-третьих, явно обозначенные источники информации позволяют инженеру по знаниям вести конструктивное взаимодействие с группой экспертов и подтверждать свою точку зрения. Структура БЗ была разработана с использованием комбинации двух методов представления знаний (семантических сетей и фреймов), онтологического подхода и элементов нечеткой логики [18]. Структура описывает 7 типов понятий, связанных 11 типами связей. Каждый из них имеет набор атрибутов. Один из атрибутов - степень уверенности, который описывает уверенность экспертов в том, насколько однозначно симптомы, синдромы или их комбинации определяют заболевание. Степень уверенности определяется в диапазоне от 0 до 100% (модификация Стэнфордской модели) [19]. Данный атрибут использовался в связях между понятиями типа "Симптом", "Синдром" и "Диагноз". Заполнение степени уверенности было проведено в три этапа. На первом этапе эксперты определили значение степени уверенности для связи между одним понятием типа "Симптом" или "Синдром" и понятием типа "Диагноз". На втором этапе группа экспертов определила наборы понятий типа "Симптом" и\или "Синдром", достаточных для постановки диагноза. На третьем этапе, используя линейную интерполяцию, инженер по знаниям и эксперты определили промежуточное значение степени уверенности для разных наборов понятий типа "Симптом" и\или "Синдром". Программное обеспечение использует алгоритмы, которые с определенной уверенностью идентифицируют подагру и генерируют диагностические рекомендации для врача, принимающего окончательное решение. Программное обеспечение состоит из трех модулей: "Предобработка данных", "Определение синдрома\диагноза" и "Определение методов дополнительной диагностики или консультации". Первый модуль анализирует структурированные сведения о пациенте. К структурированным сведениям могут быть отнесены электронная медицинская запись пациента или структурированные электронные медицинские документы (СЭМД). Модуль извлекает клинические параметры и сопоставляет с БЗ, что в итоге определяет перечень входных данных. Второй модуль направлен на постановку предварительного или заключительного диагноза в зависимости от полноты полученных клинических сведений. В случае установки предварительного диагноза ЭС запускает третий модуль, определяющий перечень лабораторных, инструментальных исследований и\или консультаций врачей-специалистов, который ЭС будет рекомендовать врачу для подтверждения диагноза. В процессе работы второго и третьего модулей используется логический решатель, который осуществляет поиск оптимального пути в БЗ. Логический решатель начинает поиск оптимального пути со входных данных, полученных в первом модуле. Далее анализируются все связи входных данных и осуществляется переход на промежуточные узлы, если клинические сведения соответствуют атрибутам связи. Выстраивая оптимальный путь, логический решатель в рамках второго модуля либо доходит до понятий типа «Диагноз», что в зависимости от полноты собранных клинических сведений в дальнейшем рассматривается как предварительный или заключительный диагноз (для этого используется степень уверенности), либо остается на промежуточных узлах, что не позволяет заподозрить подагру у пациента. Одним из примеров последнего сценария является повышенный уровень мочевой кислоты в крови. Данный признак характеризует гиперурикемию (МКБ-10: E79.0, МКБ-11: 5C55.0), однако в рамках диагностики подагры уровень мочевой кислоты является косвенным признаком, который в соответствии с федеральными клиническими рекомендациями не может быть достаточным основанием для установки предварительного диагноза подагры. Логический решатель в рамках третьего модуля доходит до понятий, описывающих лабораторные и инструментальные методы исследования, консультации врачей-специалистов или методы физикального исследования. Задачей данного логического решателя является определение минимального набора дополнительной информации, который позволит подтвердить диагноз подагры у пациента. Пример работы логического решателя приведен на Рисунок 1. Выявленный логическим решателем путь в дальнейшем используется подсистемой объяснения для аргументирования рекомендаций ЭС.
Апробация экспертной системы Департамент здравоохранения Тюменской области предоставил две выгрузки из деперсонифицированных электронных медицинских карт пациентов с подагрой и схожими с ней заболеваниями в формате xlsx. В соответствии с приказом Министерства здравоохранения Российской Федерации от 12 ноября 2012 г. № 900н «Об утверждении Порядка оказания медицинской помощи взрослому населению по профилю "ревматология"», пункт 5 в случае выявления у пациентов медицинских показаний непрофильные специалисты, в том числе врач-терапевт участковый или врач общей практики, должны направить пациента к врачу-ревматологу. В связи с этим, мы считаем, что все сведения о пациентах с ревматологическими заболеваниями, предоставленные Департаментом здравоохранения Тюменской области, включали в себя консультацию врача-ревматолога. Формат xlsx не поддерживается прототипом ЭС, поэтому сведения о 2183 пациентах были конвертированы в формат структурированных электронных медицинских документов (CDA 2.0, HL7 v3) в соответствии со следующими федеральными Документациями СЭМД:
Среди всех выгруженных СЭМД встречались такие объекты, наполнение которых не включало в свой состав информацию, связанную с подагрой. Критериями исключения подобных объектов стал перечень понятий, соответствующий первому шагу классификации ACR/EULAR («Критерии включения»), то есть если в сведениях пациента отсутствовала информация из данного перечня, то пациент исключался из исследования. В результате из первой выгрузки было исключено 165 пациентов, что составило 16,4% от общего количества. Из второй выгрузки было исключено 293 пациента (24,8%). Конвертация обеих выгрузок сопровождалась разбором текстовых описаний, включающих в себя важные клинические сведения о состоянии пациента и его лечении. Сведения, соответствующие номенклатуре медицинских понятий, извлекались из текстового описания и вносились в специально отведенные для этого элементы СЭМД. Все СЭМД загружались в прототип ЭС с целью ретроспективной диагностики состояния пациента. В результате анализа прототип сформировал рекомендации для каждого СЭМД, включающий предварительный\заключительный диагноз и степень уверенности прототипа в рекомендации. Для проведения дальнейшей оценки собранных результатов использовался ROC-анализ, результатом которого стал график, представленный на Рисунок 2.
На основании результатов ROC-анализа определялось оптимальное пороговое значение степени уверенности прототипа ЭС. Для этого напротив каждой точки Рисунок 2 определялась сумма чувствительности и специфичности. Полученные значения ранжировались по убыванию сумм и выбиралась такая степень уверенности в пяти первых значениях, чувствительность которой была наибольшей. Фрагмент приведен в Таблица 1. Таблица 1 Фрагмент таблицы, построенной на основе вычисленных чувствительности и специфичности по точкам ROC-кривой
При выборе порогового значения степени уверенности равном 67,44% были получены 763 истинно положительных сведений о пациентах, 759 истинно отрицательных, 73 ложноотрицательных и 130 ложноположительных. Чувствительность прототипа ЭС составила 91,3% ДИ [89,1%; 93,1%], специфичность – 85,4% ДИ [82,9%; 87,6%]. AUROC составил 0,954 ДИ [0,944;0,963]. Обсуждение В результате проведенного исследования были продемонстрированы основные этапы разработки прототипа ЭС для поддержки решений врача при диагностике подагры, начиная с извлечения знаний из текстологических источников и группы экспертов, заканчивая валидацией разработанных компонентов прототипа (БЗ, редактор БЗ, логический решатель и подсистема объяснений). При формировании базы знаний разрабатывались номенклатура медицинских понятий и логические схемы в области диагностики подагры, которые описывают взаимосвязи между понятиями, что определяет применение онтологического подхода в данной работе. Каждый информационный объект проходил валидацию со стороны группы экспертов методом сопоставления, после чего переносился в БЗ. Модель БЗ в данной работе была определена как сочетание классических моделей представления знаний: семантической сети и фреймов, где из первой модели взяты логика описания взаимосвязей между понятиями, а из второй – способ представления каждого элемента БЗ в отдельности, то есть в виде фреймов. Такое представление позволяет сформировать и наследовать типы как понятий, так и связей и определить их базовые атрибуты (слоты). В литературе встречаются схожие модели, в том числе сети фреймов, предполагающие указывать в качестве слота – фрейм [12,24], организуя таким образом иерархические связи между понятиями, или онтологическую модель знаний [25], во многом наследующую свойства фреймов. Однако на данный момент устоявшегося термина, описывающего подобную модель знаний, в мировой литературе не представлено. Также по результатам апробации прототипа экспертной системы был выявлен порог степени уверенности, при котором чувствительность и специфичность являются максимальными. Данный порог не определяет подтверждённый диагноз подагры, но устанавливает значение степени уверенности, после которого прототип должен обратить внимание врача-специалиста на возможный диагноз подагры и необходимость назначить консультацию врача-ревматолога. Заключение Совместно с группой экспертов был разработан прототип экспертной системы для диагностики подагры, который включает в свой состав базу знаний, логический решатель и подсистему объяснений. В ходе разработки базы знаний были созданы 3 информационных объекта: структура базы знаний, номенклатура медицинских понятий и логические схемы. Структура базы знаний основана на сочетании двух методов представления: семантические сети и фреймы. Структурирование знаний осуществлялось с помощью онтологического подхода. В качестве хранилища базы знаний используется графовая СУБД, которая определила логику работы решателя и подсистемы объяснения, который заключается в поиске оптимального пути, где конечные точки данного пути являются рекомендацией прототипа экспертной системы, а сам путь используется подсистемой объяснений с целью аргументации выбранного системой решения. Прототип экспертной системы был валидирован на деперсонализированных выгрузках, предоставленных Тюменским департаментом здравоохранения и содержащих в себе сведения о 2183 пациентах. В ходе апробации получены результаты, позволяющие рекомендовать разработанный прототип ЭС для внедрения в клиническую практику. Библиография
References
Дата поступления: 06.07.2023 Просмотров: 2468
Добавить комментарий
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее обновление ( 12.10.2023 г. ) |
« Пред. | След. » |
---|