ВКЛАД КОМБИНАЦИЙ ФАКТОРОВ РИСКА В РАЗВИТИЕ ХРОНИЧЕСКИХ НЕИНФЕКЦИОННЫХ ЗАБОЛЕВАНИЙ |
13.11.2020 г. | ||||||||||||||||||||||||||||||||||||
DOI: 10.21045/2071-5021-2020-66-5-1 1Кобякова О.С., 1Старовойтова Е.А., 1Толмачев И.В., 2Бразовский К.С., 1Деев И.А., 1Куликов Е.С., 1Альмикеева А.А., 1Файзулина Н.М., 1Балаганская М.А.
1ФГБОУ ВО «Сибирский государственный медицинский университет» Минздрава России, Томск Резюме Повышение распространённости хронических неинфекционных заболеваний и увеличение смертности по их причине стимулирует на разработку эффективных методов профилактики. На сегодняшний день мало данных о том, как влияет сочетанное действие различных факторов риска на развитие того или иного хронического заболевания, насколько повышается или понижается риск развития хронических неинфекционных заболеваний при различном сочетании ФР. Цель: оценить вклад сочетанного воздействия факторов риска в развитие хронических неинфекционных заболеваний с помощью метода нейронных сетей. Материалы и методы: проанализированы данные 9505 посетителей, обратившихся в Центры здоровья г. Томска. Для построения многомерной модели принятия решений использовался алгоритм многослойного перцепторна реализованный на платформе IBMWatson. Результаты: Наибольшая точность распознавания заболевания для тестовой выборки составила для сахарного диабета 95,8%. На втором месте по точности распознавания находятся хроническая обструктивная болезнь легких (84,5%) и ишемическая болезнь сердца 80,4%. В меньшей степени точность распознавания была у таких заболеваний как бронхиальная астма (73,6%) и гипертоническая болезнь (73,3%). Для развития сахарного диабета в равной степени имеют значение такие факторы как: возраст пациента, уровень систолического и диастолического артериального давления, значения индекса массы тела. Курение и пол определены как наиболее значимые факторы для развития хроническая обструктивная болезнь лёгких. В развитие бронхиальной астмы наиболее значимый вклад вносит только значение индекса массы тела. Для ишемической болезни сердца и гипертонической болезни наиболее значимыми факторами оказались возраст и значение индекса массы тела. Заключение: Использование метода нейронных сетей позволяет определить вклад факторов риска в развитии хронических неинфекционных заболеваний, спрогнозировать риск развития того или иного заболевания в зависимости от комбинации факторов риска и проводить профилактические мероприятия персонифицировано, с учётом клинической ситуации у каждого человека. Область применения результатов: Результаты работы могут быть использованы в Центрах здоровья с целью оптимизации подходов к профилактической работе. Ключевые слова: факторы риска; хронические неинфекционные заболевания; нейронные сети
Контактная информация: Старовойтова Елена Александровна, e-mail:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
CONTRIBUTION OF COMBINED RISK FACTORS INTO DEVELOPMENT OF CHRONIC NON-COMMUNICABLE DISEASES Abstract Increased prevalence of chronic non-communicable diseases (NCD) and increased related mortality stimulate development of effective methods of their prevention. To date, there are little data on the combined effect of various risk factors on the development of a particular chronic disease, and how much the risk of developing chronic non-communicable diseases increases or decreases with a different combination of risk factors. Purpose. To assess contribution of the combined effect of risk factors into the development of chronic NCD using the method of neural network. Material and methods. Data on 9505 visitors seeking care at the Tomsk health centers were analyzed. To build a multidimensional decision-making model, the authors used the multi-layer perceptron algorithm implemented on the IBM Watson platform. Results. The highest accuracy of disease recognition in the test sample added up to 95.8% for diabetes mellitus. Chronic obstructive pulmonary disease (84.5%) and coronary heart disease (80.4%) rank second. Lower accuracy was registered for such diseases as asthma (73.6%) and arterial hypertension (73.3%). For the development of diabetes mellitus, such factors as patient’s age, level of systolic and diastolic blood pressure, and body mass index (BMI) are equally important. Smoking and gender are identified as the most significant factors for the development of chronic obstructive pulmonary disease. The most significant contribution to the development of arterial hypertension is made by body mass index only. Age and BMI turned out to be most significant for coronary heart disease and arterial hypertension. Conclusion. Use of the neural network method makes it possible to determine contribution of risk factors to the development of chronic ICD, to predict the risk of developing a disease depending on the combination of risk factors and to carry out preventive measures in a personalized manner, taking into account clinical situation of every person. Scope of application. The results of the study can be used by managers of medical organizations to optimize approaches to preventive activities. Keywords: risk factors; chronic non-communicable diseases; neural networks
Corresponding author: Elena A. Starovoitova, e-mail:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
Введение С середины прошлого века в экономически развитых странах активно идёт процесс демографического старения населения. На сегодняшний день в этот процесс вовлечены не только развитые, но и развивающиеся страны. Одной из значимых причин старения населения является увеличение продолжительности жизни. В связи с этим увеличивается и бремя хронических заболеваний в данной возрастной группе. По данным Всемирной организации здравоохранения (ВОЗ) хронические неинфекционные заболевания (ХНИЗ) обусловливают примерно 71% всех смертей в мире [1]. К неинфекционным заболеваниям относятся сердечно-сосудистые заболевания (например, гипертоническая болезнь и ишемическая болезнь сердца), онкологические заболевания, хронические респираторные заболевания (например, хроническая обструктивная болезнь легких и астма) и диабет. Установлены единые факторы риска (ФР) для данной группы заболеваний (курение, чрезмерное употребление алкоголя, низкая физическая активность, нерациональное питание, повышение артериального давления, гиперхолестеринемия, избыточная масса тела, гипергликемия) [1]. Проведены исследования, которые показывают роль каждого отдельного фактора риска в отношении развития ХНИЗ [2, 3, 4]. Однако, в реальной клинической практике встает вопрос об их взаимном влиянии факторов друг на друга: усиление или ослабление действия. В ряде работ зарубежных ученых установлено увеличение риска смерти от сердечно-сосудистой и онкологической патологии при сочетанном воздействии некоторых факторов риска у человека [5]. Однако, очень важно понимать в каких комбинациях факторы риска наиболее вероятно реализуются в заболевания и угрожающие жизни состояния. Это требует разработки систем прогнозирования, которые можно будет использовать в практическом здравоохранении. Сегодня весь мир находится в поиске наиболее эффективных стратегий профилактики хронических неинфекционных заболеваний. Множество методов математического моделирования позволяют анализировать и прогнозировать развитие того или иного состояния. Самыми распространенными описательными методами, использующимися в традиционных статистических исследованиях, являются анализ выживаемости и многомерный комплексный анализ, классифицирующийся на дискриминантный, кластерный, факторный и корреляционный. Некоторые авторы предлагают использовать перспективный метод статистического анализа – метод нейронных сетей [6]. Материал и методы В работе проанализированы данные 9505 посетителей, обратившихся в Центры здоровья г. Томска. При обращении в Центр на каждого пациента заполнялась «Медицинская карта центра здоровья». В карте отражались паспортные данные, социальный статус, данные анамнеза (наличие хронических заболеваний, данные о курении, употреблении алкоголя, физической активности, питании пациента) и результаты обследования (рост, вес, значения артериального давления; данные экспресс-анализа определения общего холестерина и глюкозы в крови, индекс массы тела). Расчет индекса массы тела (ИМТ) производился по формуле: масса тела, кг /рост, м². Все оцениваемые параметры входят в стандарт обследования в Центре здоровья. Для предварительной оценки данных мы использовали классические методы прогнозирования сочетанного действия факторов риска на развитие ХНИЗ (логистическая регрессия, случайный лес), к сожалению точность моделей оказалась низкой, полученный результат может свидетельствовать о нелинейной связи между изучаемыми признаками. В связи с этим стандартные подходы, связанные с оценкой состояний, не позволяют обнаружить скрытые закономерности в данных и обычные методы статистического анализа не решают поставленные задачи. Новым поколением методов математического анализа является метод нейронных сетей. Многослойный перцептрон относится к методам нейронных сетей и является методом моделирования, позволяющим аппроксимировать и классифицировать сложно структурированные данные и учитывать сложные зависимости. Технология многослойный перцептрон позволяет провести сравнение между пациентами с различными факторами риска и контрольной группой с целью поиска пограничного критерия, характеризующего вероятность заболевания, что и было сделано в нашем исследовании. Для проведения статистической обработки данных в качестве алгоритма распознавания состояний был выбран многослойный перцептрон с количеством входных нейронов равным 23 и 1 скрытым слоем. Говоря о подборе архитектуры сети стоит упомянуть, что в литературе есть работы по методике подбора архитектуры сети, но они носят скорее научный характер, в нашем случае архитектура сети подбиралась исходя из задачи – максимизация значения AUC для обучающей выборки. AUC – показатель точности. В качестве функции активации скрытых слоев использовался гиперболический тангенс. Критерием остановки обучения являлось достижение максимальной точности распознавания обучающей выборки. Обучение нейронной сети представляет собой итеративный процесс, в ходе которого нейронная сеть находит скрытые нелинейные зависимости между исходными параметрами и конечным диагнозом, а также оптимальную комбинацию весовых коэффициентов нейронов, соединяющих соседние слои, при которой погрешность определения класса образа стремится к минимуму. В процессе обучения («с учителем») на вход нейронной сети подается последовательность исходных параметров наряду с диагнозами, которые эти параметры характеризуют. Тщательное формирование обучающей выборки определяет качество работы, а также уровень погрешности нейронной сети [7]. В процессе реализации системы поддержки принятия врачебных решений (СППВР) для каждого заболевания (бронхиальная астма, хроническая обструктивная болезнь легких, ишемическая болезнь сердца, гипертоническая болезнь, сахарный диабет) была построена собственная нейронная сеть классифицирующего типа. В качестве входных данных использовались: пол, возраст, употребление алкоголя, курение, индекс массы тела, уровень холестерина, уровень глюкозы, уровень систолического и диастолического артериального давления, гиподинамия и нерациональное питание. В качестве входного состояния модели использовалась вычисленная вероятность патологического состояния. Значимость фактора оценивалась методом «Mean Decrease Accuracy (MDA)». Общий объем выборки составлял 9505 человек. При формировании обучающих и тестовых выборок использовалась рандомизация (4703 человека - обучающая выборка, 4702 – тестовая выборка). Обучающие выборки использовались для расчета весовых коэффициентов классифицирующей нейронной сети. При расчёте параметров нейронной сети использовалось последовательное предъявление сформированных на основе обучающей выборки датасетов размером от 1500 до 1703 человек. Целью этого подхода было последовательная корректировка параметров нейронов, входящих в многослойный перцептрон. Первый шаг – построение общей структуры модели (датасет 1703 человека), второй шаг - увеличение точности распознавания (boosting) (датасет 1500 человек), третий шаг - балансировка модели (bagging). Качество моделей поддержки принятия решений оценивалось при помощи операционных характеристик ROC-анализа для обучающей и тестовых выборок. Для построения многомерной модели принятия решений использовался алгоритм многослойного перцептрона реализованный на платформе IBMWatson (рис. 1) [8].
Результаты После проведения подсчетов с применением IBMWatson, наибольшая точность распознавания заболевания для тестовой выборки составила для сахарного диабета (СД) (95,85%) (таблица 1). При этом чувствительность (Se), отражающая способность метода определять наличие у обследуемого СД, составила 97%. Специфичность (Sp), в свою очередь, составила 89% и была существенно ниже Se, что отражает более низкую способность метода опровергать диагноз СД, там, где его действительно нет. С точки зрения диагностической эффективности тест показал высокое значение AUC= 0,934. На втором месте по точности распознавания находятся хроническая обструктивная болезнь легких (ХОБЛ) (84,5%) и ишемическая болезнь сердца (ИБС) (80,4%), при этом чувствительность (88,7% и 87,0%) также была выше специфичности (79,0% и 71,0%). Показатель AUC у данных заболеваний был также достаточно высоким и составил 0,902 и 0,813 соответственно. В меньшей степени точность распознавания была у таких заболеваний как бронхиальная астма (БА) (73,6%) и гипертоническая болезнь (ГБ) (73,3%). Однако, чувствительность в обоих случаях была высокой (84% и 82% соответственно) и была значительно выше специфичности, которая составила 67% и 71% (таблица 1). Таблица 1 Результаты проведения расчетов с применением IBMWatson
Для развития СД в равной степени имеют значение такие факторы как: возраст пациента, уровень систолического и диастолического артериального давления, значения индекса массы тела. Несколько меньший вклад оказывают гиподинамия, уровень холестерина и нерациональное питание. Практически не значимы такие факторы риска как курение и употребление алкоголя. Кроме того, пол пациента также не имеет значения для развития СД (рисунок 2).
Курение и пол определены как наиболее значимые факторы для развития ХОБЛ. В меньшей степени вклад вносят в риск развития ХОБЛ уровень глюкозы, возраст, значение индекса массы тела, уровень холестерина и нерациональное питание. Практически незначимыми оказались употребление алкоголя и уровень систолического и диастолического артериального давления (рисунок 3).
Из всех оцениваемых факторов риска для развития БА наиболее значимый вклад вносит только значение ИМТ. В меньшей степени вклад вносят в риск развития БА нерациональное питание, уровень систолического и диастолического артериального давления, употребление алкоголя, уровень глюкозы, возраст, гиподинамия. Практически незначимыми оказались пол и курение (рисунок 4).
Для ИБС и ГБ наиболее значимыми факторами оказались возраст и значение ИМТ. В меньшей степени вклад вносят в риск развития ИБС уровень систолического и диастолического артериального давления, уровень глюкозы, употребление алкоголя, уровень холестерина, гиподинамия и нерациональное питание. Практически незначимыми оказались пол и курение, как и в случае с БА (рисунок 5).
В меньшей степени вклад вносят в риск развития ГБ уровень глюкозы, уровень холестерина, нерациональное питание, гиподинамия, курение и употребление алкоголя. Практически незначимыми оказался такой фактор как пол (рисунок 6).
Обсуждение На сегодняшний день в нашей стране проведена большая работа по разработке и внедрению профилактических мероприятий в отношении ХНИЗ. ВОЗ и Министерство здравоохранения РФ внедряет методические рекомендации для проведения профилактического консультирования для отдельных поведенческих факторов риска (курение, низкая физическая активность, нерациональное питание). В реальной клинической практике врачи чаще всего встречаются с различной комбинацией факторов риска ХНИЗ у пациента. Установлено, что для каждого заболевания имеет значение определенное сочетание факторов риска, причем один и тот же фактор может оказывать существенное значение для одного заболевания и минимальное для другого. На сегодняшний день хорошо изучена распространенность факторов риска в популяции, но мало данных о том, как влияет сочетанное действие различных факторов риска на развитие того или иного хронического заболевания, насколько повышается или понижается риск развития ХНИЗ при различном сочетании ФР [9, 10]. Учитывая масштабы распространенности факторов риска ХНИЗ, современная медицина, особенно на уровне ее первичного звена, нуждается в вооружении доступными, безопасными для пациента, эффективными и надежными инструментальными средствами для своевременного, по возможности, максимально раннего выявления риска развития ХНИЗ. С помощью метода нейронных сетей был оценен вклад ФР в развитие каждого отдельного ХНИЗ. Так, например, вклад в развитие ИБС вносят сочетание факторов повышенного ИМТ, уровень систолического артериального давления, уровень глюкозы крови и употребление алкоголя. Тогда как для развития сахарного диабета имеет значение сочетание повышенного давления с избыточной массой тела. Данная работа показывает, насколько важно учитывать именно сочетанное действие факторов риска у каждого отдельно взятого человека. Этот метод открывает новые возможности для разработки персонифицированных профилактических программ. Заключение Проведённый анализ даёт возможность внедрить в работу практического здравоохранения инструмент (систему поддержки принятия врачебных решений), который будет позволять спрогнозировать риск развития того или иного заболевания в зависимости от комбинации факторов риска и проводить профилактические мероприятия персонифицировано, с учётом клинической ситуации у каждого человека. В дальнейшем полученные результаты могут быть объединены в единую компьютерную диагностическую программу, которая будет самообучаться и будет пригодна для практического использования в Центрах здоровья, а также для самоконтроля пациентами своего состояния здоровья. Библиография
References
Дата поступления: 03.08.2020 Просмотров: 6037
Добавить комментарий
|
||||||||||||||||||||||||||||||||||||
Последнее обновление ( 30.11.2020 г. ) |
След. » |
---|