The death-rateS analysis of Novokuznetsk population on the basis of an electronic database for the period 1999-2007 |
Tuesday, 11 August 2009 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Fadeeva A.E., Zhilina N.M., Chechenin G.I.
According to the State report on a condition of health of the population of the Russian Federation, mortality of working population, after appreciable reduction in 1996-1999, again has increased in 2005 up to the level of 1995. Death rate of adult men in Russia is 2.5 times above the expected. In the world, only the small number of the countries is in more unfavorable position. In the present research, the profound analysis of death rate of the population of a large industrial city of Siberia with a problem ecological situation is carried out on the basis of the electronic personified database on death rate of the population for 1999-2007 with application of methods of the intellectual analysis. Key words: death rate, electronic personified database, able-bodied age, statistical and intellectual analysis, method for searching associative rules Введение. В настоящее время во всех областях человеческой деятельности многократно возрос объем обрабатываемой информации. Главным образом это связано с бурным развитием информационных технологий. В связи с этим особо остро стоит проблема анализа данных. Классические методы статистики уже не позволяют качественно и в полном объеме проанализировать все имеющиеся данные. Поэтому сегодня разрабатываются новые методы анализа данных, и одно из перспективных направлений это интеллектуальный анализ данных (Data Mining). Традиционные методы анализа данных в основном ориентированы на проверку заранее сформулированных гипотез и на "грубый" разведочный анализ, в то время как одно из основных положений Data Mining - поиск неочевидных (скрытых) закономерностей. Методы интеллектуального анализа можно применять и в управлении здравоохранением. Одним из этапов управления здравоохранением является анализ информации. Некоторые стандартные коэффициенты рассчитываются аналитическими системами автоматически, но творческий анализ информации, поиск нового знания проводится человеком. И если первые два этапа (сбор и обработка информации) с течением времени постепенно автоматизируются, то анализ информации, как и много лет назад, целиком выполняется людьми. И именно это является одной из основных проблем в управлении здравоохранением. В медицине резко увеличился поток и объем информации, в то время как способ её анализа остался прежним, и человек уже просто не в состоянии качественно и в полном объеме проанализировать такой большой объем данных. Таким образом, одной из задач современного здравоохранения является создание автоматизированной системы, которая хотя бы частично выполняла бы анализ данных, помогая тем самым человеку. Целью настоящего исследования является анализ смертности населения г. Новокузнецка, в том числе трудоспособного возраста, за период с 1999 по 2007 годы. В работе рассмотрены некоторые задачи, которые решает интеллектуальный анализ данных, а также предложена область применения интеллектуального анализа данных в конкретной области, а именно в управлении здравоохранением. В МУ «Кустовой медицинский информационно-аналитический центр» (МУ «КМИАЦ») г. Новокузнецка разработана и более двух десятилетий эксплуатируется автоматизированная система управления «Горздрав» (АСУ «Горздрав»). По мере необходимости система периодически адаптируется к более современным видам техники и программным средствам. Кроме того, система развивается и в проектном плане, с учетом изменения ситуации в здравоохранении. Нормативно-справочный фонд системы един для всех подсистем и комплексов задач, что обеспечивает возможность гибкого интерфейса между подсистемами и связи с другими автоматизированными системами, существующими в городском здравоохранении. АСУ «Горздрав» включает в себя следующие подсистемы: АИС "Учет и анализ деятельности дневных стационаров при поликлинике и на дому", АИС "Учет и анализ использования коечного фонда стационара", АИС "Учет и анализ временной утраты трудоспособности", АИС "Учет и анализ инвалидизации в городе", АИС "Учет и анализ заболеваемости в городе", АИС "Учет и анализ смертности", АИС "Организация диспансеризации", АИС "Учет и анализ деятельности поликлиники", АИС "Учет и анализ деятельности стационаров города", АИС "Учет и анализ деятельности ССНМП", АИС "Паспорт ЛПУ", АИС "Штаты медицинских учреждений". Персонифицированные динамические базы данных (БД) АСУ «Горздрав» зарегистрированы в Научно-техническом центре «Информрегистр» Федерального агентства по информационным технологиям. Материалы и методы исследования. С целью изучения смертности в г. Новокузнецке была проанализирована персонифицированная база данных «Смертность» КМИАЦ за 1999-2007гг. База данных «Смертность» разработана в рамках автоматизированной информационной подсистемы «Анализ и учет смертности». БД зарегистрирована в Научно-техническом центре «Информрегистр» Федерального агентства по информационным технологиям. Государственная регистрация № 0220711710 от 19 июля 2007г., регистрационное свидетельство № 11052. Структура базы данных представлена паспортными данными умершего, его семейным и социальным положением, датой и причиной смерти, местом проживания умершего. Проведен статистический анализ с помощью статистических пакетов обработки данных SPSS 13.0 for Windows и Биостатистика (версия 4.03). Использован один из методов интеллектуального анализа, а именно поиск ассоциативных правил в программе Deductor Studio Academic (версия 5.2). Основные результаты исследования. За период с 1999 по 2007 г. всего записей в базе данных 84 795. В таблице 1 представлено количество смертей по годам, число жителей в Новокузнецке в определенный год и коэффициент смертности. Таблица 1 Основные показатели смертности в Новокузнецке за 1999-2007гг.
Под коэффициентом смертности понимается число смертей на тысячу человек в данном году, коэффициент рассчитывается по следующей формуле [6, стр.50]:
где Di – количество смертей за i-й год; На рисунке 1 графически представлено изменение коэффициента смертности за период 1999-2007гг.
Из рисунка можно сделать следующие выводы: до 2003 года смертность в Новокузнецке повышается, в период за 2003-2005гг. коэффициент практически не менялся, а, начиная с 2005 года и по 2007 смертность в Новокузнецке снижается. Основные поля БД разделены на 4 группы: поля административного назначения, демографические факторы, социальные факторы, причины смерти. Взаимодействие между группами показано на рисунке 2:
Анализ проведен по всем четырем группам выделенных факторов. Из рисунка видно, что демографические, социальные факторы и факторы, которые не отражены в базе данных, влияют на первоначальную причину смерти, затем первоначальная причина смерти вызывает некоторое заболевание – промежуточную причину смерти, также на промежуточную причину смерти оказывают влияние внешние факторы, промежуточная причина смерти и внешние факторы вызывают некоторое заболевание, которое и является непосредственной причиной смерти. К тому же демографические, социальные и неучтенные факторы оказывают влияние друг на друга. Поля административного назначения предназначены для идентификации записи (являются первичными ключами) и для создания официальных отчетов по медицинским учреждениям города. Демографические факторы - в эту группу отнесены поля базы данных: «дата смерти», «дата рождения», «национальность», «пол умершего». Количество смертей по годам отдельно для мужчин и для женщин представлено в таблице 2. Там же указано число жителей определенного пола по годам и рассчитаны коэффициенты женской и мужской смертности. Таблица 2 Число смертей и показатели смертности по годам отдельно для мужчин и для женщин
Коэффициент женской смертности находится по формуле:
где Diw – количество женских смертей за i-ый год; Коэффициент мужской смертности находится по формуле:
где Dim – количество мужских смертей за i-ый год; Как видно из таблицы, мужская смертность превосходит женскую на всем анализируемом периоде. В среднем мужчин умирает в год 5282 человека (со стандартным отклонением ± 389 человек). Женщин в среднем умирает в год 4138 ± 179 человек. Динамика женского и мужского коэффициентов смертности представлена на рисунке 3.
Из рисунка видно, что на протяжении всего периода коэффициент мужской смертности больше, чем коэффициент женской. С 1999 года по 2005 год коэффициент мужской смертности возрастает с 17,14 до 22,28 соответственно. С 2005 года по 2007 мужская смертность снижается с 22,28 до 19,56. С 1999 года по 2005 наблюдался незначительный рост женской смертности с 12,28 до 14,18. С 2005 года по 2007 женская смертность снизилась с 14,18 до 13,10. Социальные факторы – включают в себя следующие поля: «где постоянно проживал», «семейное положение», «образование», «уникальный номер дома». Семейное положение, которое имел умерший человек, указывается в соответствующем поле «Семейное положение». Большинство умерших к моменту смерти состояло в браке (39,44%) чуть меньше имели семейное положение вдов(а) (28,75%), число умерших которые никогда не состояли в браке около 11,26 % , чуть меньше (10,76%) количество людей, чье семейное положение неизвестно, и 9,85% зарегистрированных в базе данных умерших были разведены. В графе «Образование» указывается образование, которое имел человек на момент смерти. Больше всего среди умерших людей со средне специальным образованием (более 25%), затем с общим средним (20,19%), немного меньше умирает людей с начальным образованием и ниже (18,42%), людей с неполным средним образованием в базе данных 14,89%, лиц, чье образование неизвестно 14,2%. Смертей людей с высшим образованием около 5,92% и с незаконченным высшим 0,69 процента. Выявленная структура смертности по образованию умерших отражает структуру населения промышленного города, которым является г. Новокузнецк. В поле БД «Уникальный номер дома» указывается уникальный номер дома в котором был прописан человек на момент смерти. Из специального справочника по уникальному номеру дома можно получить название района, в котором проживал человек. Всего в Новокузнецке шесть административных районов: Заводской, Кузнецкий, Куйбышевский, Новоильинский, Орджоникидзевский, Центральный. По абсолютному показателю больше всего смертей за 1999-2007 гг. зафиксировано в Центральном районе – 23751 человек, в год 2639 ± 123,22 человека. Меньше всего смертей в Новоильинском районе, за период 1999-2007гг. там зафиксировано 6100 смертей, в среднем в год 677 ± 88 человек. Относительные показатели, рассчитанные на 1000 человек, представлены в таблице 3. Таблица 3 Показатели смертности по районам города
Из таблицы видно, что самая высокая смертность в Кузнецком районе 17,63 ± 1,25, самая низкая в Новоильинском – 10,21 ± 1,21. Результаты корреляционного анализа показали согласованность частотных распределений смертей по районам за 1999 - 2008 гг. (k=0,943, уровень значимости: P<0,001). Причины смерти Самая распространенная причина смерти это болезни системы кровообращения, от них умерло более 48% зарегистрированных в базе данных (4599 ± 264 человека в год). Следующая по распространенности причина смерти это травмы и отравления от них умерло более 19% всех зарегистрированных (1846 ± 227,54 человека в год). За ними следуют новообразования, от них умерло около 13% всех умерших (1260 ± 31,8 человек в год). Результаты корреляционного анализа показали согласованность частотных распределений причин смерти в динамике за 1999 - 2008 гг. (k=0,975, уровень значимости: P<0,001). Наибольший интерес для исследования представляют данные о смертях в трудоспособном возрасте. Трудоспособный возраст для женщин 16-54 года, для мужчин 16-59лет. Всего зарегистрировано смертей женщин в трудоспособном возрасте 6740 случаев, в среднем в год 748 ± 69,31 человек. Самые распространенные заболевания в трудоспособном возрасте среди женщин это: токсическое действие этанола (всего за 1999-2007гг. зарегистрировано случаев 444, в среднем в год 49 ± 9,5 человек), алкогольная кардиомиопатия (всего 363 случаев, в год 40 ± 18,45 человек), другие формы острой ишемической болезни сердца (всего 277 случаев, в год 31 ± 7,1 человек), асфиксия (всего 219 случаев, в год 24 ± 6,1 человек), туберкулез легких подтвержденный гистологически (всего 188 случаев, в год 21 ± 12,6 человек). Мужских смертей в трудоспособном возрасте за весь анализируемый период зарегистрировано 24163 случая, в среднем в год умирает 2684 ± 324,2 человек. Самые распространенные заболевания в трудоспособном возрасте среди мужчин это: токсическое действие этанола (всего 1572 случая, в год 174 ± 31,5 человек), другие формы острой ишемической болезни сердца (всего 1501 случая, в год 167 ± 22,37 человек), отравление опиоидами (всего 1333 случая, в год 149 ± 107,71человек), асфиксия (всего 1259 случаев, в год 139 ± 19,6 человек), алкогольная кардиомиопатия (всего 1049 случаев, в год 116 ± 47,9 человек), туберкулез легких, подтвержденный гистологически (всего 763 случая, в год 84 ± 26 человек). Большое стандартное отклонение смертей от отравления опиоидами вызвано тем, что до 2002 г. от данной причины умирало в год в среднем 23 ± 8 человек, а, начиная с 2002 года, от этой причины в среднем в год умирает 231 ± 46 человек. Для того, что бы выявить статистически значимое различие по половому признаку рассчитывался критерий Пирсона χ2. Статистически значимо женщин умерло больше чем мужчин от следующих заболеваний: беременность и роды (p<0,001); болезни системы кровообращения (p<0,001); болезни эндокринной системы; расстройства питания и нарушения обмена веществ (p<0,001); психические расстройства и расстройства поведения (p<0,001). Статистически значимо мужчин умерло больше чем женщин от следующих заболеваний: болезни нервной системы (p<0,001); болезни органов дыхания (p<0,001); болезни органов пищеварения (p=0,006); некоторые инфекционные и паразитарные болезни (p<0,001); новообразования (p<0,001); симптомы, признаки и отклонения от нормы (p<0,001); травмы, отравления и некоторые другие последствия воздействия внешних причин (p<0,001). Среднее число смертей жителей г. Новокузнецка по месяцам представлено на рисунке 4.
Тест Крускала-Уоллиса показал значимость различий количества смертей по месяцам (p<0,001). При парных сравнениях с помощью критерия Данна было выявлено существенное различие между количеством смертей в январе и ноябре (p<0,05): количество смертей в январе существенно больше чем в ноябре. В январе происходит больше смертей от следующих заболеваний: цереброваскулярная болезнь неуточненная (в январе умирает 29 ± 6,3 человек, в ноябре 17 ± 6 человек), токсическое действие этанола (в январе умирает 34 ± 7,1 человек, в ноябре 24 ± 7,9 человек), алкогольная кардиомиопатия (в январе умирает 19 ± 8,5 человек, в ноябре 13 ± 5 человек), эффекты воздействия низкой температуры (в январе умирает 16 ± 7,5 человек, в ноябре 10 ± 5,2 человек). Применение методов интеллектуального анализа: поиск ассоциативных правил. Задачей поиска ассоциативных правил является определение часто встречающихся наборов объектов в большом множестве наборов (транзакций) [1, стр. 130-136]. Транзакция – это множество событий произошедших одновременно. Ассоциативные правила определяются как утверждения вида где подразумевается, что Y может присутствовать в транзакции при условии, что присутствуют в этой же транзакции. Вероятность нахождения Y в транзакции, в которой имеются элементы называется достоверностью (confidence). Процент транзакций, содержащих правило, от общего числа транзакций называется поддержкой (support). Применительно к анализу смертности поиск ассоциативных правил помогает ответить на вопрос: существуют ли такие заболевания, которые распространены преимущественно только в пределах одного района. Так как число возможных болезней составляет несколько тысяч, а районов в Новокузнецке шесть, то “вручную” перебрать все комбинации очень проблематично. В данном случае транзакцией будет являться факт смерти (одна запись в базе данных). Каждая транзакция содержит только два элемента: диагноз смерти и район, в котором проживал умерший. Всего таких транзакций в базе данных будет 84 795. Исследования проводились в программе Deductor Studio Academic (версия 5.2). Значение поддержки установлены в интервале от 0,1 до 20%, значение достоверности лежит в интервале от 80 до 100 %. Полученные результаты представлены в таблице 4. Таблица 4 Результаты, полученные поиском ассоциативных правил
Полученные результаты можно интерпретировать следующим образом: 92,84% всех зарегистрированных случаев закупорки и стеноза передней мозговой артерии приходится на Заводской район г. Новокузнецка; 80,50% всех зарегистрированных случаев злокачественного новообразования средней доли бронхов или легкого зарегистрировано в Заводском районе; 80% всех случаев ишемической кардиомиопатии зарегистрировано в Орджоникидзевском районе. Полученные результаты переданы главному патологоанатому г. Новокузнецка для выявления причин данной ситуации. Выводы:
Заключение. Россия переживает демографический кризис на длительном отрезке времени. Катастрофически сокращается численность населения, наблюдается высокий уровень смертности. В Концепции демографической политики Российской Федерации на период до 2025 г., утвержденной в октябре 2007 г. предусмотрены меры, направленные на увеличение продолжительности жизни населения, сокращение уровня смертности. [3, стр. 24-25, 4, стр. 58]. Позитивное влияние на устранение критической ситуации оказывают и Национальные проекты [7, стр.103] По результатам данного исследования невозможно не обратить внимания на то, что при углубленном анализе смертности с выходом на нозологии явно проявляются предотвратимые причины преждевременной смертности населения, в особенности, трудоспособного возраста, связанные с алкоголизмом, наркоманией, травматизмом. Это говорит о том, что недостаточно принимать меры только медицинского характера, жизненно необходимы действенные социальные меры. Список литературы
Жилина Наталья Михайловна, e-mail: This e-mail address is being protected from spam bots, you need JavaScript enabled to view it Views: 24169
Write Comment
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Last Updated ( Wednesday, 12 August 2009 ) |
< Prev | Next > |
---|