О журнале Издательская этика Редколлегия Редакционный совет Редакция Для авторов Контакты
Russian

Экспорт новостей

Журнал в базах данных

eLIBRARY.RU - НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА



crossref.org
vak.ed.gov.ru/vak

GoogleАкадемия

Google Scholar

Главная arrow Архив номеров arrow №6 2015 (46) arrow ЦЕНТРЫ ЗДОРОВЬЯ: ТЕХНОЛОГИЯ ОБРАБОТКИ БОЛЬШИХ ОБЪЁМОВ ДАННЫХ ПРОФИЛАКТИЧЕСКОГО СКРИНИНГА
ЦЕНТРЫ ЗДОРОВЬЯ: ТЕХНОЛОГИЯ ОБРАБОТКИ БОЛЬШИХ ОБЪЁМОВ ДАННЫХ ПРОФИЛАКТИЧЕСКОГО СКРИНИНГА Печать
22.12.2015 г.

Руднев С.Г.1,2, Николаев Д.В.1,3, Коростылёв К.А.1,3, Старунова О.А.1,3, Щелыкалина С.П.1,4, Ерюкова Т.А.1,3, Колесников В.А.1,3, Стародубов В.И.1
1
ФГБУ Центральный научно-исследовательский институт организации и информатизации здравоохранения Минздрава России, Москва
2
ФГБУН Институт вычислительной математики РАН, Москва
3
АО НТЦ «Медасс», Москва
4ГБОУ ВПО РНИМУ им. Н.И. Пирогова, Москва

HEALTH CENTRES: TECHNOLOGY TO PROCESS MASS DATA ON PREVENTIVE SCREENING
Rudnev S.G.
1,2, Nikolaev D.V.1,3, Korostylev K.A.1,3, Starunova O.A.1,3, Shchelykalina S.P.1,3, Eryukova T.A.1,3, Kolesnikov V.A.1,3, Starodubov V.I.1
1
Federal Research Institute for Health Organization and Informatics of Ministry of Health of the Russian Federation, Moscow
2Institute of Numerical Mathematics of the Russian Academy of Sciences, Moscow
3“Medas” Scientific Research Centre, Moscow
4Pirogov Russian National Research Medical University, Moscow

Контактная информация: Руднев Сергей Геннадьевич, e-mail: Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script

Contacts: Sergey G. Rudnev, e-mail: Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script

Статья подготовлена в рамках проекта Российского научного фонда «Разработка методологии популяционного скрининга физического развития, состояния здоровья и питания населения России. Оценка эпидемиологических рисков» (грант №14-15-01085).

This article was prepared under the framework of the Russian Science Foundation project ‘Development of methodology for population screening of physical growth and development, state of health and nutrition. Assessment of epidemiological risks’ (grant no. 14-15-01085).

Резюме. Актуальность темы. Национальная сеть центров здоровья представляет собой сложную распределённую систему, которая в постоянном режиме, начиная с 2010 года, генерирует массовые данные профилактического скрининга. Ручной анализ качества и достоверности данных, собираемых в центрах здоровья, не представляется возможным, а отчётная документация центров в ряде случаев может не отражать реального положения дел. Необходима разработка автоматизированных алгоритмов контроля качества и повышения достоверности данных профилактического скрининга.

Цель исследования – реализация элементов технологии больших данных для анализа результатов профилактического скрининга в центрах здоровья на примере методики биоимпедансометрии, ретроспективная оценка качества и достоверности данных, характеристика возможностей их использования для эпидемиологического мониторинга.

Материал и методы. Объединяли данные биоимпедансометрии из Федерального информационного ресурса центров здоровья с данными центров здоровья за 2010-2012 гг., полученными по письму Минздрава России №14-1/10/2-3200 от 24 октября 2012 года, а также с данными за 2013-2015 гг., полученными по письму ЦНИИОИЗ Минздрава России №7-5/434 от 2 июля 2015 года. Общее количество записей с результатами измерений составило 2,35 млн. Данные были получены из 320 центров здоровья, относящихся к 62 субъектам Российской Федерации и восьми федеральным округам.

Результаты. В половине центров здоровья качество применения методики биоимпедансометрии было 93,5% или выше. Вместе с тем, суммарная доля некорректных данных постоянно росла, и в 2014-м году составляла 28,1%. В структуре некорректных данных преобладали подделки (50,6%) и методические погрешности (48,5%). Количество записей в базе после удаления некорректных данных и результатов повторных измерений составило 1,64 млн. На основе расчёта параметров распределений значений индекса массы тела с использованием пакета программ GAMLSS получены оценки распространённости избыточной массы тела, ожирения и истощения по критериям ВОЗ среди обследованных лиц мужского пола в зависимости от возраста. Стандартизованные оценки распространённости ожирения у мальчиков 5-17 лет составили 11,0%, а у мужчин 18-85 лет – 17,7%.

Обсуждение. Применение технологии больших данных позволило оценить качество и выявить структуру некорректных данных биоимпедансометрии. Это даёт возможность принятия управляющих решений с целью коррекции выявленных нарушений. Результаты сравнения с независимыми антропометрическими данными свидетельствуют о репрезентативности данных центров здоровья для детей и подростков.

Выводы. 

  1. На примере анализа массива данных биоимпедансометрии показано, что качество и достоверность первичных данных профилактического скрининга в центрах здоровья постоянно снижались. Это свидетельствует о недостаточной эффективности применяемых мер контроля.
  2. Эффективное управление качеством работы центров здоровья возможно на основе использования технологии больших данных.
  3. В результате применения критериев отбора данные Федерального информационного ресурса центров здоровья могут быть пригодны для эпидемиологического мониторинга.

Ключевые слова. Центры здоровья; Федеральный информационный ресурс центров здоровья; профилактический скрининг; большие данные; поиск и удаление подделок; сжатие данных; стандартизация данных.

Abstract. Significance. The national network of Health Centers is a complex distributed system that continuously, since 2010, generates mass data on preventive screening. Manual analysis of quality and reliability of the data collected in Health Centers is not possible, while official reporting of Health Centers may not, in some cases, reflect the real situation. So it is necessary to develop automated algorithms for quality control and enhancement of reliability of preventive screening data.

The purpose of the study was to implement elements of the big data technology for analyzing results of preventive screening in Health Centers exemplified by the bioimpedance measurement data, retrospectively evaluate quality and reliability of data, and explore their applicability for epidemiological monitoring.

Materials and methods. Bioimpedance data from the Federal Information Resource of Health Centers database was combined with the submitted data of bioimpedance measurements according to the letter by the Ministry of Health of the Russian Federation #14-1/10/2-3200 as of October 24, 2012, as well as with the submitted data according to the letter by the Federal Research Institute for Health Organization and Informatics of the Russian Health Ministry #7-5/434 as of July 2, 2015. The initial number of records in the bioimpedance database was 2.35 million. The data were obtained from 320 Health Centers in 62 Federal Subjects and eight Federal Districts of the Russian Federation.

Results. In half of the Health Centers the quality of bioimpedance data was 93.5% or higher. However, the proportion of incorrect data grew steadily reaching 28.1% in 2014. The incorrect data consisted mainly of frauds (50.6%) and measurement errors (48.5%). The number of records in the database after removal of incorrect data and repeated measurements equaled to 1.64 million. Based on calculated parameters of the distributions of body mass index using the software package GAMLSS, the prevalence of overweight, obesity and wasting in the study group was estimated among males according to the WHO criteria. The age-standardized obesity prevalence in males was 11.0% at the age of 5-17 years, and 17.7% at the age of 18-85 years.

Discussion. The use of big data technology allowed us to evaluate quality of data and to identify incorrect data of bioimpedance measurements. This offers an opportunity for taking managerial decisions to correct the identified violations. Results of the comparison with independent anthropometric data show representativeness of the Health Centers’ data for children and adolescents.

Conclusions. 1) Based on bioimpedance data, our mass data analysis showed that quality and accuracy of the raw data on preventive screening in Health Centers was gradually decreasing. This suggests ineffectiveness of control measures.

2) Effective quality management of Health Centers’ activities is possible through the use of big data technology.

3) Data of the Federal Information Resource of Health Centers may be suitable for epidemiological monitoring upon application of the selection criteria.

Keywords. Health Centers; Federal Information Resource of Health Centers; preventive screening; big data; frauds detection and removal; data compression; data standardization.

Введение

Ведущей причиной преждевременной смертности населения России являются хронические неинфекционные заболевания [14], а основная роль в снижении смертности отводится профилактике [2]. С целью укрепления и развития профилактического направления медицины в 2009-2010 гг. в России была создана национальная сеть центров здоровья, и одновременно разработано специализированное программное обеспечение центров здоровья для автоматизации сбора и обработки данных [3]. В настоящее время Федеральный информационный ресурс центров здоровья (ФИР ЦЗ) является единственным в России источником массовых первичных данных профилактического скрининга. По состоянию на май 2015 года, ФИР ЦЗ содержал результаты комплексного обследования 3,72 млн человек [12].

Как уже отмечалось [12], существующий порядок финансирования центров здоровья из расчёта планируемой посещаемости противоречит интересам качества собираемых данных: в условиях недостаточного потока пациентов это может приводить к попыткам фальсификации данных и, как следствие, к несравнимости данных из разных центров здоровья и регионов. Наличие неконтролируемых объёмов некорректных данных косвенно подтверждается отсутствием публикаций по изучению взаимосвязей результатов проводимого скрининга с данными заболеваемости и смертности, несмотря на обилие информации из центров здоровья о распространённости факторов риска (см., например, [1,5,9]).

Отличительным аспектом организации работы центров здоровья является комплексное применение инструментальных диагностических методов, таких как антропометрия, спирометрия, дисперсионное картирование сердца, ангиологический скрининг, пульсоксиметрия, биохимический анализ крови и некоторые другие [9]. Грамотное их использование требует наличия определённых навыков. Недостаточная обученность персонала (например, в условиях высокой ротации кадров) может служить дополнительным источником некорректных данных.

Ручной анализ достоверности и качества данных, собираемых в центрах здоровья, при существующих объёмах информации не представляется возможным. В таких ситуациях оправдано применение методов машинного обучения, позволяющих «во многих местах, где раньше требовалась работа экспертов, обойтись без них» [11]. Значительный объём и разнообразие информации, генерируемой в центрах здоровья, являются признаками больших данных.

Под большими данными понимается набор методов, алгоритмов и технологий обработки больших и сверхбольших постоянно растущих массивов структурированных и неструктурированных данных, требующих высокоскоростной обработки, для получения воспринимаемых результатов [25]. К методам анализа, применимым к большим данным, относят машинное обучение, имитационное моделирование, распознавание образов, пространственный, статистический анализ и визуализацию данных, прогнозную аналитику и другие. Базовыми возможностями технологий больших данных в различных областях приложений являются повышение эффективности индустрий и снижение затрат, выявление недостоверных данных и противодействие мошенничеству, упрощение описания, ускорение обработки данных, и другие [4,7,11].

Одним из методов диагностики состояния пациентов в центрах здоровья является биоимпедансный анализ (биоимпедансометрия). На основе измерений роста, веса и электрического сопротивления (импеданса) тела биоимпедансный анализ позволяет оценить состояние белкового, жирового, водного и основного обменов, выявить риски заболеваний [8,19]. Сегодня биоимпедансометрия – это наиболее распространённый метод скрининговой оценки состава тела и нутритивного статуса. Метод нашёл применение в популяционных исследованиях здоровья населения различных стран мира, таких как Бразилия [29], Великобритания [18,26], страны Евросоюза [28], Китай [15], США [22] и Южная Корея [24]. Формулы для биоимпедансной оценки состава тела верифицированы с использованием эталонных методов (см., например, [16,20,23]).

Цель исследования: реализация элементов технологии больших данных для анализа результатов профилактического скрининга в центрах здоровья на примере методики биоимпедансометрии, ретроспективная оценка достоверности и качества данных, характеристика возможностей их использования для эпидемиологического мониторинга.

Материал и методы

Для проведения исследования были объединены три источника данных биоимпедансных измерений в центрах здоровья: ФИР ЦЗ [12], информация за 2010-2012 гг., полученная по письму Минздрава России №14-1/10/2-3200 от 24 октября 2012 года [10], а также информация за 2013-2015 гг., полученная по письму ЦНИИОИЗ МЗ РФ №7-5/434 от 2 июля 2015 года. Данные ФИР ЦЗ представляли собой базу sql. Данные биоимпедансных измерений за 2010-2012 и 2013-2015 гг. имели вид таблиц csv, полученных из структурированных исходных данных в форматах разработчика fmd и fmd2 с использованием программы-конвертера (автор В.А. Колесников). Для хранения и обработки данных использовалась серверная система R-IT DataMill с объёмом дисковой памяти 24 Тб и установленными ОС Microsoft Windows Server Standard 2012R2 и СУБД Microsoft SQL Svr Standard 2014.

Для обеспечения сопоставимости данных при использовании единых критериев отбора рассматривались только результаты измерений одним типом биоимпедансного оборудования: анализаторами состава тела АВС-01 «Медасс» (АО НТЦ Медасс, г. Москва), которыми оснащены примерно половина центров здоровья.

В процессе объединения данных удаляли дубликаты измерений путём попарного сравнения баз при одновременном совпадении пола, даты рождения, даты обследования пациента, а также значений активного (R50) и реактивного (Xc50) сопротивлений с точностью до одного знака после запятой.

В результате удаления дубликатов общее количество записей с результатами измерений анализаторами АВС-01 «Медасс» за 2010-2015 годы составило 2,35 млн. Объединённые данные хранились в денормализованном виде в формате csv. Информация была получена из 320 центров здоровья, относящихся к 62 субъектам Российской Федерации и восьми федеральным округам. (Данные по Крымскому федеральному округу временно отсутствовали.)

Рис.1
Рис. 1. Относительный вклад различных источников данных биоимпедансометрии в общий размер выборки

На рис. 1 показано распределение данных по различным источникам. Можно видеть, что объединение информации, содержащейся в ФИР ЦЗ, с данными, полученными из центров здоровья непосредственно, привело к увеличению объёма выборки в 2,5 раза. (Анализ современного состояния ФИР ЦЗ и возможных путей совершенствования системы сбора данных содержится в работе [12].)

Рост пациентов в центрах здоровья определяли электронным или обычным ростомером с дискретностью измерений 1 мм, а массу тела (МТ) – на электронных или механических весах с дискретностью измерений 100 грамм. Индекс массы тела (ИМТ) вычисляли как отношение массы тела к квадрату длины тела (кг/м2). Биоимпедансное обследование проводили по стандартной схеме в положении пациентов лёжа на спине с одноразовыми биоадгезивными электродами на запястье и голеностопе [8]. Измеряли значения активного (R50) и реактивного (Xc50) сопротивлений при частоте тока 50 кГц. Фазовый угол импеданса рассчитывали в градусах как арктангенс отношения реактивного и активного сопротивлений, умноженный на 180°/π.

Тощую массу тела (ТМ) детей и подростков вычисляли по формуле Л. Хауткупер [20], а взрослых людей – через определение объёма воды в организме (ОВО) по формулам Р. Кушнера и Д. Шоллера [23] с учётом предположения о постоянстве относительной гидратации тощей массы. Жировую массу тела (ЖМТ) вычисляли как разность между МТ и ТМ, а процентное содержание жира в массе тела (%ЖМТ) – как (ЖМТ/МТ)×100%.

К полученным данным применяли элементы технологии больших данных, включая формирование критериев отбора, поиск и удаление некорректных данных, сжатие, анализ и визуализацию, стандартизацию данных. Рассматривали следующие типы некорректных данных биоимпедансометрии: ошибки ввода данных, методические погрешности, фальсификаты данных (табл. 1).

Таблица 1

Классификация типов некорректных данных биоимпедансометрии в центрах здоровья и критерии отбора

№ пп
Критерий исключения
Комментарий интерпретация
1. Ошибки ввода данных
1.1 Возраст < 3 лет или > 100 лет Ограничение возрастного диапазона
1.2 Рост < 60 см или > 200 см (для женщин) или > 220 см (для мужчин) Недопустимое значение роста
1.3 Масса тела < 10 кг или > 200 кг Недопустимое значение массы тела
1.4 ИМТ < 12 кг/м2 или > 60 кг/м2 Недопустимое значение ИМТ
2. Методические погрешности
2.1 R50 < 300 Ом или R50 > 1000 Ом Недопустимое значение активного сопротивления
2.2 Xс50 < 20 Ом или Xс50 > 150 Ом Недопустимое значение реактивного сопротивления
2.3 Фазовый угол <3° или >10,2°∂ Недопустимое значение фазового угла импеданса
2.4 Тощая масса ≥ Масса тела Недопустимое значение тощей массы
2.5 %ЖМТ ≤ 1,5% Недопустимое значение %ЖМТ
2.6 Необычные пики распределений значений Xc50 (для отдельных центров здоровья) Влияние окружающих предметов на результат измерений вследствие неправильной организации рабочего места
3. Фальсификаты данных
3.1 (R50 = 555,5 Ом и Xc50 = 55,5 Ом) или (R50 = 444,4 Ом и Xc50 = 44,4 Ом) Программная эмуляция измерения
3.2 R50 между 387 и 391 Ом и Xc50 между 37 и 48 Ом Измерение шаблона (эквивалентной электрической схемы)
3.3 Необычные пики распределений значений R50 (для отдельных центров здоровья) Измерение шаблона, измерение одного человека под видом разных

Приведённые в табл. 1 критерии исключения близки к использованным в работе [10]. Основные изменения (пп. 2.6 и 3.3) были связаны с организацией визуального контроля формы распределений значений R50 и Xc50 для центров здоровья, представленных в ФИР ЦЗ и в базе 2010-2012 гг.

В процессе выявления некорректных данных оказалось, что некоторые записи результатов измерений относились и ко второму, и к третьему типу некорректных данных одновременно. В связи с этим далее методической погрешностью считали те ошибки 2 типа, которые не являлись ошибками 3 типа (подделками).

Общее количество некорректных данных составило 0,5 млн записей. Оценивали структуру некорректных данных в зависимости от пола, возраста, географии обследованных и года обследования.

Помимо удаления некорректных данных для имитации поперечного дизайна исследования в каждой из объединяемых баз были удалены результаты повторных измерений пациента за исключением последнего по времени. Доля повторных измерений в базах 2010-2012 и 2013-2015 гг. составила 6,5% и 6,3% соответственно, а в базе ФИР ЦЗ – 14,5%. Различия были связаны с тем, что в первых двух источниках информации присутствовали более короткие временные ряды данных по сравнению с базой ФИР ЦЗ.

После удаления некорректных данных и результатов повторных измерений итоговый размер выборки составил 1,64 млн человек, из них 1,09 млн лиц женского и 0,55 млн – мужского пола. Количество удалённых записей составило 30,3% от исходного размера выборки.

Этап сжатия данных иллюстрировали построением центильных таблиц для ИМТ на основе моделей GAMLSS [13,27]. Расчёты проводили в среде MS Excel с установленным расширением RExcel с использованием макроса на языке R (автор О.А. Старунова), осуществляющего вызов процедур из пакета GAMLSS. Для характеристики репрезентативности данных полученные центильные таблицы сопоставляли с результатами массового обследования детей и подростков в школах Ростовской области.

Построенные центильные таблицы использовали для оценки распространённости избыточной массы тела, ожирения и истощения среди обследованных в центрах здоровья лиц мужского пола по критериям ВОЗ. Данные стандартизовали с использованием демографической пирамиды России.

Результаты

В табл. 2 показано распределение количества исходных записей с результатами биоимпедансометрии (n=2 350 079) по федеральным округам и годам обследования. Наибольшее количество данных (48,5%) было получено из Центрального федерального округа, при этом данные за 2015 год оказались представлены мало. Далее следовали Приволжский (19,7%), Сибирский (9,2%) и Северо-Западный (8,1%) федеральные округа.

Таблица 2

Распределение исходного количества данных биоимпедансометрии по федеральным округам России и годам обследования

Федеральный округ 2010 2011 2012 2013 2014 2015 Всего
Дальневосточный 9 652 30 783 28 661 22 643 18 873 1 463 112 075
Приволжский 43 936 124 110 93 206 68 150 97 829 34 719 461 950
Северо-Западный 23 526 49 088 40 809 28 870 31 121 16 877 190 291
Северо-Кавказский 1 442 15 249 19 731 11 455 12 016 7 031 66 924
Сибирский 29 062 55 624 57 957 29 481 39 187 5 479 216 790
Уральский 1 009 7 386 22 118 16 571 20 773 13 258 81 115
Центральный 93 947 287 719 325 054 221 964 185 023 24 910 1 138 617
Южный 3 222 12 364 16 970 17 024 19 304 13 433 82 317
Итого 205 796 582 323 604 506 416 158 424 126 117 170 2 350 079

В половине из 305 диагностируемых центров здоровья с количеством измерений не менее чем 100 качество данных биоимпедансометрии было высоким: доля корректных данных составила 93,5% или выше (рис. 2 слева). Вместе с тем, наблюдался кратный рост процентной доли некорректных данных: с 11,2% в 2010-м до 28,1% в 2014-м году (увеличение в 2,5 раза), см. рис. 2 справа.

Рис.2
Рис. 2. Слева – качество данных биоимпедансометрии в центрах здоровья, справа – динамика процентной доли некорректных данных по федеральным округам

Количество некорректных данных за 2010-2015 гг. составило 0,5 млн, или 21,3% от исходного количества записей (табл. 3). В структуре некорректных данных преобладали подделки (10,8% от общего количества записей) и методические погрешности (10,3%). Доля обнаруженных ошибок ввода данных была минимальной (0,2%).

Таблица 3

Структура некорректных данных биоимпедансометрии в центрах здоровья

Тип некорректных данных Количество некорректных данных
Абс. % от общего
к-ва записей
Ошибки ввода данных 4 677 0,2%
Методические погрешности 242 125 10,3%
Подделки 252 672 10,8%
Всего 499 474 21,3%

Доля методических ошибок за рассматриваемый период выросла в 1,9 раза: с 10% до 18,8%. В 2015-м году максимальная доля таких ошибок определялась в Южном (47,7%), Северо-Западном (28,8%) и Сибирском (21,2%) федеральных округах (рис. 3 слева). Резко увеличилась процентная доля подделок: с 1,0% в 2010-м до 15,9% в 2014-м году за счёт ухудшения показателей Центрального и Дальневосточного федеральных округов. Наблюдаемый низкий процент подделок в Центральном федеральном округе и России в целом в 2015-м году объяснялся отсутствием данных по Москве, где за предшествующий период процентная доля фальсификатов постоянно росла, и в 2014-м году составила 38,2% от общего количества представленных данных.

Рис.3
Рис. 3. Динамика процентной доли некорректных данных биоимпедансометрии в центрах здоровья по федеральным округам: слева – методические ошибки, справа – подделки 

Рис.4
Рис. 4. Половозрастная структура процентной доли некорректных данных (слева) и плотности распределения количества обследованных лиц мужского и женского пола в зависимости от возраста (справа)

Доля некорректных данных для детей и подростков была выше, чем для взрослых людей (рис. 4 слева). В равной степени это объяснялось увеличением доли фальсификатов и методических погрешностей (данные не показаны). Последнее может отражать менее внимательное отношение персонала центров здоровья к соблюдению методики измерений в условиях обследования больших организованных групп (школьных коллективов).

У взрослых людей во всех возрастных группах доля некорректных данных для женщин была меньше, чем для мужчин (в среднем 18% и 21%). Вероятно, это связано с более высокой мотивацией женской части популяции к получению объективной информации о своём здоровье. Минимальная доля ошибок (16-17%) наблюдалась в подгруппе женщин 55-65 лет, которая характеризовалась наибольшей распространённостью ожирения и высоким сердечно-сосудистым риском.

Рис.5
Рис. 5. Процентные доли методических ошибок (слева) и подделок (справа) для различных центров здоровья в зависимости от общего числа измерений. Справа от пунктирных линий показаны центры здоровья с количеством некорректных данных свыше 1000 и 5000 соответственно

На рис. 5 слева показана диаграмма рассеяния процентной доли методических ошибок, допущенных при проведении биоимпедансного обследования в центрах здоровья, в зависимости от количества измерений. Точки на диаграмме соответствуют отдельным центрам здоровья. В 26 из 305 центров здоровья не менее чем каждое второе измерение было выполнено с ошибкой, а в 57 (18,6% центров) доля ошибок была выше 20%. В 22-х центрах здоровья более 50% записей результатов измерений оказались подделками (рис. 5 справа). В 14 из них наблюдалась массовая фальсификация данных: свыше 50% подделок при общем количестве записей от 10 тыс. до 46,2 тыс. Справа от красных пунктирных линий на рис. 5 показаны центры здоровья с количеством некорректных данных свыше 1000 и 5000 соответственно.

На рис. 6 и 7 представлено распределение по субъектам Российской Федерации абсолютного и относительного (в процентах от численности населения региона) количества обследованных по методике биоимпедансометрии в центрах здоровья после удаления некорректных данных и результатов повторных измерений, а в табл. 4 показано распределение данных по регионам и годам обследования.

Рис.6
Рис. 6. Количество обследованных по методике биоимпедансометрии в центрах здоровья с использованием анализаторов АВС-01 «Медасс» в различных субъектах Российской Федерации (после удаления некорректных данных и результатов повторных измерений)

Рис.7
Рис. 7. Процент обследованных по методике биоимпедансометрии в центрах здоровья с использованием анализаторов АВС-01 «Медасс» в различных субъектах Российской Федерации (после удаления некорректных данных и результатов повторных измерений)

Таблица 4

Распределение количества обследованных анализаторами АВС-01 «Медасс» в центрах здоровья после удаления некорректных данных и результатов повторных измерений по регионам и годам обследования

Федеральный округ, регион 2010 2011 2012 2013 2014 2015 Всего
ДВФО 8215 23897 22038 16999 12210 1425 84784
Амурская область 3027 15190 10641 0 0 0 28858
Магаданская область 0 0 69 2179 2102 1239 5589
Республика Саха (Якутия) 0 0 0 832 188 186 1206
Сахалинская область 4782 4060 8496 3619 2100 0 23057
Хабаровский край 406 4647 2832 10369 7820 0 26074
ПФО 34543 90973 76066 56296 85222 30631 373731
Нижегородская область 0 18 1349 384 462 86 2299
Пензенская область 1227 7218 6869 6087 9990 6619 38010
Пермский край 3990 10642 12291 3704 5094 44 35765
Республика Башкортостан 0 0 1710 4332 4471 1162 11675
Республика Марий Эл 2891 5214 5020 1780 4500 2659 22064
Республика Мордовия 1100 2700 2609 0 0 0 6409
Самарская область 64 900 431 134 143 44 1716
Саратовская область 19229 32911 22381 14351 36149 19515 144536
Ульяновская область 1691 874 359 1748 1769 376 6817
Чувашская республика 4351 30496 23047 23776 22644 126 104440
СЗФО 19510 39419 31167 20955 23078 11655 145784
Архангельская область 0 1307 2216 1084 3717 1375 9699
Вологодская область 272 1181 859 1002 750 366 4430
Ленинградская область 1721 1781 799 0 0 0 4301
Мурманская область 28 3277 3754 1641 1338 580 10618
Ненецкий автономный округ 0 42 28 145 246 122 583
Новгородская область 3370 7541 4013 4680 5986 2947 28537
Республика Карелия 0 0 0 0 542 0 542
Санкт-Петербург 14119 24290 19498 12403 10499 6265 87074
СКФО 1115 12624 16482 10104 8116 5906 54347
Республика Дагестан 1053 648 2083 0 0 0 3784
Республика Ингушетия 0 114 596 1 0 0 711
Республика Кабардино-Балкария 0 132 176 0 815 863 1986
Республика Северная Осетия-Алания 62 852 576 0 0 0 1490
Ставропольский край 0 10878 13051 10103 7301 5043 46376
СФО 25286 41502 43767 21871 24808 4258 161492
Алтайский край 4414 11444 13573 7286 6929 3825 47471
Забайкальский край 0 2038 2583 0 0 0 4621
Иркутская область 36 3025 3487 1228 799 422 8997
Кемеровская область 605 3255 4161 4343 4897 0 17261
Новосибирская область 0 0 0 1039 1079 0 2118
Омская область 20211 21261 19807 7919 10553 0 79751
Республика Алтай 20 479 156 0 0 0 655
Республика Бурятия 0 0 0 0 82 0 82
Томская область 0 0 0 56 469 11 536
УрФО 472 5152 16737 11826 15925 11848 61960
Курганская область 352 580 283 891 4233 1760 8099
Свердловская область 0 0 1 1034 1244 1651 3930
Тюменская область 20 386 729 309 2704 1972 6120
Ханты-Мансийский автономный округ-Югра 8 2749 13535 8639 7358 5275 37564
Ямало-Ненецкий автономный округ 92 1437 2189 953 386 1190 6247
ЦФО 74882 193944 200118 111264 107582 16396 704186
Белгородская область 3324 11729 12882 3718 3020 0 34673
Брянская область 3325 9803 5119 460 1733 752 21192
Владимирская область 98 4244 2586 1208 187 0 8323
Воронежская область 133 6800 7433 13273 4598 4674 36911
Калужская область 19 282 290 243 81 56 971
Костромская область 10662 12957 11328 5275 4953 3136 48311
Москва 43071 127694 141695 76004 82133 155 470752
Московская область 0 570 53 0 0 0 623
Орловская область 12 1473 1180 0 0 0 2665
Рязанская область 281 40 107 39 85 90 642
Смоленская область 26 1376 453 0 0 0 1855
Тамбовская область 3862 1702 1750 0 0 0 7314
Тверская область 1336 1770 1653 0 0 0 4759
Тульская область 7323 11584 12036 10261 10015 7059 58278
Ярославская область 1410 1920 1553 783 777 474 6917
ЮФО 2367 8805 11120 10821 11556 6827 51496
Астраханская область 0 1584 1166 0 0 0 2750
Волгоградская область 1855 6959 7112 5190 5860 3221 30197
Краснодарский край 379 262 2828 3348 2407 2138 11362
Республика Калмыкия 0 0 14 2283 3289 1468 7054
Ростовская область 133 0 0 0 0 0 133
Общий итог 166390 416316 417495 260136 288497 88946 1637780

Следующим этапом реализации технологии больших данных, после применения критериев отбора, является сжатие данных с целью повышения их доступности для получения содержательных выводов. Традиционным способом сжатия данных при определении популяционных характеристик физического развития, особенностей распределений морфологических и физиологических параметров является построение центильных таблиц на основе LMS-метода или его модификаций [17,21]. Для расчёта центильных таблиц применяется различное программное обеспечение, в том числе реализованное в пакете программ R на основе моделей GAMLSS [13,27].

В качестве примера использования моделей GAMLSS в табл. 5 приведён фрагмент результатов таких расчётов: сглаженные значения параметров BCT-распределений и центилей ИМТ для детей и подростков 5-17 лет мужского пола, обследованных в центрах здоровья по методике биоимпедансометрии в 2010-2015 году.

Таблица 5

Медиана (M), коэффициент вариации (S), асимметрия (L), эксцесс (T) и центили ИМТ для детей и подростков 5-17 лет, мальчики. Данные биоимпедансного обследования в центрах здоровья, 2010-2015 гг.

Возраст, лет n M S L T Центили
3-й 10-й 25-й 50-й 75-й 90-й 97-й
5 2118 15,12 0,112 -2,21 217,4 12,7 13,3 14,1 15,1 16,4 18,0 20,1
6 9142 15,57 0,123 -2,12 190,0 12,9 13,6 14,4 15,6 17,1 18,9 21,5
7 17557 16,03 0,134 -2,04 168,5 13,1 13,8 14,8 16,0 17,7 19,8 22,9
8 18621 16,51 0,144 -1,97 151,7 13,3 14,1 15,1 16,5 18,4 20,8 24,4
9 18001 17,03 0,152 -1,90 137,8 13,5 14,4 15,5 17,0 19,1 21,8 25,9
10 20155 17,55 0,159 -1,84 126,3 13,8 14,8 15,9 17,6 19,8 22,7 27,2
11 19996 18,10 0,163 -1,79 116,4 14,1 15,1 16,4 18,1 20,5 23,6 28,4
12 19818 18,63 0,165 -1,74 108,1 14,5 15,5 16,8 18,6 21,1 24,3 29,3
13 18406 19,17 0,164 -1,69 100,6 14,9 16,0 17,3 19,2 21,7 24,9 29,9
14 22585 19,69 0,162 -1,65 94,2 15,3 16,5 17,8 19,7 22,2 25,4 30,2
15 22513 20,21 0,158 -1,60 88,4 15,8 16,9 18,3 20,2 22,7 25,9 30,4
16 27075 20,69 0,154 -1,56 83,3 16,3 17,4 18,8 20,7 23,2 26,2 30,6
17 23490 21,15 0,149 -1,52 78,7 16,7 17,9 19,3 21,1 23,6 26,6 30,7

Рис.8
Рис. 8. Зависимость от возраста и пола 3-го, 10-го, 25-го, 50-го, 75-го, 90-го и 97-го центилей ИМТ у мальчиков и девочек 7-17 лет: синие сплошные линии – по данным центров здоровья (n=440 988); чёрные пунктирные линии – по данным антропометрического обследования школьников Ростовской области (n=81 751). Красные сплошные и пунктирные линии – медианы для референтных групп ВОЗ и IOTF соответственно (см. [10], приложение 7)

Сравнение центильных кривых на рис. 8 показывает, что распределения значений ИМТ у детей и подростков 7-17 лет, прошедших биоимпедансное обследование в центрах здоровья в 2010-2015 году (n=440 988), были близки к таковым в группе детей и подростков, массово обследованных в школах Ростовской области [6]. Это свидетельствует о перспективности использования данных профилактического скрининга, получаемых в центрах здоровья (после применения критериев отбора) в качестве референтных данных для российских детей и подростков. Вместе с тем, видны отличия отечественных данных от референтных данных ВОЗ и IOTF, наиболее выраженные у мальчиков (см. также [6,10]), что указывает на актуальность разработки и внедрения в практику здравоохранения национальных стандартов физического развития.

Оценки параметров распределений значений признаков можно использовать для расчёта распространённости нарушений нутритивного статуса и рисков заболеваний по существующим критериям. Для этого достаточно преобразовать пороговые критерии диагностики в значения центилей относительно референтной группы центров здоровья соответствующего пола и возраста [10].

Рис.9
Рис. 9. Распространённость избыточной массы тела, ожирения и истощения среди обследованных в 2010-2015 гг. в центрах здоровья лиц мужского пола 5-85 лет по критериям ВОЗ в зависимости от возраста (n=549026)

На рис. 9 показаны оценки распространённости избыточной массы тела, ожирения и истощения в зависимости от возраста по критериям ВОЗ среди лиц мужского пола, обследованных в центрах здоровья по методике биоимпедансометрии в 2010-2015 гг. Распространённость ожирения была минимальной в возрасте 19 лет (4,1%), и максимальной в возрасте 63 лет (27,9%). Отмечалась значительная распространённость ожирения среди детей 7-10 лет (14-15%). Истощение среди мужчин практически не наблюдалось, но было выявлено у детей и подростков (рис. 9 справа). Тяжёлую форму истощения имели 0,4% обследованных мальчиков.

Стандартизация применяется в популяционных исследованиях для обеспечения сравнимости данных. Вариантом стандартизации при объединении возрастных групп является использование демографической пирамиды – возрастных распределений численности мужского и женского населения. При использовании усреднённой демографической пирамиды России за 2010-2014 гг., стандартизованные значения распространённости избыточной массы тела и ожирения по критериям ВОЗ среди мальчиков 5-17 лет составили 30,2% и 11,0% соответственно, а среди мужчин 18-85 лет – 56,9% и 17,7% соответственно.

Обсуждение

Национальная сеть центров здоровья является важным элементом системы медицинской профилактики, а Федеральный информационный ресурс центров здоровья служит единственным источником массовых данных профилактического скрининга в России. Ручной анализ качества и достоверности таких данных ввиду большого объёма информации невозможен, а периодические проверки отчётной документации центров со стороны контролирующих организаций оказываются дорогостоящими и малоэффективными. В работе реализованы элементы технологии больших данных для анализа результатов профилактического скрининга в центрах здоровья на примере методики биоимпедансометрии.

Применение технологии больших данных на этапе фильтрации данных выявило кратный рост процентной доли некорректных данных биоимпедансометрии (с 11,2% в 2010-м до 28,1% в 2014 году) и высокий уровень неоднородности указанного показателя в зависимости от центра здоровья, региона и года обследования. Количество обнаруженных некорректных данных составило 499 474 записей из 2 350 079. Некорректные данные практически в равных долях представляли собой подделки (50,6%) или методические ошибки (48,5%).

В центрах здоровья с большим количеством сфальсифицированных данных целесообразно провести анализ обоснованности бюджетных трат и соответствия реального потока пациентов заявленным показателям.

Руководителям ЛПУ тех центров здоровья, где доля методических погрешностей при проведении биоимпедансометрии достаточно велика, может быть рекомендовано принятие мер для обучения персонала методике обследования. Региональные руководители здравоохранения и организаторы обучающих семинаров могут также использовать информацию такого рода для целевого обучения специалистов центров здоровья с последующим объективным контролем качества.

Представляет интерес анализ структуры некорректных данных для других типов биоимпедансного оборудования и методов диагностики, используемых в центрах здоровья.

Процедура сжатия данных биоимпедансометрии путём расчёта параметров распределений значений признаков в зависимости от возраста и пола позволяет, экономя память и время компьютера, оценивать распространённость нарушений нутритивного статуса и рисков заболеваний. Коэффициент сжатия данных при построении центильных таблиц составил порядка 5000. В качестве примера сжатых данных приведён фрагмент центильной таблицы для ИМТ у мальчиков.

О репрезентативности полученных данных свидетельствуют результаты сравнения с данными скринингового обследования 81,8 тыс. детей 7-17 лет в школах Ростовской области [6], что объясняется сравнительно массовым характером обследования детей в центрах здоровья. Вопрос о возможности использования информации из центров здоровья для эпидемиологического мониторинга взрослого трудоспособного населения в настоящее время неясен и требует отдельного изучения, в том числе ввиду сравнительно низкой посещаемости центров данной категорией граждан. Одним из возможных решений является включение центров здоровья в программу первого этапа диспансеризации взрослого населения [12].

Построенные центильные таблицы для ИМТ использованы для расчёта стандартизованных оценок распространённости избыточной массы тела и ожирения в отдельных возрастных группах. Сравнительно высокие показатели для мальчиков 5-17 лет (30,2% и 11,0% соответственно) объясняются высоким процентом московских детей в рассматриваемой выборке. Уточнение оценок возможно на основе расчёта центильных таблиц для отдельных регионов России и последующей стандартизации с учётом региональной изменчивости численности и возрастной структуры населения.

Отметим, что элементы технологии больших данных были реализованы в нашем исследовании только за счёт вертикального масштабирования – увеличения мощности вычислительной техники и объёма памяти. При нарастании скорости потока и общего объёма данных профилактического скрининга могут возникнуть проблемы хранения и обработки данных, которые потребуют других решений.

Возможности биоимпедансометрии для характеристики состава тела, нутритивного статуса и эпидемиологических рисков в сравнении с антропометрией более широки. Для этого используются оценки абсолютных и относительных значений жировой, тощей, скелетно-мышечной и активной клеточной массы, фазового угла импеданса и другие показатели [8,10]. Наряду с приведёнными примерами изучения половозрастных особенностей, полученные данные можно использовать для анализа временных трендов, региональных и международных сравнений, для сравнительной оценки физического развития и состава тела профессиональных и этнических групп.

Одним из недостатков базы данных ФИР ЦЗ является то, что в ней не фиксируется текущая информация о наступлении значимых событий (заболеваний и исходов). Прямое уточнение существующих и формирование новых шкал риска с учётом региональных и иных особенностей в этих условиях недоступно. Возможности эпидемиологического мониторинга на базе центров здоровья могут возрасти при включении медицинской информационной системы центров здоровья (МИС ПК ЦЗ) в структуру единой государственной информационной системы в сфере здравоохранения (ЕГИСЗ) [12].

Результаты проведённого ретроспективного анализа показывают актуальность создания автоматизированной системы мониторинга качества и достоверности первичных данных профилактического скрининга в центрах здоровья. Необходимым условием этого является повышение статуса ФИР ЦЗ, принятие решения на уровне Минздрава России о возобновлении государственной поддержки ФИР ЦЗ и обязательности предоставления данных. Новым принципом организации работы ФИР ЦЗ должно стать применение технологии больших данных.

Выводы

  1. На примере анализа массива данных биоимпедансометрии показано, что качество и достоверность первичных данных профилактического скрининга в центрах здоровья постоянно снижались. Это свидетельствует о недостаточной эффективности применяемых мер контроля.
  2. Эффективное управление качеством работы центров здоровья возможно на основе использования технологии больших данных.
  3. В результате применения критериев отбора данные ФИР ЦЗ могут быть пригодны для эпидемиологического мониторинга.

Благодарности

Работа выполнена в ФГБУ «ЦНИИОИЗ» Минздрава России при поддержке Российского научного фонда (грант № 14-15-01085, рук. В.И. Стародубов).

Библиография

  1. Автоматизированная система мониторинга ФГБУ «ЦНИИОИЗ» Минздрава России. URL: http://asmms.mednet.ru (Дата обращения 19 августа 2015).
  2. Бойцов С.А., Чучалин А.Г., Арутюнов Г.П., Биличенко Т.Н., Бубнова М.Г., Ипатов П.В. и др. Профилактика хронических неинфекционных заболеваний: рекомендации. Москва: ГНИЦ профилактической медицины МЗ РФ; 2013. 138 с.
  3. Госконтракты №К-29-Т/341 от 06.11.2009 г., №К-29-Т/105 от 23.09.2010 г., №019500000212000144-0132259-02 от 25.10.2012 г.
  4. Исаев Е.А., Корнилов В.В. Проблема обработки и хранения больших объёмов научных данных и подходы к её решению. Математическая биология и биоинформатика 2013; 8 (1): 49-65.
  5. Кобякова О.С., Старовойтова Е.А., Куликов Е.С., Кириллова Н.А., Деев И.А., Бойков В.А., и др. Модель посетителя центров здоровья Томской области и распространённость основных факторов риска хронических неинфекционных заболеваний среди посетителей центров здоровья. Здравоохранение Российской Федерации 2014; 58 (1): 16-19.
  6. Кульба С.Н., Войнов В.Б., Пожарская Е.Н., Глумов А.Г., Гапоненко М.В., Соколова Е.Е., Лобанова И.Ю. Особенности индекса массы тела у школьников Ростовской области. Валеология 2014; 4: 62-69.
  7. Майер-Шенбергер В., Кукьер К. Большие данные. Революция, которая изменит то, как мы живём, работаем и мыслим. Москва: Манн, Иванов и Фербер; 2014. 240 с.
  8. Николаев Д.В., Смирнов А.В., Бобринская И.Г., Руднев С.Г. Биоимпедансный анализ состава тела человека. Москва: Наука; 2009. 392 с.
  9. Погосова Н.В., Вергазова Э.К., Аушева А.К., Суворов С.С., Бойцов С.А. Центры здоровья: достигнутые результаты и перспективы. Профилактическая медицина 2014; 17 (4): 16-24.
  10. Руднев С.Г., Соболева Н.П., Стерликов С.А., Николаев Д.В., Старунова О.А., Черных С.П. и др. Биоимпедансное исследование состава тела населения России. Москва: РИО ЦНИИОИЗ; 2014. 493 с.
  11. Смирнов Н. Большие данные: когда машина лучше эксперта. Директор информационной службы 2014; (12): 24. URL: http://www.osp.ru/cio/2014/12/13044348/ (Дата обращения 26 октября 2015).
  12. Стародубов В.И., Руднев С.Г., Николаев Д.В., Коростылёв К.А. Федеральный информационный ресурс центров здоровья: современное состояние и перспективы развития. Социальные аспекты здоровья населения [электронный научный журнал] 2015; 45 (5). URL: http://vestnik.mednet.ru/content/view/706/27/lang,ru/ (Дата обращения 26 октября 2015).
  13. Старунова О.А. Создание программной среды для статистической обработки данных биоимпедансных измерений. Сборник статей молодых учёных факультета ВМК МГУ 2011; (8): 130-135.
  14. Шальнова С.А., Деев А.Д. Тенденции смертности в России в начале XXI века (по данным официальной статистики). Кардиоваскулярная терапия и профилактика 2011; 10 (6): 5-10.
  15. Chen Z., Chen J., Collins R., Guo Y., Peto R., Wu F. et al. China Kadoorie Biobank of 0.5 million people: survey methods, baseline characteristics and long-term follow-up. Int. J. Epidemiol. 2011; 40 (6): 1-15.
  16. Clasey J.L., Bradley K.D., Bradley J.W., Long D.E., Griffith J.R. A new BIA equation estimating the body composition of young children. Obesity 2011; 19 (9): 1813-1817.
  17. De Onis M., Onyango A.W., Borghi E., Siyam A., Nishida C., Siekmann J. Development of a WHO growth reference for school-aged children and adolescents. Bull. WHO 2007; 85 (9): 660-667.
  18. Franssen F.M.E., Rutten E.P.A., Groenen M.T.J., Vanfleteren L.E., Wouters E.F.M., Spruit M.A. New reference values for body composition by bioelectrical impedance analysis in the general population: results from the UK Biobank. J. Am. Med. Dir. Assoc. 2014; 15 (6): e1-448.e6.
  19. Grimnes S., Martinsen O. Bioimpedance and bioelectricity basics, 3rd ed. London: Academic Press; 2014. 584 p.
  20. Houtkooper L.B., Going S.B., Lohman T.G., Roche A.F., Van Loan M. Bioelectrical impedance estimation of fat-free body mass in children and youth: a cross-validation study. J. Appl. Physiol. 1992; 72 (1): 366-373.
  21. Jackson L.V., Thalange N.K.S., Cole T.J. Blood pressure centiles for Great Britain. Arch. Dis. Child. 2007; 92 (4): 298-303.
  22. Janssen I., Heymsfield S.B., Ross R. Low relative skeletal muscle mass (sarcopenia) in older persons is associated with functional impairment and physical disability. J. Am. Ger. Soc. 2002; 50 (5): 889-896.
  23. Kushner R.F., Schoeller D.A. Estimation of total body water by bioelectrical impedance analysis. Am. J. Clin. Nutr. 1986; 44 (3): 417-424.
  24. Kwon H.-J., Ha Y.-C., Park H.-M. The reference value of skeletal muscle mass index for defining the sarcopenia of women in Korea. J. Bone Metab. 2015; 22 (2): 71-75.
  25. Manyika J., Chui M., Brown B., Bughin J., Dobbs R., Roxburgh C., Byers A.H. Big data: the next frontier for innovation, competition, and productivity. McKinsey Global Institute; 2011. 156 p. URL: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation (Дата обращения 30 октября 2015).
  26. Nightingdale C.M., Rudnicka A.R., Owen C.G., Cook D.G., Whincup P.H. Patterns of body size and adiposity among UK children of South Asian, black African-Caribbean and white European origin: Child Heart And health Study in England (CHASE Study). Int. J. Epidemiol. 2011; 40 (1): 33-44.
  27. Stasinopoulos D.M., Rigby R.A. Generalized additive models for location scale and shape (GAMLSS) in R. J. Stat. Software 2007; 23 (7): 1-46.
  28. Verdich C., Barbe P., Petersen M., Grau K., Ward L., Macdonald I. et al. Changes in body composition during weight loss in obese subjects in the NUGENOB study: comparison of bioelectrical impedance vs. dual-energy X-ray absorptiometry. Diabetes Metab. 2011; 37 (3): 222-229.
  29. Victora C.G., Barros F.C., Lima R.C., Behague D.P., Gonçalves H., Horta B.L., Gigante D.P., Vaughan J.P. The Pelotas birth cohort study, Rio Grande do Sul, Brazil, 1982-2001. Cad. Saúde Pública 2003; 19 (5): 1241-1256.

References

  1. Avtomatizirovannaya sistema monitoringa FGBU «TsNIIOIZ» Minzdrava Rossii. [Automated system for monitoring of the Federal Research Institute for Health Organization and Informatics of Ministry of Health of the Russian Federation]. [Online] [cited 2015 Aug 19]. Available from: http://asmms.mednet.ru (In Russian).
  2. Boytsov S.A., Chuchalin A.G., Arutyunov G.P., Bilichenko T.N., Bubnova M.G., Ipatov P.V., et al. Profilaktika khronicheskikh neinfektsionnykh zabolevaniy: rekomendatsii. [Prevention of chronic non-communicable diseases: the recommendations]. Moscow: GNITs profilakticheskoy meditsiny MZ RF; 2013. 138 p. (In Russian).
  3. Goskontrakty №K-29-T/341 ot 06.11.2009 g., №K-29-T/105 ot 23.09.2010 g., №019500000212000144-0132259-02 ot 25.10.2012 g. [State contracts no. К-29-Т/341 of November 6, 2009, no. К-29-Т/105 of September 23, 2010, and no. 019500000212000144-0132259-02 of October 25, 2012]. (In Russian).
  4. Isaev E.A., Kornilov V.V. Problema obrabotki i khraneniya bol'shikh ob"emov nauchnykh dannykh i podkhody k ee resheniyu. [The problem of processing and storage of large amounts of scientific data and approaches to its solution]. Matematicheskaya biologiya i bioinformatika 2013; 8 (1): 49-65. (In Russian).
  5. Kobyakova O.S., Starovoytova E.A., Kulikov E.S., Kirillova N.A., Deev I.A., Boykov V.A., et al. Model' posetitelya tsentrov zdorov'ya Tomskoy oblasti i rasprostranennost' osnovnykh faktorov riska khronicheskikh neinfektsionnykh zabolevaniy sredi posetiteley tsentrov zdorov'ya. [The model of a visitor of health centers of Tomsk region and the prevalence of main risk factors of chronic non-communicable diseases in visitors of health centers]. Zdravookhranenie Rossiyskoy Federatsii 2014; 58 (1): 16-19. (In Russian).
  6. Kul'ba S.N., Voynov V.B., Pozharskaya E.N., Glumov A.G., Gaponenko M.V., Sokolova E.E.,, et al. Osobennosti indeksa massy tela u shkol'nikov Rostovskoy oblasti [The features of body mass index in schoolchildren of Rostov region]. Valeologiya 2014; 4: 62-69. (In Russian).
  7. Mayer-Shönberger V, Cukier K. Big data: revolution that will transform how we live, work, and think [Transl. from Eng]. Moscow: Mann, Ivanov i Ferber; 2014. 240 p. (In Russian).
  8. Nikolaev D.V., Smirnov A.V., Bobrinskaya I.G., Rudnev S.G. Bioimpedansnyy analiz sostava tela cheloveka [Bioimpedance analysis of human body composition]. Moscow: Nauka; 2009. 392 p. (in Russian).
  9. Pogosova N.V., Vergazova E.K., Ausheva A.K., Suvorov S.S., Boytsov S.A. Tsentry zdorov'ya: dostignutye rezul'taty i perspektivy. [Health centers: achieved results and prospects]. Profilakticheskaya meditsina 2014; 17 (4): 16-24. (In Russian).
  10. Rudnev S.G., Soboleva N.P., Sterlikov S.A., Nikolaev D.V., Starunova O.A., Chernykh S.P., et al. Bioimpedansnoe issledovanie sostava tela naseleniya Rossii [Bioimpedance study of body composition in the Russian population]. Moscow: RIO TsNIIOIZ; 2014. 493 p. (In Russian).
  11. Smirnov N. Bol'shie dannye: kogda mashina luchshe eksperta. [Big data: when the computer is better than expert]. Direktor informatsionnoy sluzhby [serial online] 2014 [cited 2015 Oct 26]; (12): 24. Available from: http://www.osp.ru/cio/2014/12/13044348/ (In Russian).
  12. Starodubov V.I., Rudnev S.G., Nikolaev D.V., Korostylev K.A. Federal'nyy informatsionnyy resurs tsentrov zdorov'ya: sovremennoe sostoyanie i perspektivy razvitiya [Federal information resource of health centers: current state and developmental perspectives]. Sotsial'nye aspekty zdorov'ya naseleniya [serial online] 2015 [cited 2015 Oct 26]; 45 (5). Available from: http://vestnik.mednet.ru/content/view/706/27/lang,ru/ (In Russian).
  13. Starunova O.A. Sozdanie programmnoy sredy dlya statisticheskoy obrabotki dannykh bioimpedansnykh izmereniy. [Creating a software environment for statistical data processing of bioimpedance measurements]. Sbornik statey molodykh uchenykh fakul'teta VMK MGU 2011; (8): 130-135. (In Russian).
  14. Shal'nova S.A., Deev A.D. Tendentsii smertnosti v Rossii v nachale XXI veka (po dannym ofitsial'noy statistiki) [Russian mortality trends in the early XXI century: official statistics data]. Kardiovaskulyarnaya terapiya i profilaktika 2011; 10 (6): 5-10. (In Russian).
  15. Chen Z, Chen J, Collins R, Guo Y, Peto R, Wu F, et al. China Kadoorie Biobank of 0.5 million people: survey methods, baseline characteristics and long-term follow-up. Int J Epidemiol 2011; 40 (6): 1-15.
  16. Clasey JL, Bradley KD, Bradley JW, Long DE, Griffith JR. A new BIA equation estimating the body composition of young children. Obesity 2011; 19 (9): 1813-1817.
  17. De Onis M, Onyango AW, Borghi E, Siyam A, Nishida C, Siekmann J. Development of a WHO growth reference for school-aged children and adolescents. Bull WHO 2007; 85 (9): 660-667.
  18. Franssen FME, Rutten EPA, Groenen MTJ, Vanfleteren LE, Wouters EFM, Spruit MA. New reference values for body composition by bioelectrical impedance analysis in the general population: results from the UK Biobank. J Am Med Dir Assoc 2014; 15 (6): e1-448.e6.
  19. Grimnes S, Martinsen O. Bioimpedance and bioelectricity basics, 3rd ed. London: Academic Press; 2014. 584 p.
  20. Houtkooper LB, Going SB, Lohman TG, Roche AF, Van Loan M. Bioelectrical impedance estimation of fat-free body mass in children and youth: a cross-validation study. J Appl Physiol 1992; 72 (1): 366-373.
  21. Jackson LV, Thalange NKS, Cole TJ. Blood pressure centiles for Great Britain. Arch Dis Child 2007; 92 (4): 298-303.
  22. Janssen I, Heymsfield SB, Ross R. Low relative skeletal muscle mass (sarcopenia) in older persons is associated with functional impairment and physical disability. J Am Ger Soc 2002; 50 (5): 889-896.
  23. Kushner RF, Schoeller DA. Estimation of total body water by bioelectrical impedance analysis. Am J Clin Nutr 1986; 44 (3): 417-424.
  24. Kwon H-J, Ha Y-C, Park H-M. The reference value of skeletal muscle mass index for defining the sarcopenia of women in Korea. J Bone Metab 2015; 22 (2): 71-75.
  25. Manyika J, Chui M, Brown B, Bughin J, Dobbs R, Roxburgh C, et al. Big data: the next frontier for innovation, competition, and productivity. McKinsey Global Institute; 2011. 156 p. Available at: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation/
  26. Nightingdale CM, Rudnicka AR, Owen CG, Cook DG, Whincup PH. Patterns of body size and adiposity among UK children of South Asian, black African-Caribbean and white European origin: Child Heart And health Study in England (CHASE Study). Int J Epidemiol 2011; 40 (1): 33-44.
  27. Stasinopoulos DM, Rigby RA. Generalized additive models for location scale and shape (GAMLSS) in R. J Stat Software 2007; 23 (7): 1-46.
  28. Verdich C, Barbe P, Petersen M, Grau K, Ward L, Macdonald I, et al. Changes in body composition during weight loss in obese subjects in the NUGENOB study: comparison of bioelectrical impedance vs. dual-energy X-ray absorptiometry. Diabetes Metab 2011; 37 (3): 222-229.
  29. Victora CG, Barros FC, Lima RC, Behague DP, Gonçalves H, Horta BL, et al. The Pelotas birth cohort study, Rio Grande do Sul, Brazil, 1982-2001. Cad Saúde Pública 2003; 19 (5): 1241-1256.

Просмотров: 13071

Ваш комментарий будет первым

Добавить комментарий
  • Пожалуйста оставляйте комментарии только по теме.
  • Вы можете оставить свой комментарий любым браузером кроме Internet Explorer старше 6.0
Имя:
E-mail
Комментарий:

Код:* Code

Последнее обновление ( 13.01.2016 г. )
След. »
home contact search contact search