ОСОБЕННОСТИ РАБОТЫ С ДАННЫМИ, ХАРАКТЕРИЗУЮЩИМИ ЗДОРОВЬЕ НАСЕЛЕНИЯ: ЗАПОЛНЕНИЕ ПРОПУСКОВ В ДАННЫХ |
30.03.2020 г. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.21045/2071-5021-2020-66-1-12
Аладышкина А.С., Лакшина В.В., Леонова Л.А., Максимов А.Г. Резюме Актуальность. В ряде случаев базы данных показателей, использующихся как для исследований в области здравоохранения, так и для решения различных социально-экономических задач, содержат существенное количество пропущенных значений. Для повышения эффективности работы с такими базами возникает необходимость заполнения пропусков в данных. Эта необходимость обусловлена потерей информации при простом игнорировании пропущенных значений и возможностью получения в этом случае смещенных и несостоятельных результатов. Цель исследования: оценить применимость алгоритма MICE (multivariate imputation by chained equations) для восстановления пропущенных значений в приложении к данным, релевантным задаче исследования зависимости предложения труда от показателей здоровья населения. Материал и методы. Исследование проводилось на основе данных RLMS HSE. Для восстановления пропущенных значений был применен алгоритм MICE, основанный на использовании метода Монте-Карло по схеме марковской цепи для получения апостериорных распределений переменных, содержащих пропуски. Результаты. Проведенный анализ показал наличие существенной доли пропусков в значениях выбранных переменных, включающих в себя показатели здоровья и социально-экономические характеристики респондентов. Произведено восстановление пропущенных значений переменных алгоритмом MICE, результаты работы алгоритма проверены на сходимость. Получены эмпирические оценки плотностей и функций вероятности для восстановленных данных. В качестве примера восстановленные данные применены для оценки параметров пространственной панельной регрессии, для каждого параметра по правилу Рубина рассчитаны стандартные ошибки с учетом проведенной импутации, а также доля дисперсии из-за пропусков в данных. Область применения результатов. Путем применения алгоритмов заполнения пропусков может быть повышена эффективность использования показателей, представленных в различных базах данных. Ключевые слова: заполнение пропусков в данных; самооценка здоровья; предложение труда.
Контактная информация: Аладышкина Анна Сергеевна, email:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
Для цитирования: Аладышкина А.С., Лакшина В.В., Леонова Л.А., Максимов А.Г. Особенности работы с данными, характеризующими здоровье населения: заполнение пропусков в данных. Социальные аспекты здоровья населения [сетевое издание] 2020; 66(1):12. URL: http://vestnik.mednet.ru/content/view/1139/30/lang,ru/ DOI: 10.21045/2071-5021-2020-66-1-12
WORKING WITH DATA ON POPULATION HEALTH: IMPUTATION Abstract Significance. In some cases, the databases of the indicators, used both for health research and for solving various socio-economic problems, contain a significant amount of missing values. To increase the efficiency of working with such data, it becomes necessary to impute the missing values without changing statistical characteristics of the data. This is caused by the loss of a large amount of information when simply ignoring the missing values and even obtaining biased and inconsistent results. Purpose: to evaluate applicability of MICE (multivariate imputation by chained equations) algorithm for imputing the missing values in the data relevant to the task of studying the relation between labor supply and population health indicators. Material and Methods. The study was conducted on the basis of the RLMS HSE database. To restore the missing values, the MICE algorithm, based on Markov chains Monte Carlo method was used to obtain posterior distributions of variables containing missing values. Results. The analysis showed a significant proportion of missing values in the selected variables, including both health indicators and various socio-economic characteristics of the respondents. The missing values were restored by the MICE algorithm and its results were tested for convergence. Empirical estimates of the densities and probability functions for the imputed data are obtained. As an example, the imputed data was used to estimate the parameters of the spatial panel regression; for each parameter standard errors, which according to the Rubin rule take into account the imputation performed, as well as the proportion of variance due to missing values were calculated. Conclusion. By applying imputation algorithms the problem of missing values can be solved and the efficiency of using indicators presented in various databases can be improved. Keywords: imputation; self-rated health; labor supply.
Corresponding author: Anna S. Aladyshkina, e-mail:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
DOI: 10.21045/2071-5021-2020-66-1-12 ОСОБЕННОСТИ РАБОТЫ С ДАННЫМИ, ХАРАКТЕРИЗУЮЩИМИ ЗДОРОВЬЕ НАСЕЛЕНИЯ: ЗАПОЛНЕНИЕ ПРОПУСКОВ В ДАННЫХ Аладышкина А.С., Лакшина В.В., Леонова Л.А., Максимов А.Г. Национальный исследовательский университет «Высшая школа экономики», Нижний Новгород, Россия Резюме Актуальность. В ряде случаев базы данных показателей, использующихся как для исследований в области здравоохранения, так и для решения различных социально-экономических задач, содержат существенное количество пропущенных значений. Для повышения эффективности работы с такими базами возникает необходимость заполнения пропусков в данных. Эта необходимость обусловлена потерей информации при простом игнорировании пропущенных значений и возможностью получения в этом случае смещенных и несостоятельных результатов. Цель исследования: оценить применимость алгоритма MICE (multivariate imputation by chained equations) для восстановления пропущенных значений в приложении к данным, релевантным задаче исследования зависимости предложения труда от показателей здоровья населения. Материал и методы. Исследование проводилось на основе данных RLMS HSE. Для восстановления пропущенных значений был применен алгоритм MICE, основанный на использовании метода Монте-Карло по схеме марковской цепи для получения апостериорных распределений переменных, содержащих пропуски. Результаты. Проведенный анализ показал наличие существенной доли пропусков в значениях выбранных переменных, включающих в себя показатели здоровья и социально-экономические характеристики респондентов. Произведено восстановление пропущенных значений переменных алгоритмом MICE, результаты работы алгоритма проверены на сходимость. Получены эмпирические оценки плотностей и функций вероятности для восстановленных данных. В качестве примера восстановленные данные применены для оценки параметров пространственной панельной регрессии, для каждого параметра по правилу Рубина рассчитаны стандартные ошибки с учетом проведенной импутации, а также доля дисперсии из-за пропусков в данных. Область применения результатов. Путем применения алгоритмов заполнения пропусков может быть повышена эффективность использования показателей, представленных в различных базах данных. Ключевые слова: заполнение пропусков в данных; самооценка здоровья; предложение труда.
Контактная информация: Аладышкина Анна Сергеевна, email:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
WORKING WITH DATA ON POPULATION HEALTH: IMPUTATION Abstract Significance. In some cases, the databases of the indicators, used both for health research and for solving various socio-economic problems, contain a significant amount of missing values. To increase the efficiency of working with such data, it becomes necessary to impute the missing values without changing statistical characteristics of the data. This is caused by the loss of a large amount of information when simply ignoring the missing values and even obtaining biased and inconsistent results. Purpose: to evaluate applicability of MICE (multivariate imputation by chained equations) algorithm for imputing the missing values in the data relevant to the task of studying the relation between labor supply and population health indicators. Material and Methods. The study was conducted on the basis of the RLMS HSE database. To restore the missing values, the MICE algorithm, based on Markov chains Monte Carlo method was used to obtain posterior distributions of variables containing missing values. Results. The analysis showed a significant proportion of missing values in the selected variables, including both health indicators and various socio-economic characteristics of the respondents. The missing values were restored by the MICE algorithm and its results were tested for convergence. Empirical estimates of the densities and probability functions for the imputed data are obtained. As an example, the imputed data was used to estimate the parameters of the spatial panel regression; for each parameter standard errors, which according to the Rubin rule take into account the imputation performed, as well as the proportion of variance due to missing values were calculated. Conclusion. By applying imputation algorithms the problem of missing values can be solved and the efficiency of using indicators presented in various databases can be improved. Keywords: imputation; self-rated health; labor supply.
Corresponding author: Anna S. Aladyshkina, e-mail:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
Введение В настоящее время при проведении исследований в сфере медицины всё больше возрастает потребность в статистической обработке данных, связанных со здоровьем [1,2]. Растущее внимание к данному виду анализа продиктовано, в том числе, потребностью в анализе социально-экономических процессов и явлений, которые могут определяться уровнем здоровья индивидов. В частности, актуальной задачей исследования рынка труда является анализ влияния здоровья индивидов на объем предложения труда [3–5], так как при ухудшении здоровья потенциальное количество часов, которые готов посвятить работе индивид, будет сокращаться. Предложение труда может быть проанализировано с использованием микроданных, полученных на основании опросов населения, включающих, в том числе, различные показатели здоровья населения, такие как самооценка здоровья и возможные детерминанты здоровья (количество потребляемого алкоголя, индекс массы тела, курение, занятия спортом и др.) [6–9]. Как правило, подобные данные, собираемые посредством интервью, характеризуются большим количеством пропусков. Для эффективной работы с ними возникает необходимость заполнения пропусков в данных, поскольку простое отбрасывание наблюдений, содержащих пропущенные значения, может привести к изменению статистических характеристик выборки [10]. Действительно, пусть имеется набор наблюдений за N объектами, имеющими L характеристик каждый. Этот набор можно представить в виде матрицы размера N×L. Пусть Pi – доля пропущенных данных для i-той характеристики во всех наблюдениях. Тогда количество наблюдений, исключаемых из анализа, при простом отбрасывании наблюдений, содержащих пропуски значений, находится в интервале [Max(Pi, i=1,…,L); Min(1,ΣL1Pi). При достаточно большом количестве характеристик происходит потеря значительной доли наблюдений, что приводит к существенному снижению точности (увеличению дисперсий) оценок параметров, получаемых с использованием такого набора. Кроме того, если пропуски не случайны, а связаны со значениями пропущенных переменных или другими характеристиками наблюдений, то оценки могут оказаться не только смещенными, но и несостоятельными. Восстановление пропусков в данных, или импутация (от англ. imputation) широко применяется в исследованиях в области биологии [11,12], медицины [12-15], образования [16], политологии [17], экономики [18-20] и др. В настоящей работе рассмотрено заполнение пропусков в данных на примере подготовки данных для моделирования зависимости предложения труда от показателей здоровья населения. Различают несколько типов пропусков данных в зависимости от их происхождения [10]: MCAR (missing completely at random, совершенно случайные пропуски), MAR (missing at random, случайные пропуски) и MNAR (missing not at random, неслучайные пропуски). Тип MNAR отличается от первых двух тем, что распределение пропусков зависит от самих пропущенных значений. Тип MCAR подразумевает, что пропущенные значения составляют случайную выборку из анализируемого набора данных. Пропущенные значения типа MAR не зависят от пропусков в других переменных, но могут коррелировать с имеющимися данными. В настоящее время практика статистического тестирования типов пропусков данных ещё не сложилась. Тем не менее, существует ряд методов (например, межгрупповых корреляций, условных гистограмм и др.), позволяющих определить, к какому из двух типов, MCAR или MAR, относятся пропуски в данных. Проверка на наличие MNAR-пропусков и учет такого типа пропусков в эконометрической модели требует дополнительного исследования [10]. В настоящей работе мы предполагаем отсутствие MNAR-пропусков и наличие MCAR- и MAR-пропусков в данных. В рамках исследования проведено восстановление пропущенных значений алгоритмом многомерного заполнения с помощью сцепленных уравнений MICE (от англ. multivariate imputation by chained equations), реализованным на языке программирования R [21]. Согласно этому алгоритму, предсказательная модель для j-ой переменной строится с использованием модели для (j-1)-ой переменной, т.е. предсказательные модели строятся последовательно, образуя цепочку. Проведённый анализ научной литературы показал, что подобные исследования на российских данных не проводились. Целью работы является оценка применимости алгоритма MICE для восстановления пропущенных значений на примере подготовки данных для последующего исследования зависимости предложения труда от показателей здоровья населения. Материал и методы Одной из баз данных, предоставляющих информацию о самооценках здоровья индивида, является Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ (RLMS HSE), проводимый Национальным исследовательским университетом «Высшая школа экономики» и ООО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины в г. Чапел-Хилл и Института социологии Федерального научно-исследовательского социологического центра РАН [22]. RLMS HSE – практически единственное в России репрезентативное социально-экономическое обследование домохозяйств, охватывающее значительный промежуток времени, что предоставляет возможности не только статического, но и динамического анализа. В контексте поставленной задачи подготовки данных для моделирования зависимости предложения труда от показателей здоровья населения база данных RLMS HSE является источником информации о социально-экономическом статусе респондентов, самооценке здоровья и средней продолжительности рабочей недели. Выборка включает в себя данные RLMS HSE с 2008 по 2017 гг., т.е. волны с 17 по 25. Существуют разные методы заполнения пропусков в данных, такие как заполнение средними значениями, метод ближайшего соседа, регрессионное моделирование пропусков, EM-алгоритм и др. (подробнее см. в [23,24]). Алгоритм MICE использует метод Монте-Карло по схеме марковской цепи для получения апостериорных распределений вероятностей для переменных, содержащих пропуски. Используемый метод относится к методам множественного заполнения пропусков и охватывает случаи, когда в наборе данных содержится несколько переменных с пропущенными значениями. Общая схема алгоритма MICE содержит три этапа. На первом этапе с помощью метода Монте-Карло генерируются m марковских цепей, представляющих собой наборы данных того же размера, что и исходный набор, но без пропусков. На втором этапе на каждом i-ом из m сгенерированных наборов данных оценивается k×1 вектор параметров требуемой модели Q. На третьем этапе выполняется объединение полученных оценок параметров и вычисляется их дисперсия. В [25] показано, что дисперсия оцененных параметров, условная на наблюдаемые данные, представима в виде суммы внутригрупповой (within group) и межгрупповой (between group) дисперсии: где E[·] – оператор математического ожидания, V[·] – оператор дисперсии, – -ый элемент вектора , содержащего оценки параметров; Yobs – наблюдаемые данные; Ymis – пропущенные наблюдения; Wl – внутригрупповая дисперсия , рассчитываемая по формуле
где Ul,i – дисперсия , рассчитанная на i-том наборе данных; Bl – межгрупповая дисперсия , рассчитываемая по формуле
где – оценка параметра Ql, рассчитанная на i-том наборе данных, . Тогда полная дисперсия l-го параметра Tl вычисляется по правилу Рубина [25]: При этом – это дисперсия, обусловленная получением оценок с помощью симуляций. На основании полной дисперсии можно рассчитать ряд показателей качества заполнения пропусков в данных для l-го параметра, например, долю дисперсии из-за пропусков в данных λl и относительное увеличение дисперсии из-за пропусков в данных rl [10]: На основе базы данных RLMS HSE, принимая во внимание задачу исследования влияния здоровья на предложение труда, были собраны данные по 17 показателям. Соответствующие переменные включали в себя социально-демографические характеристики (возраст, пол, уровень образования, регион проживания, статус места жительства, семейное положение, количество детей) и информацию о физиологическом и эмоциональном состоянии респондентов (индекс массы тела, самооценка здоровья, наличие вредных привычек, уровень удовлетворенности жизнью и работой). Социально-экономический статус респондентов характеризовался логарифмом среднегодового дохода. В рамках поставленной задачи выборка была ограничена респондентами в возрасте от 15 до 72 лет. В выборку вошли только те респонденты, которые участвовали во всех опросах за указанный период – 2263 человека. Таким образом, всего рассматривалось 22630 наблюдений. Собранные данные содержали значительное количество пропусков. Доля пропусков в общем количестве наблюдений составила 12,1%. При этом шесть переменных из 17 не содержали пропусков. Для переменных с пропусками процентное соотношение количества пропущенных значений к общему числу наблюдений представлено в табл. 1. Подробное описание переменных содержится в Приложении 1. Таблица 1 Процентное соотношение количества пропущенных значений к количеству наблюдений для рассматриваемых переменных
Источник: расчеты авторов по данным RLMS-HSE Пропуски отсутствовали в переменных возраст, пол, регион проживания, тип населенного пункта и двух переменных, характеризующих качество экологической обстановки (выбросы в атмосферу загрязняющих веществ, отходящих от стационарных источников, и объем загрязненных сточных вод). Для проверки наличия MAR-пропусков была рассчитана межгрупповая корреляция для всех переменных, содержащих пропуски [26]. При этом для группировки данных использовались качественные переменные: федеральный округ, уровень образования, удовлетворенность работой, удовлетворенность жизнью, самооценка здоровья, курение, семейное положение. Попарные межгрупповые корреляции для переменных, содержащих пропуски в данных, представлены в табл. 2. Таблица 2
Попарные межгрупповые корреляции
Источник: расчеты авторов по данным RLMS-HSE Как следует из табл.2, значимая межгрупповая корреляция между переменными отсутствовала. Это позволяет сделать вывод, что в исследуемых данных пропуски не зависят от наблюдаемых данных. Другим способом проверки пропусков на принадлежность к типу MAR является анализ условных гистограмм. Пусть имеется переменная , содержащая пропуски. Наличие пропусков в ней служит условием для построения гистограмм для другой, вспомогательной переменной, назовем ее . Для переменной строятся две гистограммы: первая – для тех значений, для которых значение переменной известно, вторая – для тех ее значений, для которых значение переменной пропущено. Если гистограммы отличаются, то можно предположить, что пропуски в не являются совершенно случайными и, возможно, зависят от наблюдаемых значений других переменных, в частности Алгоритм MICE позволяет выбирать разные способы восстановления данных для каждой переменной. Для количественных переменных выбран алгоритм сопоставления на основе предсказанного среднего (predictive mean matching), для качественных – логистическая регрессия для бинарных переменных (logistic regression) и модель пропорциональных коэффициентов (proportional odds model) для мультиномиальных переменных. Результаты Для визуализации пропусков в данных по каждой из переменных применялись матрицы пропусков. Матрица пропусков представляет собой сводную таблицу долей или количеств пропусков для сгруппированных данных – например, в соответствии с годом наблюдения и местом проживания респондента. За весь выбранный временной период с 2008 по 2017 гг. данные были доступны для семи федеральных округов (Северо-Кавказский округ был выделен из состава Южного в 2010 году), поэтому данные в матрицах пропусков были сгруппированы в семь столбцов, соответствующих определенному федеральному округу (с 2010 года данные для Южного и Северо-Кавказского федерального округов были объединены и рассматривались под маской Южного федерального округа). Матрица пропусков для переменной «самооценка здоровья индивида» представлена в табл. 3. Таблица 3 Матрица пропусков для самооценок здоровья индивида (количество пропусков в данных в зависимости от года наблюдения и федерального округа)
Источник: расчеты авторов по данным RLMS-HSE Как видно из табл. 3, наибольшее количество пропусков для переменной «самооценка здоровья индивида» присутствует для респондентов Приволжского федерального округа. В табл. 4 и 5 представлены матрицы пропусков для данных о частоте употребления алкогольных напитков в течение последних 30 дней (табл. 4) и средней продолжительности рабочей недели (табл. 5). Таблица 4 Матрица пропусков для переменной «частота употребления алкогольных напитков в течение последних 30 дней» (доля пропусков в данных в зависимости от года наблюдения и федерального округа)
Источник: расчеты авторов по данным RLMS-HSE Таблица 5 Матрица пропусков для переменной «средняя продолжительность рабочей недели» (доля пропусков в данных в зависимости от года наблюдения и федерального округа)
Источник: расчеты авторов по данным RLMS-HSE Наибольшее количество пропусков в данных о частоте употребления алкогольных напитков в течение последних 30 дней и средней продолжительности рабочей недели наблюдалось для Южного федерального округа. Рассмотрим проверку наличия пропусков типа MAR в значениях переменной «частота употребления алкогольных напитков в течение последних 30 дней» ( ), в качестве вспомогательной переменной ( ) используем переменную «средняя продолжительность рабочей недели». На рис. 1 изображена условная гистограмма для переменной «средняя продолжительность рабочей недели» при условии отсутствия и наличия пропусков в переменной «употребление алкоголя». Распределение продолжительности рабочей недели не зависело от наличия пропусков в переменной, показывающей частоту употребления алкогольных напитков. При этом условные средние значения продолжительности рабочей недели для обеих подгрупп оказались близки.
Источник: расчеты авторов по данным RLMS-HSE Сравнение средних, условных на количество пропусков в некоторых других переменных, показано в табл. 6. Сравнение считается корректным, если количество наблюдений в подгруппах сопоставимо. Если в подгруппе «Наличие пропусков» содержится менее 5% от общего количества наблюдений, то сравнение условных средних не проводится. Таблица 6 Условные средние значения для переменной «средняя продолжительность рабочей недели»
Источник: расчеты авторов по данным RLMS-HSE Для остальных переменных с пропусками (см. табл. 1) сравнение условных средних дало аналогичные результаты. Таким образом, признаков наличия MAR-пропусков в анализируемых данных обнаружить не удалось. Это дало основание для использования стандартных алгоритмов заполнения пропусков в данных, в частности MICE. В параметрах алгоритма MICE длина сгенерированных для каждой переменной марковских цепей составляла 50, количество сгенерированных цепей равно 35. Сходимость марковских цепей к предельному распределению проверена с помощью графика истории марковской цепи, рис. 2 (подробнее про график истории марковской цепи см. [27]).
Полученные марковские цепи стационарны и демонстрируют перемешивание (см. рис. 2), что свидетельствует о наличии сходимости к их предельному распределению, в данном случае к апостериорному распределению переменных, участвующих в импутации. Согласно рис. 2, сходимость достигнута для переменных «удовлетворенность жизнью», «количество детей» и «самооценка здоровья». Для остальных переменных графики истории марковской цепи аналогичны.
Результат восстановления пропусков в данных представлен на рис. 3. Синим цветом показаны эмпирические оценки плотностей и функций вероятности для исходных данных, красным – для восстановленных значений. Характер распределений почти идентичен: соотношение между пиками для первых двух переменных совпадает, а для переменных «логарифм средней заработной платы» и «индекс массы тела» распределения отличаются незначительно. Обсуждение Заполнение пропусков в данных особенно актуально в случае использования данных опросов и рандомизированных экспериментов [24]. Для оценки модели предложения труда, учитывающей влияние качества экологической обстановки на здоровье индивида, с помощью пространственной регрессии с фиксированными эффектами необходимы сбалансированные данные. В настоящем исследовании было проведено устранение несбалансированности выборки путем заполнения пропусков в исходных данных [28]. В табл. 7 приведены предварительные оценки параметров пространственной регрессии с фиксированными эффектами на панельных данных RLMS HSE после применения алгоритма MICE. Таблица 7 Оценки пространственной регрессии, полученные по восстановленным данным (зависимая переменная – количество отработанных часов в неделю)
Источник: расчеты авторов по данным RLMS-HSE Стандартные ошибки в табл. 7 рассчитаны с использованием формулы (2), - пропорция дисперсии из-за пропусков в данных, рассчитанная согласно (3). Численные значения пропорции дисперсии, приведенные в правом столбце табл. 7 показывают, что влияние алгоритма импутации на оценки параметров рассмотренной регрессии является умеренным [10]. Необходимо отметить, что в случае простого исключения наблюдений с пропусками количество респондентов составило бы 1176 (из 2263), т.е. их количество сократилось бы вдвое. Такая выборка уже не являлась бы сбалансированной, и оценить модель пространственной регрессии с фиксированными эффектами на панельных данных не представилось бы возможным. Кроме того, исключение наблюдений с пропусками, возможно, привело бы к смещению оценок параметров [24]. Таким образом, путем применения алгоритма заполнения пропусков в данных (в данном случае, MICE) могут быть устранены некоторые препятствия, возникающие при эконометрическом моделировании, а эффективность использования статистических показателей повышена путем учета большего количества данных. Ограничением данного исследования является то, что при анализе была принята предпосылка об отсутствии в рассматриваемых данных RLMS HSE неслучайных пропусков типа MNAR. Проверка данного предположения является одним из направлений дальнейших исследований. Выводы
Библиография
References
Дата поступления: 01.11.2019. Приложение 1
Просмотров: 7207
Добавить комментарий
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее обновление ( 15.04.2020 г. ) |
« Пред. | След. » |
---|