МЕТОДЫ ОПРЕДЕЛЕНИЯ МИНИМАЛЬНО НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ |
27.12.2019 г. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DOI: 10.21045/2071-5021-2019-65-6-10
Наркевич А.Н., Виноградов К.А. Резюме Актуальность. Одним из важнейших вопросов, который встает перед исследователем еще на этапе планирования медицинского исследования, является определение минимально необходимого объема выборки исследуемых единиц наблюдения. Неверное или халатное отношение к решению данного вопроса может свести результаты исследования, длящегося несколько лет, на нет. Целью данной статьи является систематизация и рассмотрение различных методы расчета минимально необходимого объема выборки при планировании медицинских исследований. Результаты. В статье представлены наиболее часто применяемые при планировании медицинских исследований методы определения минимально необходимого объема выборки. Представленная группировка методов определения объема выборки включает такие основные группы, как методы, которые не требуют предварительных знаний об изучаемом явлении и методы, которые требуют от исследователя предварительных данных о том, что будет исследоваться. Представлены примеры использования данных методов. Заключение. На текущий момент в практике медицинских исследований отсутствует четко установленная методология определения минимально необходимого объема выборки, однако, при представлении диссертационных исследований это является обязательным условием для обеспечения достоверности полученных результатов. Область применения результатов. Представленные в данной статье методы могут быть использованы для определения минимально необходимого объема выборки при планировании медицинских исследований, в том числе диссертационных. Ключевые слова: объем выборки; выборка; репрезентативность; медицинские исследования; диссертационные исследования.
Контактная информация: Наркевич Артем Николаевич, e-mail:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
Для цитирования: Наркевич А.Н.,
Виноградов К.А. Методы определения
минимально необходимого объема выборки
в медицинских исследованиях. Социальные
аспекты здоровья населения [сетевое
издание] 2019; 65(6):10. URL:
http://vestnik.mednet.ru/content/view/1123/30/lang,ru/
DOI: 10.21045/2071-5021-2019-65-6-10 Narkevich A.N., Vinogradov K.A. Prof. V.F. Voino-Yasenetsky Krasnoyarsk State Medical University, Krasnoyarsk, Russia Abstract Significance. One of the most important challenges faced by a researcher at the planning stage of a medical research is to decide on the minimum required sample size of the studied units under observation. Incorrect or negligent attitude to this issue can bring the results of the study, which lasts for several years, to naught. The purpose of this article is to systematize and consider various methods for calculating the minimum required sample size in planning a medical research. Results. The article presents the most frequently used in the planning stage of a medical research methods for determining the minimum required sample size. The presented grouping of sample methods includes such basic groups as methods that do not require previous knowledge about the phenomenon under study and methods that require preliminary data collection on the study subject from the researcher. The article also exemplifies these methods. Conclusions. Currently, there is no clear methodology for determining the minimum required sample size in the practice of medical research, however, it is the must for ensuring reliability of the results in presenting a dissertation research. Scope of application. The methods presented in this article can be used to determine the minimum required sample size in planning a medical research, including a dissertation one. Keywords: sample size; sample; representativeness; medical research; dissertation research.
Corresponding author: Artem N. Narkevich, e-mail:
Этот e-mail защищен от спам-ботов. Для его просмотра в вашем браузере должна быть включена поддержка Java-script
For citation: Narkevich A.N., Vinogradov K.A. Methods for determining the minimum required sample size in medical research. Social'nye aspekty zdorov'a naselenia / Social aspects of population health [serial online] 2019; 65(6):10. Available from: http://vestnik.mednet.ru/content/view/1123/30/lang,ru/. (In Rus). DOI: 10.21045/2071-5021-2019-65-6-10 Введение Одним из важнейших вопросов, который встаёт перед исследователем ещё на этапе планирования медицинского исследования, является определение минимально необходимого объема выборки исследуемых единиц наблюдения [1,2]. Неверное или халатное отношение к решению данного вопроса может свести результаты исследования, длящегося несколько лет, на нет [3,4]. При этом, в медицинских исследованиях существует как проблема недостаточности выборки, когда полученная выборка не отражает генеральную совокупность и, соответственно, результаты, полученные на такой выборке, не могут быть экстраполированы на всю генеральную совокупность, так и проблема неоправданно большой выборки. Неоправданно большая выборка, во-первых, повышает денежные и трудовые затраты необходимые для проведения исследования, а во-вторых, неоправданно большой объем выборки повышает вероятность найти случайные статистически значимые закономерности, которые отсутствуют в генеральной совокупности [5]. В данной статье совершена попытка систематизировать и рассмотреть различные методы расчета минимально необходимого объема выборки при планировании медицинских исследований. Необходимо отметить, что все методы определения объема выборки можно разделить на две группы. Первая группа – методы, которые не требуют предварительных знаний об изучаемом явлении. Вторая – методы, которые требуют от исследователя предварительных данных о том, что будет исследоваться. При использовании методов, входящих во вторую группу, как правило, объем выборки получается меньшим, но их применение более обременительно и с финансовой и с организационной точек зрения. Методы, не требующие предварительных знаний об изучаемом явлении К первой группе методов можно отнести использование для определения минимального объема выборки таблиц К.А. Отдельновой [6], В.И. Паниотто [7] и N. Fox [8]. Согласно таблице К.А. Отдельновой (таблица 1) исследования можно классифицировать по 3 уровням точности: ориентировочное знакомство, исследование средней точности, исследование повышенной точности. Такие три уровня точности весьма условно с практической точки зрения можно разделить следующим образом. Уровень точности «ориентировочное знакомство» соответствует пилотному исследованию, «исследование средней точности» – подойдет для исследования, результаты которого можно будет опубликовать в качестве научной статьи с последующим более глубоким изучением, ну а «исследование повышенной точности» – для диссертационного исследования и формирования окончательных заключений. Таблица 1 Определение объема выборки по методике К.А. Отдельновой
В связи с тем, что в медицинских исследованиях принято в качестве границы статистической значимости результатов использовать уровень значимости равный 0,05, то согласно методике К.А. Отдельновой объем выборки диссертационного исследования должен составить 400 единиц наблюдения. Естественно, если исследователь планирует получить уровень значимости меньше, чем 0,05, то и необходимый объем выборки должен быть больше. Методика определения объема выборки по методике В.И. Паниотто также предусматривает использование таблицы (таблица 2). В данной таблице приведено соответствие объема генеральной совокупности и необходимого объема выборки при уровне значимости 0,05. Следует обратить внимание, что согласно таблице К.А. Отдельновой и В.И. Паниотто для диссертационного исследования, в котором объем генеральной совокупности довольно велик, достаточно сформировать выборку, включающую 400 единиц наблюдения. Таблица 2 Определение объема выборки по методике В.И. Паниотто при уровне значимости 0,05
Таблица, разработанная N. Fox (таблица 3), предусматривает для определения необходимого объема выборки оценку величины допускаемой ошибки. Таблица 3 Определение объема выборки по методике N. Fox
Необходимо отметить, что приведенные выше методики разрабатывались для социологических опросов и для социально-гигиенических исследований, но они плотно закрепились и при планировании медицинских клинических исследований, так что они вполне могут быть использованы для определения объема выборки, но как уже было сказано выше, использование данных методик дает довольно большие объемы выборок. Очень важно отметить, что если исследователь планирует изучать несколько исследуемых групп, в том числе путем сравнения этих групп между собой, то необходимо определение по описанным выше методикам объема каждой группы – каждая группа, то есть выборка, должна быть извлечена из своей генеральной совокупности с собственным расчетом объема выборки. Методы, требующие от исследователя предварительных данных Вторая группа методик определения объема выборки зависит от дизайна исследования и вида признаков, которые будут исследоваться в исследовании, и основывается на использовании специализированных формул. Все эти формулы приведены в таблицах 4-6 [9].
Таблица 4
Формулы для расчета объема выборки при проведении описательного исследования одной группы
Для примера приведем расчеты объема выборки по формулам, приведенным во втором столбце таблицы 4. Рассмотрим для начала случай с неизвестной генеральной совокупностью. Исследователь изучает удельный вес неблагоприятных исходов беременности и хочет определить объем выборки с уровнем значимости 0,05 и предельно допустимой ошибкой 5%. Из литературных данных или пилотного исследования установлено, что удельный вес неблагоприятных исходов у беременных составляет 10%. В соответствии с имеющимися условиями объем выборки рассчитывается следующим образом:
То есть для поставленной исследователем задачи достаточно сформировать выборку, включающую 139 беременных женщины. Теперь предположим, что у исследователя имеется информация об объеме генеральной совокупности (5000 беременных в год) и используя те же условия исследовательской задачи рассчитаем объем выборки:
Таким образом, при использовании дополнительной информации в виде объема генеральной совокупности был получен чуть меньший объем выборки. Естественно, при увеличении объема генеральной совокупности объем выборки будет увеличиваться, так при объеме генеральной совокупности 100000 человек, объем выборки будет равен объему, полученному при использовании формулы, которая не учитывает генеральную совокупность при расчете:
Таблица 5 Формулы для расчета объема выборки при проведении исследования, в котором предполагается сравнение двух несвязанных групп
Далее рассмотрим использование формул для расчета объема выборки при проведении исследования, в котором предполагается сравнение двух несвязанных групп. Рассмотрим пример расчета объема выборки при сравнении двух несвязанных групп и изучении качественного признака. Например, исследователем предполагается сравнение удельного веса неблагоприятных исходов беременности у женщин до 40 лет с удельным весом неблагоприятных исходов у женщин старше 40 лет. В пилотном исследовании получено, что удельный вес неблагоприятных исходов беременности у женщин до 40 лет составляет 5%, а у женщин старше 40 лет – 15%. Предполагается рассчитать объем выборки для получения результатов сравнения как минимум с уровнем значимости 0,05. Воспользуемся формулами, приведенными во втором столбце таблицы 27 и рассчитаем сначала объем первой группы:
И объем второй группы:
Таким образом, для проведения планируемого исследования необходимый объем I группы должен составить 63 беременных женщины, а II группы – 69 женщин. Естественно при сравнении двух несвязанных групп объемы сравниваемых групп могут отличаться, чего нельзя сказать о сравнении связанных групп, когда их объем должен быть одинаковым. Таблица 6 Формулы для расчета объема выборки при проведении исследования, в котором предполагается сравнение двух связанных групп
Рассмотрим использование формул для расчета объема выборки при проведении исследования, в котором предполагается сравнение двух связанных групп. Например, исследователем предполагается сравнение удельного веса пациентов, страдающих раком легкого, у которых имеется превышение нормативных показателей СОЭ до лечения и после. В пилотном исследовании получено, что удельный вес больных раком легкого, у которых имеется превышение нормативных показателей СОЭ составляет 50%, а после лечения – 40%. Предполагается рассчитать объем выборки для получения результатов сравнения как минимум с уровнем значимости 0,05. Воспользуемся формулами, приведенными во втором столбце таблицы 28 и рассчитаем сначала объем первой группы:
Таким образом, объем каждой группы должен составить по 189 единиц наблюдения. Источниками для определения X, σ и P при использовании методов, представленных в таблицах 4-6, как правило, служат либо результаты пилотного исследования, либо данные литературы, в которой описываются аналогичные исследования. Что же делать, когда в литературе не удается найти необходимые данные, а проведение пилотного исследования по каким-либо причинам невозможно? В таком случае параметры X и σ можно получить следующим расчетным путем. Исследователю необходимо (как правило из личного опыта) оценить минимальное и максимальное значения изучаемого признака, после чего параметры X и σ можно рассчитать по следующим формулам:
Такой расчетный путь основывается на том, что расстояние между максимальным и минимальным значениями признака примерно равно шести стандартным отклонениям, что вытекает из правила трех сигм, а среднее арифметическое – примерно середина расстояния между максимальным и минимальным значениями признака. Если проводится расчет объема выборки исследования, в котором будут изучаться качественные признаки, то можно использовать параметр P равный 50. В таком случае произведение P * Q будет максимальным (50*50=2500). Такой подход естественно приведет к завышению объема выборки, но если другого выхода у исследователя нет, то этот вариант будет единственным для того чтобы не получить заниженное минимально необходимое число исследуемых. Таким образом, использование для расчета объема выборки формул, приведенных в таблицах 4-6 дает существенно меньшие результаты, чем табличные методы, однако их использование в некоторых случаях может привести к необоснованному занижению необходимого объема выборки. В научно-методической литературе также описываются другие методы определения объема выборки. Одним из таких методов является номограмма Альтмана [10,11]. Метод заключается в использовании номограммы, приведенной на рисунке 1. Номограмма имеет 2 оси: левая ось Δ представляет стандартизованную разность, а правая ось 1-β – мощность. Метод заключается в том, что необходимо провести линию от значения оси Δ к значению оси 1-β. На пересечении такой линии и линии, соответствующей необходимому уровню значимости и будет представлен необходимый объем выборки. В медицинских исследованиях мощность (1-β) как правило выбирается равной 0,80 или 0,90, но чаще всего мощности 0,80 вполне достаточно. Расчет стандартизованной разности зависит от вида признака, который будет изучаться в исследовании и связанности сравниваемых групп. Если планируется исследование со сравнением количественного показателя между несвязанными группами, то стандартизованная разность рассчитывается:
где X1 – среднее арифметическое признака в первой сравниваемой группе, X2 – среднее арифметическое признака во второй сравниваемой группе, σ – стандартное отклонение сравниваемого признака. Если планируется исследование со сравнением количественного показателя между связанными группами, то стандартизованная разность рассчитывается:
где X1 – среднее арифметическое признака в первой сравниваемой группе, X2 – среднее арифметическое признака во второй сравниваемой группе, σ – стандартное отклонение сравниваемого признака. Если планируется исследование со сравнением качественного показателя между группами, то стандартизованная разность рассчитывается:
где P1 – доля признака в первой сравниваемой группе, P2 – доля признака во второй сравниваемой группе. Таким образом, после расчета стандартизованной разности и выбора необходимой мощности с помощью номограммы Альтмана можно рассчитать необходимый объем выборки. Воспользуемся следующим примером. Исследователем из литературных данных получено, что удельный вес изучаемого признака в первой группе составляет 60%, а во второй 40%. Для расчета объема выборки мощность выбрана равной 0,80. Расcчитаем стандартизованную разность:
После необходимых вычислений проведем линию, соединяющую ось стандартизованной разности в точке 0,4 и ось мощность в точке 0,80 (рисунок 2). Таким образом, объем выборки такого исследования при желаемом уровне значимости результатов равном 0,05 примерно равен 200, а при уровне значимости равном 0,01 – 300. Необходимо отметить, что полученный объем выборки отражает общий объем сравниваемых групп, то есть при уровне значимости 0,05 объем первой группы может составить 120, а второй 80 в случае несвязанных групп, а в случае связанных групп – по 100 в каждой группе. Довольно часто в научно-методической литературе также встречается использование для расчета объема выборки формулы Лера [12]:
где Δ – стандартизованная разность, которая рассчитывается точно также, как и при использовании номограммы Альтмана.
Данная формула позволяет рассчитать объем выборки при мощности 0,80 и уровне значимости 0,05. Так в предыдущем примере Δ было равно 0,4. Объем выборки согласно формуле Лера составит:
То есть каждая из изучаемых групп должна составить по 40 единиц наблюдения. Заключение На текущий момент в практике медицинских исследований отсутствует четко установленная методология определения минимально необходимого объема выборки, однако, при представлении диссертационных исследований это является обязательным условием для обеспечения достоверности полученных результатов. Такая ситуация складывается как в российской, так и в зарубежной научной практике. Одни методы, «кочуют» от исследования к исследованию и являются уже «общепринятыми». В какой-то момент появляются новые методы, предлагаемые различными авторами. В связи с этим исследователю довольно сложно определится с методами, которые следует применить при планировании собственного исследования. Особо остро данная проблема стоит перед аспирантами и соискателями, которые планируют диссертационные исследования. Это связано с необходимостью быстрого и оперативного планирования своего диссертационного исследования. Таким образом, в данной работе представлены наиболее часто применяемые методы определения необходимого объема выборки, которые могут быть применены при планировании исследований, в том числе диссертационных. Библиография
References
Дата поступления: 22.09.2019 Просмотров: 15723
1. 16-03-2021 05:54 Уважаемые коллеги, спасибо за выявленные в статье несоответствия! В статью внесены коррективы. 2. 28-02-2021 22:50 В примере "Формулы для расчета объема выборки при проведении исследования, в котором предполагается сравнение двух несвязанных групп" расчёты не соответствуют формуле: 1) При расчёте первой выборки делается странное допущение: 67,2 приблизительно равно 63 2) При расчёте второй выборке в формуле P1 возводится в квардрат, а в примере - не возводится. Было бы неплохо внести исправления в статью. 3. 07-07-2020 04:32 Ответ на свой вопрос нашла. Для расчета объема выборки качественного показателя в статье ошибка в формуле, необходимо p=(p1+p2)/2, все-таки надо «+», а не «–», согласно источнику 11 Whitley E., Ball J. Statistics review 4: Sample size calculations. Critical Care. 2002; 6 (4): 335–341. 4. 07-07-2020 00:37 Для определения выборки исследования со сравнением качественного показателя вы приводите формулу 'P=(P1P2)/2, а в своем примере указываете (60+40)/2! Все-таки «–» или «+»? Где ошибка? Подскажите, пожалуйста, литературу с формулами, а если в ней будут примеры – просто замечательно! Добавить комментарий
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее обновление ( 15.03.2021 г. ) |
« Пред. | След. » |
---|