Перейти к основному содержанию

Научно-практический рецензируемый ежемеcячный журнал. Орган Министерства здравоохранения Республики Беларусь
Входит в Перечень научных изданий Республики Беларусь для опубликования результатов диссертационных исследований по медицинским и биологическим наукам. Журнал включен в систему Российского научного цитирования.
Журнал издается с 1924 года.

Об оценке результатов статистических исследований в медицине

При использовании отдельных статистических прие­мов как в научных исследованиях, так и в области практической медицины, обязательным условием является соответствие их объемам выборочных совокупностей, а также поставленным конкретным задачам, решение которых лежит в основе принятия адекватных управленческих мер, методологических приемов, в планировании дальнейших научных исследований.

Любой сравнительный анализ, как правило, не обходится без расчета относительных показателей, отражающих частоту явления в среде (интенсивные величины) и указывающих их долю (экстенсивные показатели) в общей совокупности явлений. Поскольку относительные показатели практически всегда рассчитываются из выборочной совокупности, обязательным требованием является их репрезентативность (представительность), которая зависит не только от объема выборки, но и от частоты встречающихся в ней явлений. Например, из 70 проведенных бактерио­логических обследований объектов внешней среды в палате в 20 случаях обнаружены бактерии, что в относительных показателях составило 28,6±5,4%. При уровне значимости Р≤0,05 и объеме выборки 70 (число исследований) фактическая величина t-критерия Стьюдента будет равна 5,3 (28,6:5,4=5,3) и превышать статистическое значение, установленное расчетным методом для выборки в 70 единиц (tстатистич.=1,994). Таким образом, количество проведенных исследований достаточно для суждения о частоте микробной обсемененности объектов внешней среды, поскольку соответствует критериям репрезентативности.

С другой стороны, если после выполненной в палате дезинфекции при тех же 70 обследованиях бактерии будут обнаружены в 3 случаях, то это составит 4,3±2,4%, а tфактич.=1,792 (4,3:2,4=1,792) окажется меньше tстатистич.=1,994 при Р≤0,05 для объема выборки в 70 единиц. С математической точки зрения значение показателя частоты (4,3±2,4%) нельзя распространить на генеральную совокупность. В то же время единичное обнаружение микроорганизмов после дезинфекции свидетельствует об эффективности проведенного профилактического мероприятия, поскольку оно привело к тому, что обнаружение микроорганизмов из закономерного явления стало случайным.

Если в научных исследованиях расчет относительных величин с оценкой их репрезентативности является обязательным, то в практической деятельности врача это может и не понадобиться. Допустим, проведено 1250 исследований на стерильность отдельных медицинских инструментов, из которых на 2 (0,16±0,11%) после обеззараживания обнаружены гноеродные бактерии. Полученное значение tфактич.=1,454 меньше tстатистич.=1,957 при n≥500 и распространять полученный показатель на всю генеральную совокупность по требованиям статистики нельзя. Но с медицинской точки зрения 2 нестерильных инструмента представляют несомненную опасность в плане передачи микроорганизмов и инфицирования па­циентов и, несмотря на нерепрезентативность цифровых данных, контаминированные микрофлорой инструменты применять не будут. Другими словами, когда речь идет о явлениях, которые не должны иметь место в данной среде (например, наличие микроорганизмов на объектах, прошедших стерилизацию; постинъекционные абсцессы; обнаружение патогенных микроорганизмов в пищевых продуктах и т. д.), управленческое решение принимают по одному единственному показателю, выраженному натуральным числом.

С другой стороны, нельзя отрицать и научную значимость даже одного случайного положительного результата, если он свидетельствует о ранее не встречаю­щемся явлении, например, о выделении микроорганизма с новой антигенной структурой. Естественно, что данная микробная клетка в лабораторных условиях будет размножена для проведения дальнейших научных изысканий уже на целой популяции. В результате на большой выборке, при которой вступает в действие закон больших чисел, появится возможность с помощью статистического метода подтвердить или опровергнуть закономерность выявленного свойства.

Не только в практической деятельности врача, но и в отдельных научных публикациях можно встретить ошибочную оценку распространенности явления в выборке не по интенсивным, а по экстенсивным показателям. Допустим, из 167 постинъекционных абсцессов 91 (54,5±3,9%) зарегистрирован после внутримышечных инъекций сульфата магния, 46 (27,5±3,5%) — после введения раствора анальгина и 30 (17,9±3,0%) — после инъекции димедрола. На основании данных показателей делать заключение о более частом возникновении нагноительных процессов после инъекционного введения раствора сульфата магния неправомерно, поскольку в данном случае значения долей показывают не частоту развития осложнений, а их структуру (удельный вес, долю) по действующему агенту. Для суждения о частоте распространенности нагноительных процессов необходимо знать объем выборки применительно к каждому препарату, то есть число инъекций каждого лекарственного средства. Если допустить, что сульфат магния был введен 700 пациентам, то при 91 абсцессе частота их составит 13,0±1,3%; при 46 развившихся нагноениях после 110 инъекций анальгина — в 3,2 раза больше (41,8±3,8%; Р≤0,001), 30 абсцессов после 40 инъекций димедрола — 75,0±3,4%. В результате самая низкая частота осложнений оказалась после введения сульфата магния и была значимо выше таковой после инъекции анальгина (РЈ0,01) и димедрола (РЈ0,01), причем после введения димедрола большей, чем после инъекций анальгина (75,0±3,4% и 41,8±3,8% соответственно; Р≤0,001), в то время как доля абсцессов от этих препаратов находилась в обратной зависимости (17,9±3,0% и 27,5±3,5% соответственно; РЈ0,05). Необходимо помнить, что анализу показателей структуры (экстенсивные величины) всегда должно предшествовать определение частоты интересующих явлений (интенсивные величины) в изучаемой выборке.

При расчете средних величин наиболее частой ошибкой является неправильная группировка исходных данных, вследствие чего полученный результат напоминает «среднюю температуру по больнице». Особенно это касается показателей, характеризующих физиологические и биохимические процессы, степень выраженности которых индивидуальна у каждого человека, в том числе в зависимости от возраста, пола, массы тела и т. д. Допустим, в группе из 32 пациентов определяли скорость оседания эритроцитов (СОЭ), которая до лечения составляла персонально для каждого пациента 2, 4, 6, 2, 10, 8, 8, 10, 12, 8, 8, 2, 16, 20, 18, 18, 20, 22, 22, 24, 18, 16, 20, 22, 24, 20, 22, 20, 24, 26, 22, 20 мм/ч, после лечения — 2, 4, 6, 2, 6, 8, 2, 8, 6, 5, 4, 4, 6, 18, 18, 18, 18, 16, 16, 10, 16, 14, 10, 16, 16, 16, 16, 10, 16, 18, 16, 16 мм/ч. Среднее арифметиче­ское значение СОЭ до лечения составило 15,0±1,3, после лечения — 11,0±1,0 (Р≤0,001). Сделанное на основании значимо уменьшившейся (на 4 мм/ч) СОЭ за­ключение об эффективности лечения поспешно, поскольку количество пациентов с повышенным предельным верхним показателем нормы СОЭ (примем его за 10 мм/ч) существенно не изменилось (12 человек до лечения и 16 — после), что в относительных показателях составило соответственно 37,5±8,6% и 50,0±8,8% (Р≥0,05). В данной ситуации для корректной оценки полученных результатов необходимо было не рассчитывать «среднюю СОЭ по больнице», а объединить пациентов хотя бы в 2 группы:

а) лица, имеющие показатели СОЭ в пределах физиологической нормы;

б) лица, имеющие показатели СОЭ выше физиологической нормы. Для более углубленного анализа целесообразно увеличить количество сравниваемых групп, например, имеющие СОЭ 2—10, 11—15, 16—20 мм/ч и т. д. Естественно, что в этом случае для надежного статистического обоснования причин изменений СОЭ выборка из 32 больных явно недостаточна. Особенно неубедительными являются такие результаты, когда не выдержаны требования стратифицированного отбора пациентов с точки зрения однородности их по возрасту, полу, массе тела и другим показателям. В результате в одну группу включаются лица, анатомо-физиологические особенности которых по анализируемому признаку различаются в силу объективных причин. Например, та же группа из 32 пациентов состоит из больных в возрасте от 20 до 72 лет, в то время как степень выраженности обменных процессов у лиц 20- и 72-летнего возраста неодинакова.

При сравнительной оценке значений средних геометрических (например, титр антител до и после вакцинации) необходимо помнить, что при их расчете каждая последующая переменная не складывается, а умножается на некоторое постоянное число, называемое знаменателем прогрессии, в результате чего распределение признаков графически выглядит в виде прямой линии, а не куполообразной кривой, как при средней арифметической. Поскольку средняя геометрическая не подчиняется закону нормального распределения, рассчитывать для нее статистическую ошибку нельзя.

Некорректные заключения по результатам вычисления коэффициента линейной корреляции, а также получение так называемой ложной корреляции связано
в основном с невыполнением следующих требований.

1. Между сравниваемыми переменными должна быть линейная зависимость.

2. Необходимо достаточное количество наблюдений, определяемое как 5—10-кратное превышение числа факторов (от 25 до 100 парных наблюдений), когда вступает в действие закон больших чисел, обеспечивающий взаимопогашение случайных колебаний.

3. Поскольку для расчета коэффициента линейной корреляции используются средняя арифметическая и стандартное отклонение, являющиеся параметрами нормального распределения, то совокупность значений всех факторных и результативных признаков также должна соответствовать многомерному нормальному распределению.

4. Число варьирующих признаков в сравниваемых переменных (х, у) должно быть одинаковым.

5. Исходная совокупность значений должна быть качественно однородной, выражаться в одних и тех же единицах интервальной шкалы или шкалы отношений.

6. Относительные величины в коррелируемых рядах должны быть репрезентативны.

7. Исходные данные необходимо группировать с учетом временных параметров действия причины и наступления следствия. Например, если 1 ноября произошла аварийная ситуация с массовым поступлением в питьевую воду шигелл Флекснера и в этот же день авария устранена (фактор прекратил действие), то среди людей, получивших с водой инфицирующую дозу шигелл, больные будут появляться до истечения максимального инкубационного периода, то есть до 10 ноября. Заболевания в более позд­ние сроки окажутся вызваны уже действием иных факторов передачи заразного начала. Значение коэффициента корреляции из цифровых данных, сгруппированных по месяцам или по другим временным перио­дам, превышающим максимальный инкубационный для данной инфекционной патологии, не может служить объективной характеристикой возможной причинно-следственной зависимости.

8. Полученная величина коэффициента должна быть проверена на репрезентативность.

Прежде чем рассчитывать коэффициент корреляции, необходимо убедиться в возможности причинно-следственной зависимости между изучаемыми явлениями, поскольку параллельное изменение статистических показателей само по себе еще не говорит о наличии связи и может быть обусловлено случайным совпадением многих обстоятельств, не связанных друг с другом.

В отдельных публикациях можно встретить некорректное использование критерия хи-квадрат (c2). Например, указывается, что «…в группе пациентов, получавших препарат по предложенному методу, клиническое выздоровление наступило в 95,3% случаев,
в группе больных стандартной терапии — в 40,5% (c2=32,25; Р≤0,001)». Складывается впечатление, что разность между показателями частоты 95,3% и 40,5% доказана с помощью критерия c2, который для этих целей не используется. Применительно к описанной ситуации достаточно было сослаться на полученную величину c2=32,25 в сравнении с критическим уровнем. Известно, что математически c2 представляет собой сумму частных от деления квадратов отклонений фактически полученных натуральных чисел от теоретически ожидаемых на число последних. Оценку же значимости различий между относительными величинами 95,3% и 40,5% необходимо провести по t-критерию Стьюдента, но только при наличии следующих условий: анализируемые ряды подчиняются закону нормального распределения; известны величины статистических ошибок обоих показателей частоты.

Ошибочным является использование t-критерия Стьюдента для оценки показателей, выраженных в баллах, когда указывается, что «…болевой синдром у женщин был выражен в большей степени, чем у мужчин, составляя соответственно 9,5±0,3 и 6,6±0,2 балла; t=8,05; РЈ0,001)». Если с дискретными признаками, представленными целыми числами (например, число мужчин и женщин с разной степенью выраженности болевого синдрома), можно проводить вычисления, то с теми же показателями, выраженными в баллах, этого делать нельзя, поскольку баллы по своей природе не подчиняются закону нормального распределения, стало быть, t-критерий Стьюдента здесь неприменим.

Отклонение переменных от среднего значения имеет место в каждом отдельном случае, но при увеличении числа переменных отклонения взаимно погашаются, а средняя величина становится более устойчивой. Именно в этом заключается «закон больших чисел», суть которого состоит в том, что при большом числе случайных явлений средний результат практически перестает быть случайным и может быть предсказан с большой степенью уверенности. При большой выборке, когда явления подчиняются закону нормального распределения, статистика использует параметрические приемы, позволяющие получать убедительные данные. Если же выборка составляет менее 100 наблюдений, то необходимо вначале убедиться в нормальности распределения, а при его отсутствии применить менее точные непараметрические критерии, что для научных исследований нежелательно. Например, непараметрические коэффициенты корреляции рангов Спирмена (коэффициент определяется по разности значений рангов), знаков Фехнера (учитывается количество совпадений и несовпадений знаков отклонений значений показателей от их среднего значения), Кендала (коэффициент также определяется по ранжированным значениям) значительно уступают по точности коэффициенту линейной корреляции, поскольку в них фактические значения заменены ча­стотами, рангами, знаками. Проведем ранжирование, то есть присвоим порядковые номера (ранги) каждому значению от меньшего к большему в следующем ряду показателей заболеваемости (‰): 2,5; 3,0; 7,5; 14,5. В результате показатель 2,5‰ будет иметь 1-й ранг; показатель 3,0‰ — 2-й; 7,5‰ — 3-й; 14,5‰ — 4-й. Как видно, каждый последующий ранг отличается на единицу, в то время как между 1-м и 2-м рангом разница в уровне заболеваемости составляет 0,5‰ (3,0—2,5=0,5), между 2-м и 3-м — в 9 раз больше (4,5‰), а между 3-м и 4-м — 7,0‰, что в существенной степени негативно сказывается на чувствительности непараметрических коэффициентов корреляции в сравнении с параметрическими.

Если применение непараметрических методов вполне допустимо в области практического здравоохранения в силу объективной ограниченности объема информации, который имеет место в конкретных временных условиях, то научные исследования в области медицины долж­ны базироваться на больших выборках, когда в действие вступает закон больших чисел, нивелирующий воздействие многих случайных факторов и позволяющий установить детерминирующий фактор. Доказать значимость различий между двумя средними на небольшой выборке — это еще не значит установить закономерности возникновения и/или изменения изучае­мого явления, что и определяет цель науки.

Следует также отметить, что широкое использование пакетов статистических программ значительно облегчило вычисление статистических показателей, но в то же время увело авторов не только от необходимости вникать в суть математических расчетов, но и от профессиональной оценки полученных результатов со ссылкой на то, что так подсчитал компьютер. Статистиче­ский анализ призван выполнять роль ведущего инструмента объективной оценки выявленных закономерностей, а не служить «украшением» научной работы.

 

Л И Т Е Р А Т У Р А

1. Гмурман В. Е. Теория вероятностей и математиче­ская статистика: Учеб. пособие для вузов. — М., 2004.

2. Елисеева И. И., Юзбашев М. М. Общая теория стати­стики: Учебник / Под ред. И. И. Елисеевой. — М., 2002.

3. Океанов А. Е., Дардынская И. В. Применение статистических методов в биомедицинских исследованиях.— Минск, 2012.

4. Римжа М. И. // Здравоохр. Беларуси.— 1994.— № 6.— С. 35—39.

5. Рокицкий П. Ф. Биологическая статистика.— Минск, 1973.

6. Теория статистики: Учебник / Под ред. Г. Л. Громыко.— М., 2009.

Поступила 21.01.13.

Адрес для корреспонденции:

Римжа Михаил Иванович.

Белорусский государственный медицинский университет.

220116, г. Минск, пр. Дзержинского, 83; сл. тел. (8-017) 275-11-60.

  • Я только что вернулся с большого международного форума врачей и ученых, проходившего в Санкт-Петербурге. На нем обсуждались вопросы совершенствования диагностики и лечения хронического миелолейкоза. Мы теперь уже добились того, что продолжительность жизни таких больных увеличилась в четыре раза, в России уже живут, радуются жизни и трудятся люди, излеченные от этого тяжелого заболевания... На форуме наряду с отечественными клиницистами выступали гематологи из Хьюстона (США), Турина (Италия), Мангейма (Германия).
  • Я вспоминаю свои беседы с больными — преподавателями медицинского института, профессорами. Что говорить, трудно с ними работать! Трудно с ними говорить и действовать, как со всеми остальными пациентами...Что еще характерно для заболевшего врача в психологическом плане? Частенько такой пациент напрочь забывает не только действие препаратов, но и время их приема, хотя сам в своей жизни неоднократно назначал их.
  • При осмотре мы прежде всего также уделяем особое внимание кожному покрову. Нормальная кожа и изменения ее при различных заболеваниях довольно подробно представлены в учебниках и монографиях. Здесь мне хочется лишь привести некоторые сведения, которые будут интересны врачам различных специальностей и позволят понять, почему кожа претерпевает изменения. Известно, что кожа — это полноценный орган, который дополняет и дублирует функции различных внутренних органов. Она активно участвует в процессе дыхания, выделения, обмене веществ.
  • Я никогда не заканчиваю расспроса-беседы с больным без того, чтобы выяснить хотя бы ориентировочно состояние взаимоотношений в семье. Полипрагмазия — бич современной медицины, клиники внутренних болезней. На обходах часто приходится видеть, как больным назначают 13—16 препаратов, нередко с взаимоисключающими фармакологическими свойствами.
  • Изучив сотни диагностических ошибок, сотрудники нашего коллектива убедились, что в ходе диагностического процесса практические врачи нарушают даже самые элементарные правила логики. Например, они неправильно применяют методы аналогии, индукции, дедукции.
  • А в настоящее время мне самому приходилось и в поликлиниках, и в стационарах слышать такие «уважительные и милые» обращения медицинских работников (и даже студентов, которые берут со старших пример!!!), как «голубушка», «бабуля», «золотце», «милочка», «голубчик», «бабуся», «дедуся», «дедуля», «женщина», «человек», «старик», «папаша», «мамаша», «отец», «мать», «барышня», «мужик», «тетя», «дядя» и т. д. Многие из таких слов для больных обидны, полны презрения, как правило, задевают самолюбие пациентов и их родственников.
  • Он редко выслушивал до конца доклад о больном, часто сразу же задавал вопросы, уточняющие характер течения болезни, особенности жизни. Удивительно, что вслух он мог сказать: «Что-то тут мне не ясно. Чего-то не хватает в истории болезни». И начинал сам собирать и выяснять эти «недостающие звенья».
© Редакция журнала «Здравоохранение» - 1924 - 2014гг.
Разработка сайта - doktora.by - сайт для врачей Беларуси