СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА-УИТНИ

Напомним схему, по которой строились все параметрические методы, будь то критерий Стьюдента, дисперсионный или корреляционный анализ. Из нормально распределенной совокупности мы извлекали все возможные выборки определенного объема и строили распределение значений соответствующего критерия.

его ранг — место в общем упорядоченном ряду.

Достаточно ли мало значение T, чтобы отклонить гипотезу

6 отсутствии действия препарата?

Для ответа на этот вопрос рассмотрим совокупность всех возможных перестановок. Заметьте, после перехода к рангам нам уже не нужно рассматривать сами исходные величины и совокупность их возможных значений. Поэтому наши дальнейшие рассуждения полностью применимы к любым двум группам наблюдений по 3 и 4 наблюдения в каждой.

Итак, нулевая гипотеза — гипотеза об отсутствии влияния препарата на диурез. Если она справедлива, любой ранг может равновероятно оказаться в любой из групп. Чтобы узнать, велика ли вероятность случайно получить перестановку из табл. 10.1, рассмотрим все возможные перестановки. Понятно, что распределить ранги по двум группам — это то же самое, что набрать ранги для одной из групп (оставшиеся автоматически попадут во вторую). Тогда, перечислив все варианты выбора 3 рангов из 7, мы тем самым перечислим все варианты распределения семи рангов по двум группам. Число способов по-разному выбрать 3 ранга из

7 равно 35. Все 35 вариантов приведены в табл. 10.2. Крестиком помечены ранги, попадающие в контрольную группу. В правом Ранги Сумма 1 2 3 4 5 6 7 рангов X X X 6 X X X 7 X X X 8 X X X 9 X X X 10 X X X 8 X X X 9 X X X 10 X X X 11 X X X 10 X X X 11 X X X 12 X X X 12 X X X 13 X X X 14 X X X 9 X X X 10 X X X 11 X X X 12 X X X 11 X X X 12 X X X 13 X X X 13 X X X 14 X X X 15 X X X 12 X X X 13 X X X 14 X X X 14 X X X 15 X X X 16 X X X 15 X X X 16 X X X 17 X X X 18 Таблица 10.2.

3 и 4 ранга

I I I—I—I I I I I—I—1—I—I—I—I I I—I—I—I—I

Сумма рангов для меньшей из групп (Т)

Рис. 10.1. 35 возможных сумм рангов для меньшей из групп (см. табл. 10.2).

столбце для каждого из вариантов указана величина T — сумма рангов меньшей (контрольной) группы. Если нанести значения T на график, получится распределение, показанное на рис. 10.1. Если справедлива нулевая гипотеза, то все сочетания рангов равновероятны. Это значит, что если, например, Т = 12 в 5 вариантах из 35, то вероятность случайно получить значение T = 12 равна 5/35. Таким образом, на рис. 10.1 изображено распределение значений T в случае справедливости нулевой гипотезы об отсутствии действия препарата. По форме оно напоминает распределение t (рис. 4.5). Однако есть и отличия. Действительно, распределение t непрерывно. Оно построено по бесконечной совокупности значений, вычисленных для бесконечного числа выборок из бесконечной нормально распределенной совокупности. Напротив, распределение Т конечно и дискретно, то есть имеет ступенчатый вид, принимая значения лишь в конечном числе целочисленных точек.

Глядя на рис. 10.1, легко определить вероятность получить то или иное значение Т при условии справедливости нулевой гипотезы. Например, значения T = 9 и Т = 15 наблюдаются в 3 вариантах, то есть вероятность появления каждой из этих сумм равна 3/15. Вероятность получить значение Т, равное 8 или 16, составляет 2/35 = 0,057. Будем считать эти значения T критическими. В нашем опыте Т = 9, так что нулевую гипотезу отвергнуть мы не можем.

Уровень значимости обычно принимают равным 5% или 1%. Можно ли установить такой уровень в нашем примере? Оказывается, нет. У нас есть всего 13 разных значений Т, поэтому уровень значимости может меняться только скачками. Назвав произвольный уровень значимости а, мы скорее всего обнаружим, что нет такого значения Т, которому бы он соответствовал.

Критические значения критерия Манна— Уитни приведены в табл. 10.3. Столбец критических значений содержит пары чисел. Различия статистически значимы, если Т не больше первого из них или не меньше второго. Например, когда в одной группе 3 человека, а в другой 6, различия статистически значимы, если T 23.

Изложенный вариант критерия известен как T-критерий Манна—Уитни[69]. Порядок его вычисления таков.

• Данные обеих групп объединяют и упорядочивают по возрастанию. Ранг 1 присваивают наименьшему из всех значений, ранг 2 — следующему и так далее. Наибольший ранг присваивают самому большому среди значений в обеих группах. Если значения совпадают, им присваивают один и тот же средний ранг (например, если два значения поделили 3-е и 4-е места, обоим присваивают ранг 3,5).

• Для меньшей группы вычисляют Т — сумму рангов ее членов. Если численность групп одинакова, Т можно вычислить для любой из них.

• Полученное значение T сравнивают с критическими значениями. Если Т меньше или равно первому из них либо больше или равно второму, то нулевая гипотеза отвергается (различия статистически значимы).

число вариантов равно 184756.

и стандартным отклонением

где пм и пб — объемы меньшей и большей выборок*. В таком случае величина

имеет стандартное нормальное распределение. Это позволяет сравнить zT с критическими значениями нормального распределения (последняя строка табл. 4.1). Более точный результат обеспечивает поправка Йейтса:

Роды по Лебуайе

В последние десятилетия произошел коренной пересмотр взглядов на родовспоможение. Акушерская революция совершалась под лозунгом «Отец вместо седативных средств». Восторже-

* Если некоторые значения совпадают, стандартное отклонение должно быть уменьшено согласно формуле:

где N = П и пб — общее число членов обеих выборок, т. — число значений i-го ранга, а суммирование производится по всем совпадающим рангам.

ствовала точка зрения, согласно которой при нормальных родах следует прибегать к помощи психологических, а не лекарственных средств. Что делать конкретно, мнения расходились. Масла в огонь подлила книга Лебуайе «Рождение без насилия». Французский врач предлагал комплекс мер, призванных свести к минимуму потрясение, которое испытывает новорожденный при появлении на свет. Роды надлежит принимать в тихом затемненном помещении. Сразу после родов ребенка следует уложить на живот матери и не перерезать пуповину, пока та не перестанет пульсировать. Затем, успокаивая младенца легким поглаживанием, нужно поместить его в теплую ванну, чтобы «внушить, что разрыв с организмом матери — не шок, но удовольствие». Лебуайе указывал, что дети, рожденные по его методике, здоровее и радостнее других. Многие врачи считали, что предложенная методика не только противоречит общепринятой практике, но и создает дополнительную опасность для матери и ребенка.

Как часто бывает в медицине, отсутствие достоверных данных могло затянуть спор на многие годы. Пока Н. Нелсон и со- авт.[70] не провели клиническое испытание, материалы ограничивались «клиническим опытом» автора методики.

В эксперименте Нелсон, проведенном в клинике канадского университета Макмастер, участвовали роженицы без показаний к искусственному родоразрешению, срок беременности которых составлял не менее 36 недель и которые были согласны рожать как по обычной методике, так и по Лебуайе. Роженицы были случайным образом разделены на две группы. В контрольной роды проводились по общепринятой методике в нормально освещенном помещении с обычным уровнем шума; после рождения пуповина немедленно перерезалась, ребенка пеленали и отдавали матери. В экспериментальной группе роды принимались по методике Лебуайе. В обеих группах при родах присутствовали мужья, применение обезболивающих средств было минимальным. Тем самым, группы различались только в том, в чем методика Лебуайе не совпадает с общепринятой.

То, в какую группу попала роженица, было известно самой роженице и всем, кто присутствовал при родах. На этом этапе эффект плацебо исключить было невозможно. Однако уже на этапе послеродового наблюдения одна из сторон, а именно врачи, которые оценивали состояние ребенка, не знали, по какой методике происходили роды. Таким образом исследование Нелсон было простым слепым: условия знала только одна из сторон, наблюдателю же они были неизвестны.

Для оценки развития детей была разработана специальная шкала. Из числа детей, рожденных по обычной методике, оценку «отлично» по этой шкале получали примерно 30%. Изучив труды Лебуайе, Нелсон и соавт. пришли к выводу, что предлагаемый метод, судя по заявлениям автора, гарантирует оценку «отлично» у 90% детей. Приняв уровень значимости а = 0,05, исследователи рассчитали, что для обеспечения 90% вероятности выявить такие различия в каждой из групп должно быть по 20 детей.

Работа продолжалась целый год. За это время исследователи провели беседы с 187 потенциальными участницами, разъясняя им смысл предстоящего эксперимента. 34 женщины не подошли по состоянию здоровья, 97 отказались участвовать в эксперименте (из них 70 собирались рожать только по методике Лебуайе). Из оставшихся 56 женщин одна успела родить до рандомизации. В результате число участниц сократилось до 55. Их и разделили случайным образом на две группы. После того как из исследования выбыла одна из попавших в контрольную группу, в этой группе оказалось 26, а в экспериментальной 28 рожениц. Однако у 6 женщин в контрольной группе и у 8 в экспериментальной возникли осложнения, и их пришлось исключить из участия в эксперименте. В итоге в каждой из групп оказалось по 20 женщин. Вы видите, насколько трудно обеспечить достаточную численность групп даже в простом исследовании[71].

Оценка по шкале развития производилось сразу после родов,

Роды по Лебуайе

О 10 20 30 40 50 60

Продолжительность бодрствования в первый час жизни, мин

Рис. 10.2. Продолжительность бодрствования в первый час жизни после обычных родов и родов по Лебуайе. Обратите внимание, что в обеих группах распределение асимметрично — преобладают высокие значения.

а также спустя несколько месяцев. Мы остановимся на одном из показателей — времени бодрствования в первый час жизни. Предполагалось, что чем лучше состояние новорожденного, тем более он активен. Значит, у младенцев, рожденных по Лебуайе, время бодрствования должно быть продолжительнее, чем у рожденных по обычной методике.

Из рис. 10.2 видно, что данные не подчиняются нормальному распределению. Особенно это заметно в экспериментальной группе. Тем самым, параметрические методы, например критерий Стьюдента, к этим данным неприменимы. Поэтому воспользуемся непараметрическим критерием Манна—Уитни.

Объединим данные, относящиеся к обеим группам, и упорядочим их по возрастанию. В табл. 10.4 кроме суммарного времени бодрствования указан также его ранг. Поскольку численность групп одинакова, сумму рангов Т можно вычислить для любой из них. Подсчитаем T для контрольной группы. Она равна 374. Размер групп достаточен, чтобы воспользоваться нормальным приближением для Т. Поэтому перейдем от Тк zT. Итак, полагая истинной нулевую гипотезу, вычисляем среднее всех возможных значений Т

пмпб (м + пб +20 х 20 х 41

12 12 Таким образом, с учетом поправки Йейтса,

В табл. 4.1 находим 5% критическое значение для бесконеч-

ного числа степеней свободы. Найденное критическое значение равно 1,960, то есть больше полученного. Тем самым, имеющиеся данные не позволяют отклонить гипотезу о том, что младенцы, рожденные по методике Лебуайе, по своей активности ничем не отличаются от остальных.

Общая оценка развития также не показала существенной разницы между двумя группами детей. Исследование Нелсон и со- авт. — пример тщательно спланированного и проведенного клинического испытания. На четко поставленный вопрос был получен ответ. Сегодня мало кто помнит о родах по Лебуайе. Не беда — на смену идут роды под водой. Оценка их влияния на развитие ребенка, быть может, станет темой будущих исследований.

📎📎📎📎📎📎📎📎📎📎