U-критерий Манна — Уитни

U-критерий Манна — Уитни (англ. Mann–Whitney U test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна — Уитни — Уилкоксона (англ. Mann–Whitney–Wilcoxon, MWW), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test) или критерий Уилкоксона — Манна — Уитни (англ. Wilcoxon–Mann–Whitney test). Реже: критерий числа инверсий[1].

История

Данный метод выявления различий между выборками был предложен в 1945 году американским химиком и статистиком Фрэнком Уилкоксоном. В 1947 году он был существенно переработан и расширен Г. Б. Манном и Д. Р. Уитни[фр.], по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа — разные) или таких совпадений должно быть очень мало (до 10).[источник не указан 695 дней]

Использование критерия

Для применения U-критерия Манна — Уитни нужно произвести следующие операции.

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным N = n 1 + n 2 , {\displaystyle N=n_{1}+n_{2},} где n 1 {\displaystyle n_{1}}  — количество элементов в первой выборке, а n 2 {\displaystyle n_{2}}  — количество элементов во второй выборке.
  2. Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки R 1 {\displaystyle R_{1}} , и отдельно — на долю элементов второй выборки R 2 {\displaystyle R_{2}} , затем вычислить:

    U 1 = n 1 n 2 + n 1 ( n 1 + 1 ) 2 R 1 {\displaystyle U_{1}=n_{1}\cdot n_{2}+{\frac {n_{1}\cdot (n_{1}+1)}{2}}-R_{1}} ,
    U 2 = n 1 n 2 + n 2 ( n 2 + 1 ) 2 R 2 {\displaystyle U_{2}=n_{1}\cdot n_{2}+{\frac {n_{2}\cdot (n_{2}+1)}{2}}-R_{2}} ,
    если всё вычислено верно, то
    U 1 + U 2 = n 1 n 2 . {\displaystyle U_{1}+U_{2}=n_{1}\cdot n_{2}.} ,

  3. Определить значение U-статистики Манна-Уитни по формуле U = min { U 1 , U 2 } . {\displaystyle U=\min\{U_{1},U_{2}\}.}
  4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 {\displaystyle n_{1}} и n 2 {\displaystyle n_{2}} . Если полученное значение U {\displaystyle U} меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U {\displaystyle U} больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U {\displaystyle U} .
  5. При справедливости нулевой гипотезы критерий имеет математическое ожидание M ( U ) = n 1 n 2 / 2 {\displaystyle M(U)=n_{1}n_{2}/2} и дисперсию D ( U ) = n 1 n 2 ( n 1 + n 2 + 1 ) / 12 {\displaystyle D(U)=n_{1}n_{2}(n_{1}+n_{2}+1)/12} и при достаточно большом объёме выборочных данных ( n 1 > 19 , n 2 > 19 ) {\displaystyle (n_{1}>19,n_{2}>19)} распределён практически нормально.

Таблица критических значений

  • Critical Values for the Mann — Whitney U-Test. (не работает)
  • Расчет критических значений U-критерия Манна — Уитни для выборок больше 20 (N>20)

См. также

Примечания

  1. Проблемы статистического анализа в психологических исследованиях Архивная копия от 15 марта 2011 на Wayback Machine.

Литература

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. — 1947. — № 18. — P. 50—60.
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. — 1945. — P. 80—83.
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. — Л., 1973.
  • Сидоренко Е. В. Методы математической обработки в психологии. — СПб., 2002.