Непараметрические способы оценки достоверности критерий вилкоксона

Содержание
  1. Библиотека постов MEDSTATISTIC об анализе медицинских данных
  2. Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
  3. Критерии и методы
  4. КРИТЕРИЙ УИЛКОКСОНА
  5. 1. История разработки критерия Уилкоксона для связанных выборок
  6. 2. Для чего используется критерий Уилкоксона?
  7. 3. Условия и ограничения применения Т-критерия Уилкоксона
  8. 4. Как рассчитать Т-критерий Уилкоксона для связанных выборок?
  9. 5. Как интерпретировать значение критерия Уилкоксона?
  10. Пример расчета критерия Уилкоксона для связанных выборок
  11. Непараметрические критерии
  12. Общий обзор
  13. Различия между независимыми выборками
  14. Две независимые выборки: U-критерий Манна-Уитни и др.
  15. Несколько независимых групп: критерий Краскела-Уоллиса и др.
  16. Различия между зависимыми выборками
  17. Две зависимые выборки: критерий Вилкоксона и др.
  18. Несколько зависимых выборок
  19. В каком случае использовать параметрический, а в каком — непараметрический метод?

Библиотека постов MEDSTATISTIC об анализе медицинских данных

Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic

Критерии и методы

КРИТЕРИЙ УИЛКОКСОНА

(также используются названия Т-критерий Уилкоксона, критерий Вилкоксона, критерий знаковых рангов Уилкоксона, критерий суммы рангов Уилкоксона) – непараметрический статистический критерий, используемый для сравнения двух связанных (парных) выборок по уровню какого-либо количественного признака, измеренного в непрерывной или в порядковой шкале.

Суть метода состоит в том, что сопоставляются абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

1. История разработки критерия Уилкоксона для связанных выборок

Тест был впервые предложен в 1945 году американским статистиком и химиком Фрэнком Уилкоксоном (1892-1965). В той же научной работе автором был описан еще один критерий, применяемый в случае сравнения независимых выборок.

2. Для чего используется критерий Уилкоксона?

Т-критерий Уилкоксона используется для оценки различий между двумя рядами измерений, выполненных для одной и той же совокупности исследуемых, но в разных условиях или в разное время. Данный тест способен выявить направленность и выраженность изменений — то есть, являются ли показатели больше сдвинутыми в одном направлении, чем в другом.

Классическим примером ситуации, в которой может применяться Т-критерий Уилкоксона для связанных совокупностей, является исследование «до-после», когда сравниваются показатели до и после лечения. Например, при изучении эффективности антигипертензивного средства сравнивается артериальное давление до приема препарата и после приема.

Читайте также:  Самый лучший способ варки кофе

3. Условия и ограничения применения Т-критерия Уилкоксона

  1. Критерий Уилкоксона является непараметрическим критерием, поэтому, в отличие от парного t-критерия Стьюдента, не требует наличия нормального распределения сравниваемых совокупностей.
  2. Число исследуемых при использовании T-критерия Уилкоксона должно быть не менее 5.
  3. Изучаемый признак может быть измерен как в количественной непрерывной (артериальное давление, ЧСС, содержание лейкоцитов в 1 мл крови), так и в порядковой шкале (число баллов, степень тяжести заболевания, степень обсемененности микроорганизмами).
  4. Данный критерий используется только в случае сравнения двух рядов измерений. Аналогом Т-критерия Уилкоксона для сравнения трех и более связанных совокупностей является Критерий Фридмана.

4. Как рассчитать Т-критерий Уилкоксона для связанных выборок?

  1. Вычислить разность между значениями парных измерений для каждого исследуемого. Нулевые сдвиги далее не учитываются.
  2. Определить, какие из разностей являются типичными, то есть соответствуют преобладающему по частоте направлению изменения показателя.
  3. Проранжировать разности пар по их абсолютным значениям (то есть, без учета знака), в порядке возрастания. Меньшему абсолютному значению разности приписывается меньший ранг.
  4. Рассчитать сумму рангов, соответствующих нетипичным сдвигам.

Таким образом, Т-критерий Уилкоксона для связанных выборок рассчитывается по следующей формуле:

где ΣRr — сумма рангов, соответствующих нетипичным изменениям показателя.

5. Как интерпретировать значение критерия Уилкоксона?

Полученное значение T-критерия Уилкоксона сравниваем с критическим по таблице для избранного уровня статистической значимости (p=0.05 или p=0.01) при заданной численности сопоставляемых выборок n:

  • Если расчетное (эмпирическое) значение Тэмп. меньше табличного Ткр. или равно ему, то признается статистическая значимость изменений показателя в типичную сторону (принимается альтернативная гипотеза). Достоверность различий тем выше, чем меньше значение Т.
  • Если Тэмп. больше Ткр., принимается нулевая гипотеза об отсутствии статистической значимости изменений показателя.

Пример расчета критерия Уилкоксона для связанных выборок

Фармацевтической компанией проводится исследование нового препарата из группы нестероидных противовоспалительных средств. Для этого отобрана группа из 10 добровольцев, страдающих ОРВИ с гипертермией. У них была измерена температура тела до и через 30 минут после приема нового препарата. Требуется сделать вывод о значимости снижения температуры тела в результате приема препарата.

Источник

Непараметрические критерии

Общий обзор

Непараметрические методы разработаны для тех ситуаций, когда исследователь ничего не знает о параметрах исследуемой популяции (отсюда и название методов — непараметрические). Говоря более специальным языком, непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения интересующей величины.

Читайте также:  Способ электролитического получения свинец

Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными.

Непараметрические методы позволяют обрабатывать данные «низкого качества» из выборок малого объема с переменными, про распределение которых мало что или вообще ничего не известно.

По существу, для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп:

критерии различия между независимыми выборками

критерии различия между зависимыми выборками

критерии зависимости между переменными

Различия между независимыми выборками

Две независимые выборки: U-критерий Манна-Уитни и др.

Обычно, когда имеются две выборки (например, мужчины и женщины), которые вы хотите сравнить относительно среднего значения некоторой изучаемой переменной, вы используете t-критерий для независимых выборок.

Непараметрическими альтернативами параметрического критерия для двух независимых групп являются:

  • U критерий Манна-Уитни
  • Критерий серий Вальда-Вольфовица
  • Двухвыборочный критерий Колмогорова-Смирнова

Рассмотрим U критерий Манна-Уитни подробнее:

Критерий Манна-Уитни проверяет гипотезу о статистической однородности двух выборок.

Обозначим закон распределения первой выборки X через F:

а второй выборки Y через G:

Законы F и G должны быть непрерывны.

Таким образом нулевая гипотеза записывается в виде

Действуя по стандартному алгоритму проверки гипотез , отклоняется на уровне значимости α, если |U| > Uкр

Если по крайней мере одна из групп имеет размер выборки более 15, то можно показать, что:

,

где ,

Несколько независимых групп: критерий Краскела-Уоллиса и др.

Если вы имеете несколько групп, то можете использовать Дисперсионный анализ (ANOVA).

Его непараметрическими аналогами являются:

  • Ранговый дисперсионный анализ Краскела-Уоллиса
  • Медианный тест

Рассмотрим критерий Краскела-Уоллиса подробнее:

Критерий Краскела-Уоллиса является расширением критерия Манна-Уитни и предназначен для сравнения распределений в k выборках.

H1: Распределения каждой из k выборок различны

Критерий Краскела-Уоллиса используется, когда невозможно сказать что-либо определенное об альтернативах , т.к. он свободен от распределения.

Число элементов в каждой i-й выборке ( i=1. k ) равно ni

Как было показано выше, Заменим наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания.

Затем для каждой выборки необходимо вычислить суммарный и средний ранги:

Если между выборками нет систематических различий, то средние ранги не должны значительно отличаться от среднего, рассчитанного по всей совокупности

Значение последнего .

Здесь — общее число наблюдений.

Читайте также:  12 способов использование чеснока

Вычислим величины дисперсий для каждой выборки

Эти значения при в совокупности должны быть небольшими. Составляя общую характеристику, разумно учесть различия в числе наблюдений для разных выборок и взять в качестве меры отступления от чистой случайности величину

Эта величина называется статистикой Краскела-Уоллеса.

Множитель присутствует в качестве нормировочного для обеспечения сходимости распределения H и с числом степеней свободы .

Согласно стандартному алгоритму проверки гипотез, отвергается на уровне значимости α, если |H| > кр

Различия между зависимыми выборками

Две зависимые выборки: критерий Вилкоксона и др.

Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке (например, математические успехи студентов в начале и в конце семестра), то обычно используется t-критерий для зависимых выборок.

Альтернативными непараметрическими тестами являются:

  • Критерий Вилкоксона парных сравнений
  • Критерий знаков

Рассмотрим подробнее Критерий Вилкоксона.

Итак, мы располагаем двумя зависимыми выборками. Сформулируем гипотезы:

H0: медиана разницы в популяции равна нулю

H1: медиана разницы в популяции не равна нулю.

Вычислим разности для каждой пары результатов.

Обозначим за n’ число ненулевых разностей.

Проранжируем положительные и отрицательные разности (кроме нулевых), чтобы наименьшая абсолютная величина (без учета знака) получила первый ранг.

Отдельно вычислим сумму рангов положительных и отрицательных разностей, меньшую из двух сумм без учета знака считают тестовой статистикой W данного критерия.

Согласно стандартному алгоритму проверки гипотез, отвергается на уровне значимости α, если |W|>Wкр

Если число ненулевых разностей n’>20, статистика W приближается к стандартному нормальному распределению z:

,

Несколько зависимых выборок

Если рассматривается более двух переменных, относящихся к одной и той же выборке, то обычно используется Дисперсионный анализ (ANOVA) с повторными измерениями.

Альтернативным непараметрическим методом является

  • ранговый дисперсионный анализ Фридмана
  • Q критерий Кохрена (последний применяется, например, если переменная измерена в номинальной шкале). Q критерий Кохрена используется также для оценки изменений частот (долей).

В каком случае использовать параметрический, а в каком — непараметрический метод?

Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики.

Дело в том, что когда выборки становятся очень большими, то выборочные средние подчиняются нормальному закону, даже если исходная переменная не является нормальной или измерена с погрешностью.

Непараметрические тесты имеют меньшую статистическую мощность (менее чувствительны), чем их параметрические конкуренты, и если важно обнаружить даже слабые отклонения, следует особенно внимательно выбирать статистику критерия.

Источник

Оцените статью
Разные способы