- Популярные непараметрические методы оценки достоверности различий
- Непараметрические критерии
- Общий обзор
- Различия между независимыми выборками
- Две независимые выборки: U-критерий Манна-Уитни и др.
- Несколько независимых групп: критерий Краскела-Уоллиса и др.
- Различия между зависимыми выборками
- Две зависимые выборки: критерий Вилкоксона и др.
- Несколько зависимых выборок
- В каком случае использовать параметрический, а в каком — непараметрический метод?
- Цель занятия
- Студент должен уметь
- Студент должен знать:
- Информационный материал
- Параметрические методы оценки достоверности
- Непараметрические методы оценки достоверности
- Ошибка репрезентативности
Популярные непараметрические методы оценки достоверности различий
Применение параметрических методов (T-критерий Стьюдента) правомерно при нормальном распределении количественного признака или большом объеме выборки. Если же имеются значительные отличия распределений признака от нормального или исследуемый признак является качественным, или варьирующие признаки выражаются не числами, а условными знаками (порядковые номера, индексы), то необходимо использовать непараметрические критерии, в основе которых лежит упорядочивание (ранжирование) значений по отношению друг к другу, типа «больше-меньше» или «лучше-хуже». Это разграничение значений не предполагает точных количественных соотношений, ограничений на параметры и вид распределения, т.е. для использования непараметрических критериев нужно меньше информации, чем для использования параметрических.
При этом сравниваются не члены ранжированных рядов, а их ранги, т.е. порядковые номера в ранжированных рядах. Наиболее популярными ранговыми критериями, применяемыми в статистических исследованиях, являются критерий Манна-Уитни (критерий однородности – непараметрический аналог непарного критерия Стъюдента), критерий Уилкоксона (непараметрический аналог парного критерия Стъюдента), F- критерий Фишера, Х –критерий Ван-дер-Вардена, критерий знаков Z.
В качестве примера рассмотрим алгоритмы реализации критерия знаков Z и критерия Уилкоксона.
Когда результаты исследования выражены не числами, а знаками «плюс» или «минус», для оценки различий между попарно связанными членами сравниваемых выборок можно применить критерий знаков Z. Смысл критерия Z сводится к следующему: если попарно связанные значения двух зависимых выборок не отличаются друг от друга, то количество положительных и отрицательных отличий окажется одинаковым. Если обнаружится значимое преобладание плюсовых, или минусовых разностей, то имеется положительное или отрицательное действие изучаемого фактора на результативный признак.
Аналогичную задачу сравнение двух зависимых выборок (при связи их членов общими условиями) можно решить с помощью рангового критерия Уилкоксона. По мощности этот критерий превосходит критерий знаков Z. Методика критерия Уилкокосона заключается в следующем: попарные разности, как положительные, так и отрицательные ранжируют в один общий ряд. Нулевые разности в расчет не принимаются, а все остальные независимо от знака распределяют так, чтобы наименьшая разность получила первый ранг. Затем находят сумму положительных и сумму отрицательных разностей. Меньшую сумму (без учета ее знака) используют в качестве фактически установленной величины критерия.
Источник
Непараметрические критерии
Общий обзор
Непараметрические методы разработаны для тех ситуаций, когда исследователь ничего не знает о параметрах исследуемой популяции (отсюда и название методов — непараметрические). Говоря более специальным языком, непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения интересующей величины.
Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными.
Непараметрические методы позволяют обрабатывать данные «низкого качества» из выборок малого объема с переменными, про распределение которых мало что или вообще ничего не известно.
По существу, для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп:
критерии различия между независимыми выборками
критерии различия между зависимыми выборками
критерии зависимости между переменными
Различия между независимыми выборками
Две независимые выборки: U-критерий Манна-Уитни и др.
Обычно, когда имеются две выборки (например, мужчины и женщины), которые вы хотите сравнить относительно среднего значения некоторой изучаемой переменной, вы используете t-критерий для независимых выборок.
Непараметрическими альтернативами параметрического критерия для двух независимых групп являются:
- U критерий Манна-Уитни
- Критерий серий Вальда-Вольфовица
- Двухвыборочный критерий Колмогорова-Смирнова
Рассмотрим U критерий Манна-Уитни подробнее:
Критерий Манна-Уитни проверяет гипотезу о статистической однородности двух выборок.
Обозначим закон распределения первой выборки X через F:
а второй выборки Y через G:
Законы F и G должны быть непрерывны.
Таким образом нулевая гипотеза записывается в виде
Действуя по стандартному алгоритму проверки гипотез , отклоняется на уровне значимости α, если |U| > Uкр
Если по крайней мере одна из групп имеет размер выборки более 15, то можно показать, что:
,
где ,
Несколько независимых групп: критерий Краскела-Уоллиса и др.
Если вы имеете несколько групп, то можете использовать Дисперсионный анализ (ANOVA).
Его непараметрическими аналогами являются:
- Ранговый дисперсионный анализ Краскела-Уоллиса
- Медианный тест
Рассмотрим критерий Краскела-Уоллиса подробнее:
Критерий Краскела-Уоллиса является расширением критерия Манна-Уитни и предназначен для сравнения распределений в k выборках.
H1: Распределения каждой из k выборок различны
Критерий Краскела-Уоллиса используется, когда невозможно сказать что-либо определенное об альтернативах , т.к. он свободен от распределения.
Число элементов в каждой i-й выборке ( i=1. k ) равно ni
Как было показано выше, Заменим наблюдения их рангами
, упорядочивая всю совокупность
в порядке возрастания.
Затем для каждой выборки необходимо вычислить суммарный и средний ранги:
Если между выборками нет систематических различий, то средние ранги не должны значительно отличаться от среднего, рассчитанного по всей совокупности
Значение последнего .
Здесь — общее число наблюдений.
Вычислим величины дисперсий для каждой выборки
Эти значения при в совокупности должны быть небольшими. Составляя общую характеристику, разумно учесть различия в числе наблюдений для разных выборок и взять в качестве меры отступления от чистой случайности величину
Эта величина называется статистикой Краскела-Уоллеса.
Множитель присутствует в качестве нормировочного для обеспечения сходимости распределения H и
с числом степеней свободы
.
Согласно стандартному алгоритму проверки гипотез, отвергается на уровне значимости α, если |H| >
кр
Различия между зависимыми выборками
Две зависимые выборки: критерий Вилкоксона и др.
Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке (например, математические успехи студентов в начале и в конце семестра), то обычно используется t-критерий для зависимых выборок.
Альтернативными непараметрическими тестами являются:
- Критерий Вилкоксона парных сравнений
- Критерий знаков
Рассмотрим подробнее Критерий Вилкоксона.
Итак, мы располагаем двумя зависимыми выборками. Сформулируем гипотезы:
H0: медиана разницы в популяции равна нулю
H1: медиана разницы в популяции не равна нулю.
Вычислим разности для каждой пары результатов.
Обозначим за n’ число ненулевых разностей.
Проранжируем положительные и отрицательные разности (кроме нулевых), чтобы наименьшая абсолютная величина (без учета знака) получила первый ранг.
Отдельно вычислим сумму рангов положительных и отрицательных разностей, меньшую из двух сумм без учета знака считают тестовой статистикой W данного критерия.
Согласно стандартному алгоритму проверки гипотез, отвергается на уровне значимости α, если |W|>Wкр
Если число ненулевых разностей n’>20, статистика W приближается к стандартному нормальному распределению z:
,
Несколько зависимых выборок
Если рассматривается более двух переменных, относящихся к одной и той же выборке, то обычно используется Дисперсионный анализ (ANOVA) с повторными измерениями.
Альтернативным непараметрическим методом является
- ранговый дисперсионный анализ Фридмана
- Q критерий Кохрена (последний применяется, например, если переменная измерена в номинальной шкале). Q критерий Кохрена используется также для оценки изменений частот (долей).
В каком случае использовать параметрический, а в каком — непараметрический метод?
Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики.
Дело в том, что когда выборки становятся очень большими, то выборочные средние подчиняются нормальному закону, даже если исходная переменная не является нормальной или измерена с погрешностью.
Непараметрические тесты имеют меньшую статистическую мощность (менее чувствительны), чем их параметрические конкуренты, и если важно обнаружить даже слабые отклонения, следует особенно внимательно выбирать статистику критерия.
Источник
Цель занятия
на основе применения метода оценки достоверности результатов исследования уметь перенести результаты выборочного исследования общественного здоровья, деятельности врачей и учреждений здравоохранения на генеральную совокупность.
Студент должен уметь
— определять достоверность результатов исследования с помощью ошибки репрезентативности интенсивного показателя и средней величины;
— определять доверительные границы средних и относительных вели-
— определять достоверность разности между двумя средними величинами, относительными показателями;
— выбирать способ оценки достоверности результатов исследования при решении ситуационной задачи, определять достоверность и делать соответствующие выводы.
Студент должен знать:
— определение «достоверность результатов исследования»;
— параметрические и непараметрические способы оценки достоверности результатов исследования;
— условия применения параметрического и непараметрических способов оценки достоверности результатов исследования;
— определение ошибки репрезентативности средней величины и интенсивного показателя, ее вычисление;
— понятие о критерии «t», его выбор в способе определения доверительных границ и оценку в способе достоверности разности результатов исследования.
Место проведения: аудитория кафедры общественного здоровья и организации здравоохранения с курсом медицинской информатики, дисплейный класс.
Мультимедийный проектор Ноутбук
Наглядный материал в виде мультимедийной презентации Персональный компьютер
Информационный материал
В практической и научно-практической работе врачи обобщают результаты, полученные как правило на выборочных совокупностях. Для более широкого распространения и применения, полученных при изучении репрезентативной выборочной совокупности данных и выводов надо уметь по части явления судить о явлении и его закономерностях в целом.
Учитывая, что врачи, как правило, проводят исследования на выборочных совокупностях, теория статистики позволяет с помощью математического аппарата (формул) переносить данные с выборочного исследования на генеральную совокупность. При этом врач должен уметь не только воспользоваться математической формулой, но сделать вывод, соответствующий каждому способу оценки достоверности полученных данных. С этой целью врач должен знать способы оценки достоверности.
Применяя метод оценки достоверности результатов исследования для изучения общественного здоровья и деятельности учреждений здравоохранения, а также в своей научной деятельности, исследователь должен уметь правильно выбрать способ данного метода. Среди методов оценки достоверности различают параметрические и непараметрические.
Параметрические методы оценки достоверности
называют количественные методы статистической обработки данных, применение которых требует обязательного знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.
Непараметрические методы оценки достоверности
являются количественные методы статистической обработки данных, применение которых не требует знания закона распределения изучаемых признаков в совокупности и вычисления их основных параметров.
Как параметрические, так и непараметрические методы, используемые для сравнения результатов исследований, т.е. для сравнения выборочных совокупностей, заключаются в применении определенных формул и расчете определенных показателей в соответствии с предписанными алгоритмами. В конечном результате высчитывается определенная числовая величина, которую сравнивают с табличными пороговыми значениями. Критерием достоверности будет результат сравнения полученной величины и табличного значения при данном числе наблюдений (или степеней свободы) и при заданном уровне безошибочного прогноза.
Таким образом, в статистической процедуре оценки основное значение имеет полученный критерий достоверности, поэтому сам способ оценки дос-
товерности в целом иногда называют тем или иным критерием по фамилии автора, предложившего его в качестве основы метода.
Применение параметрических методов
При проведении выборочных исследований полученный результат не обязательно совпадает с результатом, который мог бы быть получен при исследовании всей генеральной совокупности. Между этими величинами существует определенная разница, называемая ошибкой репрезентативности, т.е. это погрешность, обусловленная переносом результатов выборочного исследования на всю генеральную совокупность.
Ошибка репрезентативности
Средняя ошибка средней
где σ — среднеквадра-
арифметической величины опреде-
ляется по формуле:
n — число наблюдений
Ошибка относительного пока-
где p — показатель, вы-
зателя определяется по формуле:
раженный в %, ‰, %оо и т.д.
q = (100 — р), при p выраженном
или (1000 — р), при p выражен-
или (10000 — р), при p выра-
женном в %оо и т.д.
При числе наблюдений меньше 30 ошибки репрезентативности определяются соответственно по формулам:
Определение доверительных границ средних и относительных величин
Формулы определения доверительных границ представлены следующим образом:
для средних величин (М): М ген = М выб ± tm
для относительных показателей (Р): Р ген = Р выб ± tm
где М ген и Р ген — соответственно, значения средней величины и относительного показателя генеральной совокупности;
М вы6 и Р вы6 — значения средней величины и относительного показателя выборочной совокупности;
m — ошибка репрезентативности;
t — критерий достоверности (доверительный коэффициент).
Данный способ применяется в тех случаях, когда по результатам выборочной совокупности необходимо судить о размерах изучаемого явления (или признака) в генеральной совокупности.
Обязательным условием для применения способа является репрезентативность выборочной совокупности. Для переноса результатов, полученных при выборочных исследованиях, на генеральную совокупность необходима степень вероятности безошибочного прогноза (Р), показывающая, в каком
проценте случаев результаты выборочных исследований по изучаемому признаку (явлению) будут иметь место в генеральной совокупности.
При определении доверительных границ средней величины или относительного показателя генеральной совокупности, исследователь сам задает определенную (необходимую) степень вероятности безошибочного прогноза
Для большинства медико-биологических исследований считается достаточной степень вероятности безошибочного прогноза, равная 95%, а число случаев генеральной совокупности, в котором могут наблюдаться отклонения от закономерностей, установленных при выборочном исследовании, не будут превышать 5%. При ряде исследований, связанных, например, с применением высокотоксичных веществ, вакцин, оперативного лечения и т.п., в результате чего возможны тяжелые заболевания, осложнения, летальные исходы, применяется степень вероятности Р = 99,7%, т.е. не более чем у 1% случаев генеральной совокупности возможны отклонения от закономерностей, установленных в выборочной совокупности.
Заданной степени вероятности (Р) безошибочного прогноза соответствует определенное, подставляемое в формулу, значение критерия t, зависящее также и от числа наблюдений.
При n>30 степени вероятности безошибочного прогноза Р = 99,7% — соответствует значение t = 3, а при Р = 95,5% — значение t = 2.
При п ген ) при числе наблюдений больше 30
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у 36 обследованных водителей сельскохозяйственных машин через 1 ч работы составила 80 ударов в 1 минуту; σ = ± 6 ударов в минуту.
Задание: определить ошибку репрезентативности (m M ) и доверительные границы средней величины генеральной совокупности (М ген ).
1. Вычисление средней ошибки средней арифметической (ошибки репрезентативности) (m):
m = σ / √n = 6 / √36 = ±1 удар в минуту
2. Вычисление доверительных границ средней величины генераль-
ной совокупности (М ген ). Для этого необходимо:
o а) задать степень вероятности безошибочного прогноза (Р = 95
o б) определить величину критерия t. При заданной степени вероятности (Р=95%) и числе наблюдений меньше 30 величина критерия t, опре-
деляемого по таблице, равна 2 (t = 2). Тогда М ген = М выб ± tm = 80 ± 2×1 = 80 ± 2 удара в минуту.
Вывод. Установлено с вероятностью безошибочного прогноза Р = 95%, что средняя частота пульса в генеральной совокупности, т.е. у всех водителей сельскохозяйственных машин, через 1 ч работы в аналогичных условиях будет находиться в пределах от 78 до 82 ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в минуту возможна не более, чем у 5% случаев генеральной совокупности.
на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности (Р ген )
Условие задачи: при медицинском осмотре 164 детей 3 летнего возраста, проживающих в одном из районов городе Н., в 18% случаев обнаружено нарушение осанки функционального характера.
Задание: определить ошибку репрезентативности (m p ) и доверительные границы относительного показателя генеральной совокупности (Р ген ).
1. Вычисление ошибки репрезентативности относительного
m = √P x q / n = √18 x (100 — 18) / 164 = ± 3%
2. Вычисление доверительных границ средней величины генеральной совокупности (Р ген ) производится следующим образом:
o необходимо задать степень вероятности безошибочного прогноза (Р=95%);
o при заданной степени вероятности и числе наблюдений больше 30, величина критерия t равна 2 (t = 2). Тогда Р ген =
Р выб ± tm = 18% ± 2 х 3 = 18% ± 6%.
Вывод. Установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у детей 3 летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев.
Оценка достоверности разности результатов исследования
Данный способ применяется в тех случаях, когда необходимо определить, случайны или достоверны (существенны), т.е. обусловлены какой-то причиной, различия между двумя средними величинами или относительными показателями.
Обязательным условием для применения данного способа является репрезентативность выборочных совокупностей, а также наличие причинноследственной связи между сравниваемыми величинами (показателями) и факторами, влияющими на них.
Формулы определения достоверности разности представлены следующим образом:
для средних величин
для относительных показателей
где t — критерий достоверности, m 1 и m 2 — ошибки репрезентативности, М 1 и М 2 — средние величины, Р 1 и Р 2 — относительные показатели.
Если вычисленный критерий t более или равен 2 (t ≥ 2), что соответствует вероятности безошибочного прогноза Р равном или более 95% (Р ≥ 95%), то разность следует считать достоверной (существенной), т.е. обусловленной влиянием какого-то фактора, что будет иметь место и в генеральной совокупности.
При t Поэтому полученный критерий должен всегда оцениваться по от-
ношению к конкретной цели исследования.
на оценку достоверности разности средних величин
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у водителей сельскохозяйственных машин через 1 ч после начала работы составила 80 ударов в минуту; m = ± 1 удар в мин. Средняя частота пульса у этой же группы водителей до начала работы равнялась 75 ударам в минуту; m = ± 1 удар в минуту.
Задание: оценить достоверность различий средних значений пульса у водителей сельскохозяйственных машин до и после 1 ч работы.
Вывод. Значение критерия t = 3,5 соответствует вероятности безошибочного прогноза Р > 99,7%, следовательно можно утверждать, что различия в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.
на оценку достоверности разности относительных показателей
Условие задачи: при медицинском осмотре детей 3 летнего возраста в 18% (m = ± 3%) случаях обнаружено нарушение осанки функционального характера. Частота аналогичных нарушений осанки при медосмотре детей 4- летнего возраста составила 24% (m = ± 2,64%).
Источник