Нормальное распределение свойства способы проверки

Нормальное распределение. Проверка распределения на нормальность

Распределение Гаусса. Значения моды, медианы и среднего равны

Нормальный закон распределения играет важнейшую роль в применении численных методов в психологии. Он лежит в основе измерений, разработки тестовых шкал, методов проверки гипотез.

Для проверки нормальности распределения используются различные процедуры, позволяющие выяснить, отличается ли от нормального выборочное распределение измеренной переменной.

Критерии асимметрии и эксцесса.

Эти критерии определяют допустимую степень отклонения эмпирических значений асимметрии и эксцесса от нулевых значений, соответствующих нормальному распределению. Допустимая степень отклонения — та, которая позволяет считать, что эти статистики существенно не отличаются от нормальных параметров. Величина допустимых отклонений определяется так называемыми стандартными ошибками асимметрии и эксцесса. Для формулы асимметрии (4.10) стандартная ошибка определяются по формуле:

Выборочные значения асимметрии и эксцесса значительно отличаются от нуля, если не превышают значения своих стандартных ошибок. Это можно считать признаком соответствия выборочного распределения нормальному закону. Следует отметить, что компьютерные программы вычисляют показатели асимметрии, эксцесса и соответствующие им стандартные ошибки по другим, более сложным формулам.

Графический способ (Q-QPlots, Р-Р Plots), Строят либо квантильные графики, либо графики накопленных частот. Квантильные графики (Q-Q Plots) строятся следующим образом. Сначала определяются эмпирические значения изучаемого признака, соответствующие 5, 10, 95-процентилю. Затем по таблице нормального распределения для каждого из этих процентилей определяются г-значения (теоретические). Два полученных ряда чисел задают координаты точек на графике: эмпирические значения признака откладываются на оси абсцисс, а соответствующие им теоретические значения на ординат. Для нормального распределения все точки будут лежать на одной прямой или рядом с ней. Чем больше расстояние от точек до прямой линии, тем меньше распределение соответствует нормальному.

График накопленных частот (Р-Р Plots) строятся подобным образом. На оси абсцисс через равные интервалы откладываются значения накопленных относительных частот, например 0,05; 0,1; 0,95. Далее определяются эмпирические значения изучаемого признака, соответствующие каждому значению накопленной частоты, которые пересчитываются в z-значения. По таблице нормального распределения определяются теоретические накопленные частоты (площадь под кривой) для каждого из вычисленных z-значений, которые откладываются на оси ординат. Если распределение соответствует нормальному, полученные на графике точки лежат на одной прямой.

Статистический критерий нормальности Колмогорова-Смирнова считается наиболее состоятельным для определения степени соответствия эмпирического распределения нормальному. Он позволяет оценить вероятность того, что данная выборка принадлежит генеральной совокупности с нормальным распределением. Если эта вероятность р 0,05, то делают вывод о приблизительном соответствии данного эмпирического распределения нормальному.

Причины отклонения от нормальности. Общей причиной отклонения формы выборочного распределения признака от нормального вида чаще всего является особенность процедуры измерения: используемая шкала может обладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости.

Таким образом, такие отклонения от нормального вида, как право- или левосторонняя асимметрия или слишком большой эксцесс (больше 0), связаны с относительно низкой чувствительностью измерительной процедуры в области моды (вершины графика распределения частот).

Читайте также:  Гайморит самые эффективные способы лечения

Последствия отклонения от нормальности. Следует отметить, что задача получения эмпирического распределения, строго соответствующего нормальному закону, нечасто встречается в практике исследования. Обычно такие случаи ограничиваются разработкой новой измерительной процедуры или тестовой шкалы, когда применяется эмпирическая или нелинейная нормализация для исправления эмпирического распределения. В большинстве случаев соответствие или несоответствие нормальности является тем свойством измеренного признака, который исследователь должен учитывать при выборе статистических процедур анализа данных.

В общем случае при значительном отклонении эмпирического распределения от нормального следует отказаться от предположения о том, что признак измерен в метрической шкале.

Источник

Нормальный закон распределения

Нормальный закон распределения случайной величины

Значение для исследований в области физической культуры и спорта (ФКиС)

Нормальное распределение случайной величины (гауссово распределение, распределение Гаусса, распределение Гаусса-Лапласа) – одно из непрерывных распределений, имеющее основополагающую роль в математической статистике. Причинами это являются:

  1. Многие эмпирические распределения можно успешно описать с помощью нормального закона распределения. Это чаще всего происходит в тех случаях, когда на показатель оказывает влияние большое число случайных факторов. При этом действие каждого фактора незначительно. Примерами показателей, которые распределяются по нормальному закону являются: рост, сила мышц, результаты в беге, прыжках, метаниях и др.
  2. Нормальное распределение обладает рядом благоприятных математических свойств, обеспечивших его широкое применение в статистике.
  3. Корректное использование критериев проверки статистических гипотез предполагает знание закона распределения экспериментальных данных. Так, например, использование t – критерия Стьюдента и F-критерия Фишера требует нормального распределения экспериментальных данных.
  4. Большинство экспериментальных распределений, полученных при исследованиях в области физической культуры и спорта может быть описано с помощью нормального распределения.

Однако в природе и в области ФКиС встречаются экспериментальные распределения, для описания которых модель нормального распределения малопригодна.

История изучения нормального распределения

Первые исследования по теории вероятностей проводили математик, механик, физик Блез Паскаль и математик Пьер Ферма в середине XVII века. Эти исследования выполнялись по просьбе Шевалье де Мере, азартного игрока в кости, который пытался понять природу выигрыша. В дальнейшем эти исследования заложили основы теории вероятностей (Дж. Гласс, Дж. Стэнли, 1976).

Дальнейшее развитие теория вероятностей получила в XVIII веке. В 1713 году была опубликована книга швейцарского математика Якоба Бернулли «Искусство предположений». В этой книге был рассмотрен ряд вопросов теории вероятностей. Якоб Бернулли ввёл значительную часть современных понятий теории вероятностей, а также изложил правила подсчёта вероятности для сложных событий и дал первый вариант «закона больших чисел», разъясняющего, почему частота события в серии испытаний не меняется хаотично, а в некотором смысле стремится к своему предельному теоретическому значению (то есть вероятности).

В последствии (в 1730 г.) шотландский математик Джеймс Стирлинг опубликовал формулу, аппроксимирующую произведение первых n чисел. Это позволило упростить решение ряда задач, которые встречаются в теории вероятностей. Однако все еще эти задачи оставались трудно разрешимыми.

Эту задачу решил английский математик Абрахам де Муавр. В работе «Доктрина случайностей», которая была издана в 1738 году он привел формулу, аппроксимирующую биномиальное распределение события, вероятность которого была равна 0,5 (рис.1). То есть он нашел уравнение кривой, проходящей через точки графика, изображенного на рис. 1. Эта была формула, которую впоследствии стали называть формулой нормального распределения вероятностей. Появление формулы нормального распределения значительно упростило расчеты вероятностей событий.

Читайте также:  Каменный уголь шахтный способ добычи

В начале XIX века (в 1812 г.) французский математик, механик, физик и астроном Пьер-Симон де Лаплас обобщил результаты А. Муавра для произвольного биномиального распределения.

Рис.1. Биномиальное распределение

Одновременно с П. Лапласом в 1809 году немецкий математик, механик, физик и астроном Карл Фридрих Гаусс в сочинении «Теория движения небесных тел» использовал формулу нормального распределения для описания случайных ошибок, возникающих в результате многократных измерений движений небесных тел. К.Ф. Гаусс внес настолько большой вклад в разработку теории нормального распределения, что впоследствии это распределение стали назвать гауссово распределение или распределение Гаусса-Лапласса.

В начале ХХ века бельгийский математик, астроном и социолог Адольф Кетле одним из первых применил нормальный закон распределения случайной величины к анализу биологических и социальных процессов. Изучая распределение солдат американской армии по росту, Адольф Кетле обратил внимание, что распределение роста подчиняется нормальному закону. Он писал: «…Человеческий рост, изменяющийся, по-видимому, самым случайным образом, тем не менее подчиняется самым точным законам, и эта особенность свойственна не только росту, она проявляется также в весе, силе, быстроте передвижений человека, во всех его физических … и нравственных способностях. Этот великий принцип… разнообразящий проявление человеческих способностей…кажется нам одним из самых удивительных законов мира» (А.Кетле, 1911).

В настоящее время нормальное распределение широко используется в биологии, медицине, экономике и других областях науки.

Более подробно о методах статистической обработки данных рассказано в книгах:

Формула нормального распределения

Формула, описывающая нормальный закон распределения случайной величины, имеет следующий вид:

где: μ — генеральное среднее арифметическое; σ — генеральное стандартное отклонение, е — основание натуральных логарифмов, приблизительно равное 2,719, π — число, приблизительно равное 3,142; xi — конкретное значение признака.

Пусть Вас не пугает эта формула. Сейчас мы с ней разберемся. Для начала давайте посмотрим, как выглядит график, построенный на основе этой формулы. Зададим значения μ=0 и σ=1. Хочу заметить, что μ и σ — это просто числа. Их еще называют параметрами распределения. Поэтому критерии, в формулу расчета которых входят параметры распределения называют параметрическими. Например, параметрическим критерием является t-критерий Стьюдента. В формулу расчета критерия Стьюдента входят параметры μ и σ. Кривая нормального распределения вероятностей имеет вид (рис.2).

Рис.2. График плотности вероятностей нормального распределения при μ=0 и σ=1.

Если мы поменяем параметры, то получим следующее. Изменение параметра μ будет сдвигать график вдоль оси Х. Например при μ=3 график сместится вправо вдоль оси Х (рис.3).

Рис.3. График плотности вероятностей нормального распределения при μ=3 и σ=1.

Если мы оставим μ=0 , а изменим параметр σ, например σ=3, то получим распределение с большим размахом (рис.4).

Рис.4. График плотности вероятностей нормального распределения при μ=0 и σ=3.

Читайте также:  Экстремальные способы экономии денег

Свойства нормального распределения

  1. Нормальная кривая имеет колокообразную форму, симметричную относительно точки x, с точками перегиба, абсциссы которых отстоят от µ на ±σ.
  2. Нормальное распределение полностью определятся двумя параметрами: значением генерального среднего (µ) и генерального стандартного отклонения (σ).
  3. Медиана и мода нормального распределения совпадают и равны µ.
  4. Коэффициенты асимметрии и эксцесса нормального распределения равны нулю.

Нормированное отклонение

В области математической статистики важное место занимает нормированное отклонение (t) – показатель, представляющий отклонение той или иной варианты от средней величины, отнесенное к значению стандартного отклонения. Нормированное отклонение рассчитывает по формуле:

Нормированное отклонение позволяет установить, на сколько «сигм» отклоняются варианты от среднего значения. Например, необходимо определить насколько «сигм» отклоняется значение роста человека, равное 180 см от среднего, если среднее арифметическое равно 170 см, а «сигма», то есть стандартное отклонение равно 10 см. Подставив эти значения в формулу, получим: t= (180-170)/10 = 1.

Ответ: значение роста человека, равное 180 см отклоняется от среднего на одну «сигму».

Нормированное нормальное распределение

Рис.5. Нормированное нормальное распределение роста мужчин с параметрами: µ=0; σ = 1.

Формула нормального распределения описывает целое семейство кривых, зависящих от двух параметров μ и σ, которые могут принимать любые значения. Поэтому возможно бесконечно много нормально распределенных совокупностей.

Чтобы избежать неудобств, связанных с расчетами для каждого конкретного случая в до компьютерную эпоху было предложено использовать нормированное (стандартное) нормальное распределение, для которого были составлены подробные таблицы. Нормированное нормальное распределение имеет параметры: µ=0; σ = 1 (рис.1, 5). Это распределение получается, если пронормировать нормально распределенную величину Х по формуле:

Для нормированного нормального распределения характерно, что в интервал µ± σ попадают 68 % всех результатов, в интервал µ± 2σ попадают 95% всех результатов, в интервал µ± 3σ попадают 99 % всех результатов.

В области физической культуры и спорта эти закономерности используют для разработки системы оценок. Так, В.М.Зациорским (рис. 6) предложено использовать следующую систему оценок результатов. Если результат, показанный спортсменом, попал в интервал от -2σ до -1σ — он получает низкую оценку (Рассчитать, в какой интервал попадает результат можно при помощи нормированного отклонения. Это описано выше). Если результат попал в интервал от -1σ до -0,5σ — оценка ниже средней. Средний результат соответствует интервалу от -0,5σ до -0,5σ, результат, получивший оценку выше среднего — от 0,5 до 1σ. Высокий результат попадает в интервал от 1σ до 2σ.

Критерии согласия

Чтобы проверить, соответствует ли распределение нормальному закону, существует много методов.

Можно использовать свойства нормального распределения (равенство среднего, моды и медианы).

Однако более точные результаты дают критерии согласия. В зависимости от объема выборки (n) следует использовать различные критерии:

  • если объем выборки небольшой (n = 10) – критерий Шапиро – Уилки;
  • если объем выборки более 40 — критерий хи-квадрат и критерий Колмогорова-Смирнова.
  • в статистическом пакете Statgraphics Centurion существует специальная опция — критерии проверки нормальности распределения. В этой опции есть 4 критерия, посредством которых можно сделать вывод о соответствии эмпирического распределения нормальному закону.

Источник

Оцените статью
Разные способы