- Параметрическое оценивание закона распределения
- Методы параметрической статистики
- Параметрические процедуры статистического анализа данных
- Готовые работы на аналогичную тему
- Параметрическая статистика
- Непараметрические методы математической статистики
- 6.1 Параметрические критерии
- 6.1.1 Методы проверки выборки на нормальность
- 6.1.2 Критерий Стьюдента ( t-критерий)
- а) случай независимых выборок
- б) случай связанных (парных) выборок
- 6.1.3 F — критерий Фишера
- 6.2 Непараметрические критерии
- 6.2.1 Критерий знаков ( G-критерий)
Параметрическое оценивание закона распределения
Результаты предварительной обработки наблюдений случайной величины, дополненные сведениями о сущности изучаемого явления, зачастую оказываются достаточными для того, чтобы сформулировать гипотезу о модели закона распределения изучаемой случайной величины, нормальный ли этот закон, биномиальный или какой-либо другой. Используя наблюдения, можно найти оценки параметров предполагаемой модели, т.е. оценки входящих в модель числовых характеристик. Подставив в модель вместо параметров найденные оценки, получим оценку предполагаемой модели закона распределения, которая называется параметрической. Оценивание закона распределения, не требующее предварительного выбора его модели и оценивания входящих в неё параметров, называется непараметрическим. Примерами непараметрических оценок неизвестного закона распределения являются вариационный ряд, выборочная функция распределения и выборочная плотность распределения.
Рассмотрим два примера параметрического оценивания закона распределения: в первом примере случайная величина дискретна, во втором – непрерывна.
Пример 3. Дано случайное распределение успеваемости 100 студентов-заочников, сдававших четыре экзамена:
Число сданных экзаменов |
Число студентов |
Здесь случайной величиной является число сданных экзаменов среди четырёх. Обозначим её Х. Установим закон распределения этой величины.
Построим сначала его непараметрическую оценку. Величина Х – дискретная. Дискретный вариационный ряд, заданный столбцами 2 и 4 табл. 5, даёт непараметрическую оценку закона распределения числа сданных экзаменов среди четырёх сдаваемых.
Теперь сформулируем гипотезу о модели закона распределения случайной величины Х – числе сданных экзаменов среди четырёх сдаваемых. Процесс сдачи четырёх экзаменов представим как четыре испытания, относительно которых сделаем следующие допущения:
I | Число сданных экзаменов xi | Число студентов mi | Частость | pi теор = = | mi теор =npi теор | (mi – mi теор ) 2 | (mi – — mi теор ) 2 : :mi теор |
1 5 | 0,01 0,01 0,03 0,35 0,60 | 0,00021 0,00608 0,06691 0,32711 0,59969 | 0,021 0,608 7,32 6,691 32,711 59,969 | 5,382 5,239 0,001 | 0,735 0,160 0,000 | ||
Итого | n = 100 | 1,00 | 1,00000 | 0,895 |
— эти испытания независимы, т.е. вероятность сдачи любым студентом любого экзамена не зависит от того, будет сдано или нет любое количество других экзаменов;
— вероятность сдачи студентом любого отдельно взятого экзамена одна и та же и равна р, а вероятность «несдачи» равна (1 – р).
Конечно, эти допущения могут вызывать некоторые сомнения, но возможно, что они не будут противоречить результатам наблюдений. При этих допущениях мы имеем дело с испытаниями Бернулли и число сданных экзаменов среди четырёх сдаваемых будет иметь биномиальный закон распределения, т.е. вероятность того, что студент сдаст λ экзаменов, равна
Р(Х = х) = С4 х р х (1 – р) 4 – х , х = 0, 1, 2, 3, 4. (6)
Найдём оценку параметра р, входящего в модель (6). В условиях испытаний Бернулли состоятельной, несмещённой и эффективной оценкой вероятности является частость. В рассматриваемом примере р – вероятность того, что студент сдаст экзамен, поэтому частость р* этого события, учитывая, что имеются сведения об успеваемости 100 студентов, вычисляем следующим образом:
р* = =
=0,88.
Так как — это среднее число экзаменов, сданных одним студентом, то р* можно было бы определить и так:
р* = =
= 0,88.
Заметим, что если находить оценку параметра р в модели (6) методом максимального правдоподобия и при этом учесть, что число xi наблюдалось mi раз, то мы получили бы для р* такую же формулу, а именно
р*мп = .
Подставив в модель (6) вместо параметра р его оценку р*, получим параметрическую оценку неизвестного закона распределения числа сданных экзаменов, построенную в предположении, что допустима биномиальная модель
Теоретические вероятности pi теор и частоты mi теор , вычисленные в предположении, что имеет место модель (7), содержатся в столбцах 5 и 6 табл. 5. Поскольку различия между соответствующими числами столбцов 4 и 5 или между числами столбцов 3 и 6 небольшие, можно сделать предварительное заключение о приемлемости биномиальной модели. Графически это заключение подтверждается рисунком, на котором кривая вероятностей pi теор близка к кривой частостей pi*.
Метод более глубокого обоснования приемлемости той или иной модели называется критерием согласия.
Источник
Методы параметрической статистики
Вы будете перенаправлены на Автор24
Параметрические процедуры статистического анализа данных
Параметрическая статистика – это научная дисциплина, изучающая количественную сторону массовых общественных явлений, представленных в числовой форме, и выявляющая отношения между ними.
Основанием параметрических методов являются вполне вероятные предположения о характере распределения случайной величины. Чаще всего эти методы используются в анализе экспериментальных данных и предположении нормальности распределения этих данных.
Данное предположение имеет следствие – необходимость оценки исследуемых параметров распределения. Например, в t-тесте Стьюдента, оцениваемыми параметрами являются математическое ожидание и дисперсия.
Этот тест довольно часто используют для того, чтобы сравнить средние значения двух рядов данных на однородность или неоднородность. Кроме этого делается дополнительное предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях – данные извлечены были из них.
Метод параметрического анализа имеет достоинство, заключающееся в том, что обладает высокой мощностью, т.е. способностью избегать ошибки второго рода или β-ошибки.
Чем меньше ошибки второго рода, тем мощность теста будет выше.
Параметрические тесты требуют специальных метрических шкал для описания имеющихся данных. Интервальная шкала и шкала отношений, которую называют абсолютной шкалой, относятся к метрическим шкалам.
С помощью интервальной шкалы исследователь может выяснить отношения равенства или неравенства элементов выборки, может оценить эквивалентность интервалов.
Абсолютная шкала оценивает эквивалентность отношений между элементами множества, которые получают в ходе измерения.
Исходя из этого, метрические шкалы относятся к сильным измерительным шкалам, поэтому параметрические методы точно выражают различия в распределении случайной величины при условии истинности гипотез.
Готовые работы на аналогичную тему
Параметрические методы статистики применяются значительно шире, потому что в теории математической статистики они лучше разработаны. С другой стороны, использование методов параметрического анализа имеет свои трудности, которые состоят в том, что априорные предположения о характере исследуемых случайных величин, могут быть неверными.
Подобные случаи являются характерными для психологических исследований каких-либо ситуаций.
Использование параметрического теста Стьюдента может в какой-то степени исказить выводы – это может произойти тогда, когда сравниваются две выборки, и обнаруживается, что распределение данных отличается от нормального и дисперсии в двух выборках значительно разнятся.
Но, в большинстве случаев, некоторые отклонения от теоретически заданных предположений являются некритичными для окончательного статистического вывода, хотя серьезная угроза сохраняется.
Для смягчения жестких требований параметрических моделей, назначают специальные процедуры для коррекции принятия решения по поводу истинности статистических гипотез.
Параметрическая статистика
Параметрическая статистика является отраслью статистики и предполагает, что данные берутся из типа распределения вероятности и делаются выводы о параметрах распределения.
Основная часть известных элементарных статистических методов относится к параметрическим.
Рисунок 1. Статистические методы. Автор24 — интернет-биржа студенческих работ
Параметрическая статистика имеет постоянное число параметров и делает больше предположений. При правильности дополнительных предположений, параметрические методы дают более точные оценки.
При неправильности предположений параметрические методы могут исследователя ввести в заблуждение.
Параметрические формулы, однако, просты, их можно быстро записать и так же быстро вычислить.
Объем выборки, является одним из факторов, который ограничивает применение статистических критериев, основанных на предположении нормальности. Если выборка большая, допустим 100 и более наблюдений, то в этом случае выборочное распределение можно считать нормальным.
При малой выборке использовать параметрические критерии можно только при наличии уверенности в том, что переменная точно имеет нормальное распределение.
Методы параметрической статистики, которые рассматриваются во всех руководствах по статистике, относятся к рабочим инструментам в решении многих задач.
Для решения этих задач требуется большой статистический материал, что на практике оказывается недостаточно эффективно.
Гипотезы о законе распределения и согласования выборки проверяются при помощи различных критериев.
Параметрическая статистика предполагает наличие математической модели поведения рассматриваемых переменных и одно из них составляет группа статистики, предполагающая, что переменные происходят в основном из популяции, которая описывается функцией нормального распределения. Его удобство состоит в том, что оно имеет разработанную теорию, поэтому при проведении исследований легко обрабатывается.
Исследователя, чаще всего при решении прикладных задач методами математической статистики, интересуют значения восстанавливаемых параметров, поэтому методам параметрической статистики уделяется наибольшее внимание.
При использовании параметрических критериев заключение о случайности или неслучайности различий между выборочными совокупностями происходит на основании сравнения параметров распределений.
Каждый из этих параметров, отражает характерные свойства распределения данной случайной величины в виде единственного числа – это количественные меры этих свойств.
На практике рассматривают два параметра – среднее значение и дисперсию, но чаще всего, стандартное отклонение, которое является мерой вариации. Оба эти параметра имеют два популярных параметрических критерия:
- критерий Стьюдента,
- критерий Фишера.
Непараметрические методы математической статистики
Непараметрическими называются такие методы, при которых не происходит выдвижение каких-либо предположений о характере распределения исследуемых данных.
Кроме того, непараметрические методы не предполагают каких-либо допущений о соотношении параметров распределения анализируемых величин – в этом состоит основное достоинство непараметрических методов.
Преимущество непараметрической статистики полно раскрывается тогда, когда полученные в эксперименте результаты, оказываются представлены в слабой неметрической шкале, представляя собой результаты ранжирования.
Эта шкала носит название шкалы порядка.
В некоторых случаях исследователь может преобразовать данные к сильной интервальной шкале, используя при этом, процедуры нормализации данных. Но, в данной ситуации оптимальным вариантом является применение непараметрических тестов, созданных специально для статистического анализа.
Тесты непараметрической статистики, как правило, предполагают оценивание имеющихся отношений ранговых сумм в нескольких выборках, на основании чего формулируется вывод о соотношении этих выборок. Например, тест критерий знаков, критерий знаковых рангов Уилкоксона.
Если результаты измерения представить в более сильной шкале, то использование непараметрической статистики будет означать отказ от части информации, содержащейся в данных.
При этом следствием будет опасность возрастания ошибки второго ряда, свойственной этим методам.
Если сравнивать методы параметрической и непараметрической статистики, то вторые более консервативны и их использование в большей мере вызывает ошибки второго ряда, что означает – исследователь не может обнаружить отличия двух выборок, но они на самом деле имеют место.
Таким образом, непараметрические методы оказываются не такими мощными, поэтому их использование менее предпочтительно.
Источник
6.1 Параметрические критерии
В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о принадлежности двух выборок одной совокупности. Эти методы основываются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.
6.1.1 Методы проверки выборки на нормальность
Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:
1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;
2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.
3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;
4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:
а) — к интервалу должно относиться около 25% частоты совокупности,
— к интервалу должно относиться около 50% частоты совокупности,
— к интервалу должно относиться около 75% частоты совокупности,
— к интервалу должно относиться около 100% частоты совокупности.
6.1.2 Критерий Стьюдента ( t-критерий)
Критерий позволяет найти вероятность того, что оба средних значения в выборке относятся к одной и той же совокупности. Данный критерий наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности».
При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанныхдвухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.
Во втором случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.
а) случай независимых выборок
Статистика критерия для случая несвязанных, независимых выборок равна:
— средние арифметические в экспериментальной и контрольной группах,
— стандартная ошибка разности средних арифметических. Находится из формулы:
где n 1 и n 2 соответственно величины первой и второй выборки.
Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:
где n величина выборки.
Подсчет числа степеней свободы осуществляется по формуле:
При численном равенстве выборок k = 2 n — 2.
Далее необходимо сравнить полученное значение t эмп с теоретическим значением t—распределения Стьюдента (см. приложение к учебникам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.
Рассмотрим пример использования t -критерия Стьюдента для несвязных и неравных по численности выборок.
Пример 1. В двух группах учащихся — экспериментальной и контрольной — получены следующие результаты по учебному предмету (тестовые баллы; см. табл. 1).
Таблица 1. Результаты эксперимента
Первая группа (экспериментальная) N 1=11 человек
Вторая группа (контрольная)
12 14 13 16 11 9 13 15 15 18 14
13 9 11 10 7 6 8 10 11
Общее количество членов выборки: n 1=11, n 2=9.
Расчет средних арифметических: Хср=13,636; Y ср=9,444
Стандартное отклонение: s x=2,460; s y =2,186
По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:
Считаем статистику критерия:
Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).
Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное суждение в пяти случаях из ста (уровень значимости=5 % или 0,05).
Если полученное в эксперименте эмпирическое значение t превышает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе экспериментального обучения.
Здесь могут возникнуть такие вопросы:
1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.
2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.
3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав
средней арифметической экспериментальной группы, a
Отсюда следует вывод, что новый метод пока не проявил себя с хорошей стороны по разным, возможно, причинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о преимуществе традиционного метода.
б) случай связанных (парных) выборок
В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.
Вычисление значения t осуществляется по формуле:
Sd вычисляется по следующей формуле:
Число степеней свободы k определяется по формуле k= n -1. Рассмотрим пример использования t -критерия Стьюдента для связных и, очевидно, равных по численности выборок.
Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.
Пример 2. Изучался уровень ориентации учащихся на художественно-эстетические ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились беседы, выставки детских рисунков, были организованы посещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических соображений в таблице 2 приводятся результаты небольшого числа испытуемых.
Таблица 2. Результаты эксперимента
до начала эксперимента (Х)
Вначале произведем расчет по формуле:
Затем применим формулу (6), получим:
И, наконец, следует применить формулу (5). Получим:
Число степеней свободы: k =10-1=9 и по таблице Приложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтернативной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.
В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза Н0 отклоняется и принимается гипотеза Н1 .
6.1.3 F — критерий Фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух независимых выборок. Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фишера такова:
— дисперсии первой и второй выборки соответственно.
Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fэмп всегда будет больше или равно единице.
Число степеней свободы определяется также просто:
k 1=nl — 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k 2= n 2 — 1 для второй выборки.
В Приложении 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).
Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.
Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.
Решение. Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в таблице:
Рассчитав дисперсии для переменных X и Y, получаем:
Тогда по формуле (8) для расчета по F критерию Фишера находим:
По таблице из Приложения 1 для F критерия при степенях свободы в обоих случаях равных k =10 — 1 = 9 находим F крит=3,18 ( c следователь может утверждать, что по степени однородности такого показателя, как умственное развитие, имеется различие между выборками из двух классов.
6.2 Непараметрические критерии
Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.
6.2.1 Критерий знаков ( G-критерий)
Критерий предназначен для сравнения состояния некоторого свойства у членов двух зависимых выборок на основе измерений, сделанных по шкале не ниже ранговой.
Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (х i , у i ), где х i , у i — результаты двукратного измерения одного и того же свойства у одного и того же объекта.
В педагогических исследованиях объектами изучения могут служить учащиеся, учителя, администрация школ. При этом х i , у i могут быть, например, балловыми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства.
Элементы каждой пары х i , у i сравниваются между собой по величине, и паре присваивается знак «+», если х i i , знак «—», если х i > у i и «0», если х i = у i .
Нулевая гипотеза формулируются следующим образом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно различны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.
Статистика критерия (Т) определяется следующим образом:
допустим, что из N пар (х, у,) нашлось несколько пар, в которых значения х i и у i равны. Такие пары обозначаются знаком «0» и при подсчете значения величины Т не учитываются. Предположим, что за вычетом из числа N числа пар, обозначенных знаком «0», осталось всего n пар. Среди оставшихся n пар подсчитаем число пар, обозначенных знаком «-», т.е, пары, в которых xi yi . Значение величины Т и равно числу пар со знаком минус.
Нулевая гипотеза принимается на уровне значимости 0,05, если наблюдаемое значение T n — ta , где значение n — ta определяется из статистических таблиц для критерия знаков Приложения 2.
Пример 4. Учащиеся выполняли контрольную работу, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью формирования данного понятия у учащихся с низким уровнем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.
Результаты двукратного выполнения работы представляют измерения по шкале порядка (пятибалльная шкала). В этих условиях возможно применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допущения этого критерия.
Результаты двукратного выполнения работы (в баллах) 15 учащимися запишем в форме таблицы (см. табл. 1).
Источник