Способы проверки гипотез
Разработка и проверка гипотез — старый и испытанный метод исследования в науке. Его плодотворность почти столь же действенна для общественных наук, как и в естествознании, хотя до недавнего времени этот метод в явном виде в социологии применялся сравнительно редко.
Гипотезы вытекают из наших знаний, полученных ранее, и представляют собой определенные научные предположения, касающиеся еще неизвестных явлений. В этом смысле гипотезы представляют собой непосредственное расширение теории.
Ориентация социологического исследования на проверку точно сформулированных гипотез дает возможность при его проведении ограничиться проверкой лишь необходимых связей, т. е. Обратить внимание на наиболее существенные переменные. Ясно, насколько существенным является влияние качества гипотезы на успешность социологического исследования. Однако современное социологическое исследование слишком дорогостояще, чтобы его плодотворность ставить в зависимость от эффективности какой-либо одной выдвинутой гипотезы. Поэтому в исследовании конкретной проблемы всегда ориентируются на выдвижение ряда гипотез (или, точнее, ряда альтернативных гипотез), максимально исчерпывающих эту проблему.
В связи с этим важное значение приобретает степень, абстрактности гипотезы. Чрезмерно конкретная гипотеза, подчиняя себе программу и методику исследования, как правило, приводит к тривиальным результатам, в лучшем случае воспроизводящим ограниченные сведения, содержащиеся в самой гипотезе.
Проверка гипотез. С логической точки зрения процесс всесторонней практической проверки гипотезы выступает как процесс подтверждения опытом следствий, вытекающих из этих гипотез. Причем проверка должна проходить по каждому альтернативному пути» определенному основными гипотезами, которые могут быть и взаимоисключающими, но обязательно представляющими собой логическое целое со своими гипотезами-следствиями.
В то же время эмпирическое подтверждение каждого отдельного следствия основной гипотезы не может служить доказательством самой гипотезы — это неправомерный вывод от истинности следствия к истинности основания.
Возможно, что данное следствие вытекает не только из данной гипотезы, но и из какой-либо другой. Но чем большее число различных следствий гипотезы подтверждается опытом, тем меньше вероятность того, что все они могли быть выведены из другой гипотезы или гипотез. Марксистская творил наиболее эффективным средствам проверки истинности результатов исследования считает общественную практику, общественную деятельность людей. Поэтому ученый в своей всесторонней практической проверке гипотезы имеет делочем-то большим, чем простая сумма заключений от следствия к основанию, а именно с подтверждением опытом системы положений, которые в своей совокупности объясняют широкий, круг явлений, предсказывают новые явления, связывают ранее считавшиеся несвязанными области и т. д.
В качестве самого сильного способа эмпирической проверки гипотезы выступает социальный эксперимент. Будучи наиболее надежным методом проверки гипотез, он в то же время предъявляет наиболее жесткие требования как к самим гипотезам, так и к инструментарию социологического исследования. Вследствие этого он пока нашел довольно ограниченное применение в рамках социологии. Однако по мере углубления понимания социальных процессов вес экспериментальных методов возрастает.
Наибольшее распространение в социологии, получили статистические методы, позволяющие получить некоторые вероятностные оценки истинности предложенной гипотезы (например, когда говорят, что два признака коррелируют с r = 0,5, то обычно указывают, то это верно с вероятностью 1 —a, где a — уровень значимости).
Обычный прием обоснования истинности гипотезы состоит в подсчете средних тенденций, нахождения коэффициентов взаимозависимости и т. д. Однако на этом пути исследователя поджидает много неожиданностей.
М. Кендалл и А. Стьюарт 4 , анализируя данные исследования о преступности в шестнадцати больших городах США, нашли, что корреляция между степенью преступности (х1)измеряемой числом известных преступлений на тысячу жителей, и церковным членством (х2), измеряемым числом членов церкви старше 13 лет из 100 ‘человек населения старше 13 лет оказалась равной 0,14. Очевидный вывод состоит в том, что религиозность удерживает от преступления. Однако более детальное исследование показывает другое.
В схему анализа вводится еще ряд переменных: х2—процент мужского населения, х3 — процент мужчин иностранного происхождения среди всего населения, х4 —число детей до пятилетнего возраста на «1000 замужних женщин в возрасте от 15 до 44 лет. Уравнение регрессии относительно xt есть х —19,9 = 4,51(х2 — 49,2) — 0,88(х3 — 30,2) — 0,672(х4 — 48,14) + 0,63(х5 — 41,6), — некоторые коэффициенты корреляции равны: r15 = — 0,14; r15,3 = -0,03; r15,4= + 0,25; r15,34 = +0,23,
Из уравнения регрессии видно, что при фиксированных отдельных факторах величины х1 и х5 положительно связаны, т. е. церковное членство находится в положительной связи с преступностью.
Что же маскирует этот эффект, давая отрицательную корреляцию г15.
Прежде всего, если устранить влияние величины ж» (иностранцы), корреляция r15,3 между преступностью и церковным членством будет близка к нулю. Эта же корреляция положительна, если устранить влияние х4 или х5 и х6.
Таким образом, введение ряда дополнительных переменных позволило выявить неадекватность прямого измерения связи и доказать справедливость исходного предположения о том, что церковная принадлежность не сдерживает преступности.
Использованный выше прием, широко известный как метод введения контрольных переменных, касается вопроса о том, как в не экспериментальных ситуациях с помощью анализа статистических связей можно получить доказательства о наличии прямых и опосредованных причинных и сопутствующих связей и их напряженности.
Введение контрольной переменной внешне выступает как чисто эмпирическая, процедура поиска взаимосвязей однако на самом, деле она существенным образом опирается на априорную формулировку ряда альтернативных причинных моделей 5 . Таким образом, построение математических моделей может служить еще одним надежным методом проверки исходных гипотез. Редко случается так, что; отсутствуют случаи, не соответствующие гипотезе. В рамках социологического исследования этот факт не может служить основанием для опровержения того предположения, которое сформулировано в гипотезе. Очевидно, неподтверждаемости одного из следствий может иметь в основном две причины — либо исходное предположение неверно, т. е. не соответствует действительности, либо ошибка может заключаться в неправильном выведении следствия из гипотезы, в неправильной интерпретации понятий, в каких-то иных логических ошибках, Допущенных в ходе работы над гипотезой.
Большую помощь в выявлении дополнительных факторов, которые следует принять во внимание при анализе не подтвердившихся гипотез, И в повышении достоверности гипотез может оказать исследование случаев, отклоняющихся от общей закономерности.
Пример. Группа исследователей, применяя несложный метод, оценила до и после воздействия стимула эффективность одной пропагандистской акции 6 . Перед введением контрольного фактора были исследованы установки как экспериментальной, так и контрольной групп. Воздействию пропаганды подвергалась лишь экспериментальная группа. Затем обе группы были исследованы вновь. В среднем в обеих группах, не было выявлено никаких изменений; В результате о том, что пропаганда повлияла на установки не подтвердилось. Однако был поставлен вопрос: если нет изменений в среднем, то что можно сказать об исключениях?
Исключения, т. е. те, кто изменил свои установки, были подвергнуты анализу, Оказалось, что в экспериментальной группе было много изменений, однако их не удалось сначала зафиксировать вследствие того, что у одинакового числа индивидов изменения произошли в обоих направлениях. Этот факт показал, что исходная гипотеза не была ошибочной, но требовала дальнейшего исследования. В рассматриваемом случае также оказалось, что если разделить всех, кто изменил свои установки, на две группы (с противоположными ориентациями), то одна группа будет состоять преимущественно из мужчин, а другая — большей частью из женщин. Установление этого факта повлекло за собой необходимость изменения гипотезы и повторной ее проверки.
Этот пример говорит о том, что в случае, если обнаружено много фактов несоответствия гипотезе, её необходимо либо отвергнуть, либо модифицировать. Вместе с тем следует отличать гипотезу статистического характера от гипотезы, имеющей характер всеобщности. Первую гипотезу может опровергнуть лишь значительное число противоречащих ей фактов, в то время как во втором достаточно единичного факта.
Кроме того, анализ таких противоречащих гипотезе случаев иногда помогает в подборе более чувствительных показателей для нашего исследования.
Источник
Интуитивное объяснение проверки гипотез и p-значение
Привет, Хабр! Представляю вашему вниманию перевод статьи «An intuitive explanation of Hypothesis Testing and P-Values» автора Joos Korstanje.
Несколько лет назад я делал свою первую фриланс-работу по статистике для компании по доставке фруктов и овощей. Двадцать четыре часа в день поступающие продукты от фермеров до того, как были отправлены в супермаркеты, проходили через отдел по контролю за качеством. Выбор продуктов осуществлялся случайно работниками данного отдела.
В годовом отчёте они заметили, что качество в этом году ниже, чем качество в прошлом: разница составила примерно половину пункта по шкале от 1 до 10.
Потом пригласили меня. Я должен был ответить на вопрос:
Являются ли эти 0,5 пунктов существенной разницей?
Если вы не знаете статистику, то этот вопрос может показаться вам странным. Но не беспокойтесь: цель этой статьи показать вам как можно ответить на этот вопрос, используя проверку гипотез, также называемое статистическим выводом.
Игра в числа: вклад одного яблока
Представьте себе, что вы проверяете яблоко на предмет хорошее оно или плохое, используя случайную выборку яблок из очень большой коробки с яблоками. В изображении ниже мы видим реальный эффект размера выборки на измерения: эффект одного яблока очень существенен для маленьких выборок и становится менее и менее значимым, чем больше размер выборки.
Вклад одного яблока зависит от размера выборки.
Понимание влияния размера выборки — это первый базис для понимания проверки гипотез. Мы можем начать утверждать, что 0.5 на 2 яблоках будет как разница в 1 яблоко, очень маленькая. Но на 100 яблоках, 0.5 будет представлять собой разницу в 50 яблок: очень большая разница!
На малых выборках 0.5 пункта это небольшая разница, но на больших выборках 0.5 это разница большая.
Насколько большая должна быть выборка: проверка гипотез и значимость как ответ
Есть несколько способов, чтобы ответить на данный вопрос, но в этой статье я собираюсь погрузиться в статистический вывод или проверку гипотез.
Проверка гипотез — это семейство статистических методов используемых, чтобы понять, как выборка наблюдаемых объектов может использоваться, чтобы принять или отвергнуть заранее поставленную гипотезу. Проверка гипотез используется для решения многих задач, в основном в научных исследованиях и как ключевой метод в онлайн маркетинге (А\Б тестирование).
Математики разработали проверку гипотез таким образом, что существует определённая процедура для поиска истины.
Проверка гипотез позволяет только проверить гипотезы, но не разработать их.
Из коробки, в которой 100 яблок (назовём её генеральной совокупностью), мы возьмём выборку из 8 яблок. В этом году из 8 яблок 5 оказались гнилыми (62%), а в выборке прошлого года из 8 яблок было только 4 гнилых (50%). Мы хотим использовать проверку гипотез, чтобы определить стал ли процент гнилых яблок в этом году больше, чем в прошлом.
Проверка гипотез — это математическая альтернатива для измерения генеральной совокупности. Благодаря этим вычислениям мы можем обобщить измерения небольшой выборки на большую генеральную совокупность. Так мы проделываем меньше работы.
Случайно набранная выборка имеет такой же процент гнилых яблок, как и генеральная совокупность, при условии, что набранная выборка достаточно велика.
Математики придумали способ, как обобщить вывод, основанный на выборке, на генеральную совокупность.
Этот способ начинается с формулировки чёткой исследовательской гипотезы. К сожалению, математика работает только в том случае, если у нас уже есть представление о том, что мы хотим проверить.
Основная гипотеза для нашего примера:
Процент гнилых яблок в генеральной совокупности в этом году, больше чем в прошлом.
Фактическая проверка гипотезы
Математика проверки гипотез образует баланс между результатом измерений выборки с числом наблюдений. Результатом будет p-значение.
Эти вычисления проходят через использование распределений: почти для каждой воображаемой ситуации был выведен математический закон, который описывает ожидаемый результат.
Для вопросов вида «да/нет», таких как вопрос о наших гнилых яблоках (гнилые/не гнилые), применяется закон подбрасывания монетки. Это самый простой пример математического закона: 50% выпадения решки, 50% орла.
Также очень просто это может быть представлено, как стандартное математическое распределение, которое скажет нам о вероятности наблюдений. Для примера, 7 орлов выпало из 10 подбрасываний монетки. Это называется биноминальным распределением и может быть изображено так:
биноминальное распределение 10 подбрасываний монетки.
В этой статье я буду далек от тяжёлой математики, но важно знать, что мы можем использовать математические формулы для оценки того, является ли наблюдаемый процент далеким от ожидаемого процента.
В конце этой статьи я дам вам список часто используемых формул проверки гипотез для различных случаев и после объясню, как их использовать. Но сначала я объясню интерпретацию проверки гипотез.
Результат проверки гипотез: p-value
За проверкой гипотез есть математический баланс между наблюдаемыми значениями и размером выборки. В конце вычислений каждый существующий вариант тестирования гипотез выдаст стандартизированную оценку, которая позволит сравнить результат, даже когда математика не совсем одинакова.
P-value это стандартный способ, чтобы сформулировать результат проверки гипотез и использовать его в любых других тестах.
P-value это число между 0 и 1, которое говорит нам, если разница между нашим наблюдениями выборок, и наши гипотезы сильно различаются. Опорное значение – это 0.05.
Разница статистически значима, если p-value меньше 0.05.
И разница статистически не значима, если p-value больше 0.05.
Мы сделали 10 подбрасываний монетки.
Наша гипотеза: мы ожидаем 5 решек.
Наши наблюдения: мы получили 6 решек.
Вычисление p-value дало 0.518, что больше, чем 0.05.
Наш вывод: разница статистически не значима.
Наша интерпретация: результат соответствует гипотезе.
Мы сделали 10 подбрасываний монетки
Наша гипотеза: мы ожидаем 5 решек.
Наш результат: мы получили 10 решек.
Наше p-value — 0.0, что меньше чем 0.05.
Наше заключение: разница статистически значима
Наша интерпретация: результат не соответствует гипотезе.
Мы проверили 10 яблок.
Наша гипотеза: мы ожидаем 1 гнилое яблоко.
Наш результат: мы получили 1 гнилых яблок.
Наше p-value — 1.0 что больше, чем 0.05.
Наше заключение: разница статистически не значима
Наша интерпретация: результат соответствует гипотезе.
Мы проверили 10 яблок.
Наша гипотеза: мы ожидаем 1 гнилое яблоко.
Наш результат: мы получили 5 гнилых яблок.
Наше p-value — 0.0114 что меньше, чем 0.05.
Наше заключение: разница статистически значима
Наша интерпретация: результат не соответствует гипотезе.
Заключение
В этой статье я дал интуитивную интерпретацию общей структуры статистических погрешностей или проверки гипотез. Я надеюсь, что теперь вы лучше понимаете проверку гипотез, и чем она может быть вам полезна.
Я не уходил глубоко в математические доказательства и в специфичные детали. В таблице ниже приведен список самых частых проверок гипотез, которые я рекомендую для дальнейшего изучения.
Название теста | Альтернативная гипотезе |
Тест одной выборки | Значение пременной отлично от ожидаемого значения |
Тест двух выборок | Значение двух групп различно |
ANOVA | Значение больше чем двух групп различно |
Пропорциональная z проверка | Процент успеха переменной из двух возможных вариантов отлично от ожидаемого значения |
Двухпропарциаоная z-проверка | Процент успеха переменной с двумя исходами различно между двумя группами |
Список с альтернативными гипотезами для некоторых проверок гипотез.
Я надеюсь эта статья будет полезна для вас, и желаю вам удачи в дальнейших исследованиях проверки гипотез.
Источник