Способ проверки научных гипотез

Способы проверки гипотез

Разработка и проверка гипотез — старый и испытанный метод исследования в науке. Его плодотворность почти столь же действен­на для общественных наук, как и в естествознании, хотя до недавнего времени этот метод в явном виде в социологии приме­нялся сравнительно редко.

Гипотезы вытекают из наших знаний, полученных ранее, и пред­ставляют собой определенные научные предположения, касающиеся еще неизвестных явлений. В этом смысле гипотезы представляют собой непосредственное расширение теории.

Ориентация социологического исследования на проверку точно сформулированных гипотез дает возможность при его проведении ограничиться проверкой лишь необходимых связей, т. е. Обратить внимание на наиболее существенные переменные. Ясно, насколько существенным является влияние качества гипотезы на успешность социологического исследования. Однако современное социологиче­ское исследование слишком дорогостояще, чтобы его плодотворность ставить в зависимость от эффективности какой-либо одной выдви­нутой гипотезы. Поэтому в исследовании конкретной проблемы всегда ориентируются на выдвижение ряда гипотез (или, точнее, ряда альтернативных гипотез), максимально исчерпывающих эту проблему.

В связи с этим важное значение приобретает степень, абстракт­ности гипотезы. Чрезмерно конкретная гипотеза, подчиняя себе программу и методику исследования, как правило, приводит к три­виальным результатам, в лучшем случае воспроизводящим ограни­ченные сведения, содержащиеся в самой гипотезе.

Проверка гипотез. С логической точки зрения процесс всесторонней практической проверки гипотезы выступает как процесс под­тверждения опытом следствий, вытекающих из этих гипотез. При­чем проверка должна проходить по каждому альтернативному пути» определенному основными гипотезами, которые могут быть и взаи­моисключающими, но обязательно представляющими собой логиче­ское целое со своими гипотезами-следствиями.

В то же время эмпирическое подтверждение каждого отдельного следствия основной гипотезы не может служить доказательством самой гипотезы — это неправомерный вывод от истинности след­ствия к истинности основания.

Возможно, что данное следствие вытекает не только из данной гипотезы, но и из какой-либо другой. Но чем большее число различных следствий гипотезы подтверждается опытом, тем меньше вероятность того, что все они могли быть выведены из другой гипотезы или гипотез. Марксистская творил наиболее эффективным средствам проверки истинности результатов исследования считает общественную практику, общественную деятельность людей. Поэтому ученый в своей всесторонней практической проверке гипотезы имеет делочем-то большим, чем простая сумма заключений от следствия к основанию, а именно с подтверждением опытом системы положе­ний, которые в своей совокупности объясняют широкий, круг явле­ний, предсказывают новые явления, связывают ранее считавшиеся несвязанными области и т. д.

В качестве самого сильного способа эмпирической проверки гипотезы выступает социальный эксперимент. Будучи наиболее на­дежным методом проверки гипотез, он в то же время предъявляет наиболее жесткие требования как к самим гипотезам, так и к инструментарию социологического исследования. Вследствие этого он пока нашел довольно ограниченное применение в рамках социоло­гии. Однако по мере углубления понимания социальных процессов вес экспериментальных методов возрастает.

Наибольшее распространение в социологии, получили статистические методы, позволяющие получить некоторые вероятностные оценки истинности предложенной гипотезы (например, когда говорят, что два признака коррелируют с r = 0,5, то обычно указывают, то это верно с вероятностью 1 —a, где a уровень значимости).

Обычный прием обоснования истинности гипотезы состоит в под­счете средних тенденций, нахождения коэффициентов взаимозави­симости и т. д. Однако на этом пути исследователя поджидает много неожиданностей.

М. Кендалл и А. Стьюарт 4 , анализируя данные исследования о преступности в шестнадцати больших городах США, нашли, что корреляция между степенью преступности (х1)измеряемой числом известных преступлений на тысячу жителей, и церковным членст­вом (х2), измеряемым числом членов церкви старше 13 лет из 100 ‘человек населения старше 13 лет оказалась равной 0,14. Очевидный вывод состоит в том, что религиозность удерживает от преступления. Однако более детальное исследование показывает другое.

Читайте также:  Основные способы прекращения прав собственности

В схему анализа вводится еще ряд переменных: х2—процент мужского населения, х3 процент мужчин иностранного происхож­дения среди всего населения, х4 —число детей до пятилетнего воз­раста на «1000 замужних женщин в возрасте от 15 до 44 лет. Уравнение регрессии относительно xt есть х —19,9 = 4,51(х2 — 49,2) — 0,88(х3 — 30,2) — 0,672(х4 — 48,14) + 0,63(х5 — 41,6), — некоторые коэффициенты корреляции равны: r15 = — 0,14; r15,3 = -0,03; r15,4= + 0,25; r15,34 = +0,23,

Из уравнения регрессии видно, что при фиксированных отдель­ных факторах величины х1 и х5 положительно связаны, т. е. церковное членство находится в положительной связи с преступностью.

Что же маскирует этот эффект, давая отрицательную корреляцию г15.

Прежде всего, если устранить влияние величины ж» (иностран­цы), корреляция r15,3 между преступностью и церковным членством будет близка к нулю. Эта же корреляция положительна, если устранить влияние х4 или х5 и х6.

Таким образом, введение ряда дополнительных переменных по­зволило выявить неадекватность прямого измерения связи и дока­зать справедливость исходного предположения о том, что церковная принадлежность не сдерживает преступности.

Использованный выше прием, широко известный как метод вве­дения контрольных переменных, касается вопроса о том, как в не экспериментальных ситуациях с помощью анализа статистических связей можно получить доказательства о наличии прямых и опосредованных причинных и сопутствующих связей и их напряженности.

Введение контрольной переменной внешне выступает как чисто эмпирическая, процедура поиска взаимосвязей однако на самом, деле она существенным образом опирается на априорную формули­ровку ряда альтернативных причинных моделей 5 . Таким образом, построение математических моделей может служить еще одним надежным методом проверки исходных гипотез. Редко случается так, что; отсутствуют случаи, не соответствующие гипотезе. В рам­ках социологического исследования этот факт не может служить основанием для опровержения того предположения, которое сфор­мулировано в гипотезе. Очевидно, неподтверждаемости одного из следствий может иметь в основном две причины — либо исходное предположение неверно, т. е. не соответствует действительности, либо ошибка может заключаться в неправильном выведении след­ствия из гипотезы, в неправильной интерпретации понятий, в каких-то иных логических ошибках, Допущенных в ходе работы над гипотезой.

Большую помощь в выявлении дополнительных факторов, кото­рые следует принять во внимание при анализе не подтвердившихся гипотез, И в повышении достоверности гипотез может оказать исследование случаев, отклоняющихся от общей закономерности.

Пример. Группа исследователей, применяя несложный метод, оценила до и после воздействия стимула эффективность одной пропагандистской акции 6 . Перед введением контрольного фактора были исследованы установки как экспериментальной, так и контрольной групп. Воздействию пропаганды подвергалась лишь эксперименталь­ная группа. Затем обе группы были исследованы вновь. В среднем в обеих группах, не было выявлено никаких изменений; В результате о том, что пропаганда повлияла на установки не подтвердилось. Однако был поставлен вопрос: если нет изменений в среднем, то что можно сказать об исключениях?

Исключения, т. е. те, кто изменил свои установки, были подвергнуты анализу, Оказалось, что в экспериментальной группе было много изменений, однако их не удалось сначала зафиксировать вследствие того, что у одинакового числа индивидов изменения произошли в обоих направлениях. Этот факт показал, что исходная гипотеза не была ошибочной, но требовала дальнейшего исследова­ния. В рассматриваемом случае также оказалось, что если разделить всех, кто изменил свои установки, на две группы (с противоположными ориентациями), то одна группа будет состоять преимуществен­но из мужчин, а другая — большей частью из женщин. Установление этого факта повлекло за собой необходимость изменения ги­потезы и повторной ее проверки.

Этот пример говорит о том, что в случае, если обнаружено много фактов несоответствия гипотезе, её необходимо либо отверг­нуть, либо модифицировать. Вместе с тем следует отличать гипотезу статистического характера от гипотезы, имеющей характер все­общности. Первую гипотезу может опровергнуть лишь значительное число противоречащих ей фактов, в то время как во втором достаточно единичного факта.

Читайте также:  Формовой способ выпечки это

Кроме того, анализ таких противоречащих гипотезе случаев иногда помогает в подборе более чувствительных показателей для нашего исследования.

Источник

Интуитивное объяснение проверки гипотез и p-значение

Привет, Хабр! Представляю вашему вниманию перевод статьи «An intuitive explanation of Hypothesis Testing and P-Values» автора Joos Korstanje.

Несколько лет назад я делал свою первую фриланс-работу по статистике для компании по доставке фруктов и овощей. Двадцать четыре часа в день поступающие продукты от фермеров до того, как были отправлены в супермаркеты, проходили через отдел по контролю за качеством. Выбор продуктов осуществлялся случайно работниками данного отдела.

В годовом отчёте они заметили, что качество в этом году ниже, чем качество в прошлом: разница составила примерно половину пункта по шкале от 1 до 10.

Потом пригласили меня. Я должен был ответить на вопрос:

Являются ли эти 0,5 пунктов существенной разницей?

Если вы не знаете статистику, то этот вопрос может показаться вам странным. Но не беспокойтесь: цель этой статьи показать вам как можно ответить на этот вопрос, используя проверку гипотез, также называемое статистическим выводом.

Игра в числа: вклад одного яблока

Представьте себе, что вы проверяете яблоко на предмет хорошее оно или плохое, используя случайную выборку яблок из очень большой коробки с яблоками. В изображении ниже мы видим реальный эффект размера выборки на измерения: эффект одного яблока очень существенен для маленьких выборок и становится менее и менее значимым, чем больше размер выборки.

Вклад одного яблока зависит от размера выборки.

Понимание влияния размера выборки — это первый базис для понимания проверки гипотез. Мы можем начать утверждать, что 0.5 на 2 яблоках будет как разница в 1 яблоко, очень маленькая. Но на 100 яблоках, 0.5 будет представлять собой разницу в 50 яблок: очень большая разница!

На малых выборках 0.5 пункта это небольшая разница, но на больших выборках 0.5 это разница большая.

Насколько большая должна быть выборка: проверка гипотез и значимость как ответ

Есть несколько способов, чтобы ответить на данный вопрос, но в этой статье я собираюсь погрузиться в статистический вывод или проверку гипотез.

Проверка гипотез — это семейство статистических методов используемых, чтобы понять, как выборка наблюдаемых объектов может использоваться, чтобы принять или отвергнуть заранее поставленную гипотезу. Проверка гипотез используется для решения многих задач, в основном в научных исследованиях и как ключевой метод в онлайн маркетинге (А\Б тестирование).

Математики разработали проверку гипотез таким образом, что существует определённая процедура для поиска истины.

Проверка гипотез позволяет только проверить гипотезы, но не разработать их.

Из коробки, в которой 100 яблок (назовём её генеральной совокупностью), мы возьмём выборку из 8 яблок. В этом году из 8 яблок 5 оказались гнилыми (62%), а в выборке прошлого года из 8 яблок было только 4 гнилых (50%). Мы хотим использовать проверку гипотез, чтобы определить стал ли процент гнилых яблок в этом году больше, чем в прошлом.

Проверка гипотез — это математическая альтернатива для измерения генеральной совокупности. Благодаря этим вычислениям мы можем обобщить измерения небольшой выборки на большую генеральную совокупность. Так мы проделываем меньше работы.

Случайно набранная выборка имеет такой же процент гнилых яблок, как и генеральная совокупность, при условии, что набранная выборка достаточно велика.

Математики придумали способ, как обобщить вывод, основанный на выборке, на генеральную совокупность.

Этот способ начинается с формулировки чёткой исследовательской гипотезы. К сожалению, математика работает только в том случае, если у нас уже есть представление о том, что мы хотим проверить.

Читайте также:  Признаки нервной регуляции по способам

Основная гипотеза для нашего примера:

Процент гнилых яблок в генеральной совокупности в этом году, больше чем в прошлом.

Фактическая проверка гипотезы

Математика проверки гипотез образует баланс между результатом измерений выборки с числом наблюдений. Результатом будет p-значение.

Эти вычисления проходят через использование распределений: почти для каждой воображаемой ситуации был выведен математический закон, который описывает ожидаемый результат.

Для вопросов вида «да/нет», таких как вопрос о наших гнилых яблоках (гнилые/не гнилые), применяется закон подбрасывания монетки. Это самый простой пример математического закона: 50% выпадения решки, 50% орла.

Также очень просто это может быть представлено, как стандартное математическое распределение, которое скажет нам о вероятности наблюдений. Для примера, 7 орлов выпало из 10 подбрасываний монетки. Это называется биноминальным распределением и может быть изображено так:


биноминальное распределение 10 подбрасываний монетки.

В этой статье я буду далек от тяжёлой математики, но важно знать, что мы можем использовать математические формулы для оценки того, является ли наблюдаемый процент далеким от ожидаемого процента.

В конце этой статьи я дам вам список часто используемых формул проверки гипотез для различных случаев и после объясню, как их использовать. Но сначала я объясню интерпретацию проверки гипотез.

Результат проверки гипотез: p-value

За проверкой гипотез есть математический баланс между наблюдаемыми значениями и размером выборки. В конце вычислений каждый существующий вариант тестирования гипотез выдаст стандартизированную оценку, которая позволит сравнить результат, даже когда математика не совсем одинакова.

P-value это стандартный способ, чтобы сформулировать результат проверки гипотез и использовать его в любых других тестах.

P-value это число между 0 и 1, которое говорит нам, если разница между нашим наблюдениями выборок, и наши гипотезы сильно различаются. Опорное значение – это 0.05.

Разница статистически значима, если p-value меньше 0.05.
И разница статистически не значима, если p-value больше 0.05.

Мы сделали 10 подбрасываний монетки.
Наша гипотеза: мы ожидаем 5 решек.
Наши наблюдения: мы получили 6 решек.
Вычисление p-value дало 0.518, что больше, чем 0.05.
Наш вывод: разница статистически не значима.
Наша интерпретация: результат соответствует гипотезе.

Мы сделали 10 подбрасываний монетки
Наша гипотеза: мы ожидаем 5 решек.
Наш результат: мы получили 10 решек.
Наше p-value — 0.0, что меньше чем 0.05.
Наше заключение: разница статистически значима
Наша интерпретация: результат не соответствует гипотезе.

Мы проверили 10 яблок.
Наша гипотеза: мы ожидаем 1 гнилое яблоко.
Наш результат: мы получили 1 гнилых яблок.
Наше p-value — 1.0 что больше, чем 0.05.
Наше заключение: разница статистически не значима
Наша интерпретация: результат соответствует гипотезе.

Мы проверили 10 яблок.
Наша гипотеза: мы ожидаем 1 гнилое яблоко.
Наш результат: мы получили 5 гнилых яблок.
Наше p-value — 0.0114 что меньше, чем 0.05.
Наше заключение: разница статистически значима
Наша интерпретация: результат не соответствует гипотезе.

Заключение

В этой статье я дал интуитивную интерпретацию общей структуры статистических погрешностей или проверки гипотез. Я надеюсь, что теперь вы лучше понимаете проверку гипотез, и чем она может быть вам полезна.

Я не уходил глубоко в математические доказательства и в специфичные детали. В таблице ниже приведен список самых частых проверок гипотез, которые я рекомендую для дальнейшего изучения.

Название теста Альтернативная гипотезе
Тест одной выборки Значение пременной отлично от ожидаемого значения
Тест двух выборок Значение двух групп различно
ANOVA Значение больше чем двух групп различно
Пропорциональная z проверка Процент успеха переменной из двух возможных вариантов отлично от ожидаемого значения
Двухпропарциаоная z-проверка Процент успеха переменной с двумя исходами различно между двумя группами

Список с альтернативными гипотезами для некоторых проверок гипотез.

Я надеюсь эта статья будет полезна для вас, и желаю вам удачи в дальнейших исследованиях проверки гипотез.

Источник

Оцените статью
Разные способы