Способы вычисления коэффициента корреляции

Методы вычисления коэффициента корреляции.

Измерение связи между явлениями и/или признаками. Корреляционная связь. Методы определения коэффициента корреляции.

1. Виды связей между явлениями и признаками, краткая характеристика, примеры.

Фундаментальным свойством всех процессов и явлений в природе и в обществе является их взаимозависимость. Поиск причинно-следственных взаимодействий имеет огромное значение в практической деятельности врача, так как только при их учете можно воздействовать на причину болезни. Не устранив причину болезни невозможно добиться положительного клинического эффекта. При анализе статистической совокупности взаимосвязь между признаками рассматривается как пятое свойство в статистической совокупности.

Выделяют две формы связи между явлениями и признаками:

Функциональная связьхарактеризуется тем, что каждому значению одного признака соответствует строго определенное значение другого признака и изменение величины одного признака неизбежно вызывает совершенно определенные изменения величины другого признака. Выражением такого характера связи является математическая функция. Как правило, функциональная связь характерна для физико-химических явлений, наблюдаемых в неживой природе.

Например: пройденное расстояние функционально зависит от скорости и времени движения, площадь круга функционально зависит от радиуса, вес объекта функционально зависит от силы гравитации и т.д.

Корреляционная связьпроявляется при анализе сложных объектов и процессов, как правило, наблюдаемых в живой природе (растительный и животный мир, человек, общественные явления) и характеризуется тем, что каждому значению одного признака может соответствовать несколько значений другого признака.

Например: каждому значению роста может соответствовать несколько значений массы тела, при одинаковой дозе введенного лекарственного вещества наблюдается разный клинический эффект, длительность течения одного и того же заболевания у разных людей отличается и т.д.

2. Вычисление и оценка коэффициента корреляции по методу Пирсена.

Наличие или отсутствие корреляционной взаимосвязи между признаками определяется коэффициентом корреляции.

Методические требования к использованию коэффициента корреляции:

· измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом в совокупностях, однородных по полу и возрасту);

· расчет может производиться с использованием абсолютных или производных величин;

· для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется только при вычислении коэффициента корреляции по методу квадратов);

· число наблюдений менее 30.

Методы вычисления коэффициента корреляции.

Для вычисления коэффициента корреляции используются различные методы:

· рангов (ρ) или метод Спирмена;

· квадратов (r) или метод Пирсена;

· корреляционной решетки (η);

Критерий корреляции Пирсена – это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсена позволяет определить, есть ли линейная связь между изменениями значений двух переменных. В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.

Метод Пирсена применяется в тех случаях, когда необходимо более точное значение коэффициента корреляции при числе наблюдений до 100 единиц и признаки выражены в количественных показателях.

Читайте также:  Способы действий специальных подразделений

Рекомендации к применению метода квадратов (метод Пирсена):

§ когда требуется точное установление силы связи между признаками;

§ когда признаки имеют только количественное выражение.

Метод квадратов (метод Пирсена):

v построить вариационные ряды для каждого из сопоставляемых признаков, обозначив первый и второй ряд чисел соответственно х и у;

v определить для каждого вариационного ряда средние значения (М1 и М2);

v найти отклонения (dх и dy) каждого числового значения от среднего значения своего вариационного ряда;

v полученные отклонения перемножить (dx ⃰ dy);

v каждое отклонение возвести в квадрат и суммировать по каждому ряду (Σ dx² и dy²);

v подставить полученные значения в формулу расчета коэффициента корреляции:

при наличии вычислительной техники расчет производится по формуле:

По направлению корреляционная связь может быть:

· прямой (значение коэффициента корреляции положительное, имеет знак «+»);

· обратной (значение коэффициента корреляции отрицательное, имеет знак « – »).

Если связь между признаками прямая, то с увеличением значения одного признака наблюдается увеличение значения другого признака, или с уменьшением одного признака уменьшается другой признак. Например: при увеличении роста наблюдается увеличение массы тела; при снижении температуры тела наблюдается снижение частоты сердечных сокращений и т.д.

Если связь между признаками обратная, то с увеличением значения одного признака наблюдается уменьшение значения другого признака. Например: при увеличении повозрастных показателей смертности снижается показатель средней продолжительности предстоящей жизни, при увеличении охвата профилактическими прививками уменьшается уровень инфекционной заболеваемости и т.д.

Абсолютная величина коэффициента свидетельствует о силе корреляционной связи между изучаемыми признаками.

Источник

Расчет коэффициента корреляции

Методы расчета коэффициента корреляции

При изучении различных социально-экономических явлений выделяют функциональную связь и стохастическую зависимость. Функциональная связь — это такой вид связи, при которой некоторому взятому значению факторного показателя соответствует лишь одно значение результативного показателя. Функциональная связь проявляется во всех случаях исследования и для каждой определенной единицы анализируемой совокупности.

Размещено на www.rnz.ru

В том случае, когда причинная зависимость действует не в каждом конкретном случае, а в общем для всей наблюдаемой совокупности, среднем при значительном количестве наблюдений, то такая зависимость является стохастической. Частным случаем стохастической зависимости выступает корреляционная связь, при которой изменение средней величины результативного показателя вызвано изменением значений факторных показателей. Расчет степени тесноты и направления связи выступает значимой задачей исследования и количественной оценки взаимосвязи различных социально-экономических явлений. Определение степени тесноты связи между различными показателями требует определение уровня соотношения изменения результативного признака от изменения одного (в случае исследования парных зависимостей) либо вариации нескольких (в случае исследования множественных зависимостей) признаков-факторов. Для определения такого уровня используется коэффициент корреляции.

Читайте также:  Жидкая шпаклевка для авто новол способ применения

Линейный коэффициент корреляции был впервые введен в начале 90-х гг. XIX в. Пирсоном и показывает степень тесноты и направления связи между двумя коррелируемыми факторами в случае, если между ними имеется линейная зависимость. При интерпретации получаемого значения линейного коэффициента корреляции степень тесноты связи между признаками оценивается по шкале Чеддока, один из вариантов этой шкалы приведен в нижеследующей таблице:

Шкала Чеддока количественной оценки степени тесноты связи

Величина показателя тесноты связи Характер связи
До |±0,3| Практически отсутствует
|±0,3|-|±0,5| Слабая
|±0,5|-|±0,7| Умеренная
|±0,7|-|±1,0| Сильная

При интерпретации значения коэффициента линейной корреляции по направлению связи выделяют прямую и обратную. В случае наличия прямой связи с повышением или снижением величины факторного признака происходит повышение или снижение показателей результативного признака, т.е. изменение фактора и результата происходит в одном направлении. Например, повышение величины прибыли способствует росту показателей рентабельности. При наличии обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с динамикой факторного признака. Например, с повышением производительности труда уменьшается себестоимость единицы выпускаемой продукции и т.п.

Формула расчета коэффициента корреляции

В теории разработаны и на практике применяются различные модификации формул для расчета данного коэффициента. Общая формула для расчета коэффициента корреляции имеет следующий вид:

Формула расчета коэффициента корреляции

где r — линейный коэффициент корреляции.

Опираясь на математические свойства средней, общую формулу можно представить следующим образом, получив следующее выражение:

Формула расчета линейного коэффициента парной корреляции

Выполняя дальнейшие преобразование, можно получить следующие формулы вычисления коэффициента корреляции Пирсона:

Формула расчета коэффициента корреляции Пирсона

где n — число наблюдений.

Выполняя вычисление по итоговым данным для расчета показателя корреляции, его можно рассчитать с использованием следующих формул:

Пирсон онлайн

Методом расчета показателя корреляции является вычисление данного показателя с использованием его взаимосвязи с дисперсиями факторного и результативного признаков по следующей формуле:

Формула расчета коэффициента корреляции через дисперсии

Последние три приведенные формулы используются для изучения взаимосвязи между признаками в совокупностях незначительной величины — до 30 наблюдений.

Также показатель тесноты связи можно определить на основе его взаимосвязи с показателями уравнения регрессии, используя следующее отношение:

Формула расчета коэффициента корреляции через показатели регрессии

где аi — коэффициент регрессии в уравнении связи;

σхi — среднее квадратическое отклонение соответствующего статистически существенного факторного признака.

Линейный коэффициент корреляции несет в себе важную информацию для успешного изучения социально-экономических явлений и процессов, распределение которых близко к нормальному. Теоретически является обоснованным, что условие rxy = 0 является необходимым и достаточным для того, чтобы факторный и результативный признаки x и y являлись независимыми. При указанном условии, когда показатель корреляции равен нулю, показатели регрессии также имеют нулевые значения, а прямые линии регрессии у по х и х по у являются взаимно перпендикулярными на графике (параллельными: одна прямая — оси х, а другая прямая — оси y).

Читайте также:  Вещно правовые способы защиты других вещных прав

В том случае, когда rxy = 1, то это означает, что все точки (х, у) расположены на прямой и зависимость между х и у относится к функциональным. При указанном условии прямые линии регрессии совпадают. Указанное положение действует также в случае исследования трех и более показателей, если они подчинены закону нормального распределения.

В целом значение линейного показателя связи находится в диапазоне от — 1 до 1, т.е.: -1

Пример расчета коэффициента корреляции

Приведем пример расчета коэффициента корреляции Пирсона для значений, приведенных в следующей таблице. Для этого используем следующие данные (пример условный):

Значение показателя X Значение показателя Y
1,1 1,3
1,9 1,1
1,5 1,2
1,9 0,5
1,9 1,5
1,1 1,7
0,9 2
1 0,9
1,3 1,2
1,5 1,7

Количество наблюдений менее 30, поэтому в нашем примере для расчета парного коэффициента корреляции используем следующую формулу:

Для этого составим вспомогательную таблицу:

№ п/п X Y xy x 2 y 2
1 1,1 1,3 1,43 1,21 1,69
2 1,9 1,1 2,09 3,61 1,21
3 1,5 1,2 1,8 2,25 1,44
4 1,9 0,5 0,95 3,61 0,25
5 1,9 1,5 2,85 3,61 2,25
6 1,1 1,7 1,87 1,21 2,89
7 0,9 2 1,8 0,81 4
8 1 0,9 0,9 1 0,81
9 1,3 1,2 1,56 1,69 1,44
10 1,5 1,7 2,55 2,25 2,89
Итого 14,1 13,1 17,8 21,25 18,87

Методология вычисления: r = (17,8-14,1*13,1/10)/(√((21,25-14,1*14,1/10)*(18,87-13,1*13,1/10))) = -0,4389.

Полученное значение коэффициента корреляции Пирсона говорит о наличии обратной связи между X и Y. Величина коэффициента корреляции Пирсона показывает, что связь между X и Y слабая.

Онлайн калькулятор расчета коэффициента корреляции

В заключении приводим небольшой онлайн калькулятор расчета коэффициента корреляции онлайн, используя который, Вы можете самостоятельно выполнить расчет значения коэффициента корреляции Пирсона и получить интерпретацию рассчитанного значения. При заполнении формы калькулятора внимательно соблюдайте размерность полей, что позволит выполнить расчет коэффициента корреляции онлайн быстро и точно. В форме онлайн калькулятора уже содержатся данные условного примера, чтобы пользователь мог посмотреть, как это работает. Для определения значения показателя по своим данным просто внесите их в соответствующие поля формы онлайн калькулятора и нажмите кнопку «Выполнить вычисления». При заполнении формы соблюдайте размерность показателей! Дробные числа записываются с точной, а не запятой!

Онлайн-калькулятор расчета коэффициента корреляции:

Источник

Оцените статью
Разные способы