Показатели вариации и способы их расчета
Понятие вариации
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называются факторами. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные (случайные), которые на одни единицы совокупности могут оказывать влияние, на другие нет.
Вариация, порождаемая существенными факторами, носит систематический характер, т.е. наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи — один как причина (фактор), другой как следствие (результат) его действия. Точнее говоря, проявляется зависимость вариации одного признака от вариации другогоили от нескольких других.
Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.
Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации. Но систематическая вариация, если между признаками имеется довольно существенная связь, в конце концов пробивает себе дорогу через хаос случайных колебаний вариантов зависимого признака и проявляет себя.
Наличие вариации признаков, изучаемых статистикой явлений, ставит задачу определить меру вариации, ее измерение, найти соответствующие измерители — показатели, характеризующие размеры этой вариации, а также выявить сущность и методы вычисления определяющих ее факторов.
Показатели вариации и способы их расчета
Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Средняя применяется в качестве своего рода центра тяжести, вокруг которого происходит колебание, рассеяние значений признака. Исчислив среднюю арифметическую по данным вариационного ряда, мы не знаем о том, как отдельные значения изучаемого признака группируются вокруг средней. Для вариационного ряда важно изучать степень сплоченности всех отдельных значений признака вокруг его среднего значения, степень разбросанности этих значений, степень их колеблемости. Для этого в теории статистики используются показатели вариации.
Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. К относительным показателям вариации относятся: коэффициенты вариации, осцилляции, относительное линейное отклонение и др. Относительные показатели вычисляются как отношение абсолютных показателей вариации к средней величине.
1.Размах вариации (R)представляет собой разность между максимальным (xmax) и минимальным (xmin) значением признака исследуемой совокупности:
.
Размах вариации (амплитуда колебаний) дает лишь самое общее представление о размерах вариации, характеризует предел изменения значений признака в исследуемой совокупности. Этот показатель вариации обладает существенным недостатком: он характеризует только отклонения и не дает представление о распределении отклонений по все совокупности. Его величина определяется двумя крайними значениями признака, в то время как колеблемость последнего в целом складывается из всех его значений. Для анализа вариации необходим показатель, который бы отражал все колебания варьирующего признака и давал обобщенную его характеристику.
2. Среднее линейное отклонение ( )– это среднее из абсолютных отклонений значений признака от средней арифметической:
,
.
Поскольку сумма отклонений значений признака от средней величины равна нулю, приходится все отклонения брать по модулю.
Таково в среднем линейное отклонение вариантов признака от их средней величины. Если среднее линейное отклонение по сравнению со средней величиной признака небольшое, это свидетельствует о том, что данная совокупность в отношении нашего признака однородна, а средняя – типична. Таким образом, среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности.
3. Дисперсия – это среднее из квадратов отклонений индивидуальных значений признака от средней величины:
,
.
Математические свойства дисперсии
1) Дисперсия постоянной величины равна нулю:
.
2) Дисперсия не изменится, если все значения признака увеличить или уменьшить на некоторую постоянную величину А.
.
3) Если все значения варьирующего признака разделить (умножить) на одну и ту же величину h, то дисперсия уменьшится (увеличится) в h 2 раз.
,
.
4)Средний квадрат отклонений индивидуальных значений признака от любой величины А, отличающейся от средней арифметической (A ≠ ), всегда больше среднего квадрата отклонений, исчисленного от средней арифметической:
или
.
Средний квадрат отклонений при этом будет больше на вполне определенную величину – на квадрат разности средней от этой условно взятой величины А, т.е. на .
Другими словами, дисперсия от средней имеет свойство минимальности, т.е. она всегда меньше дисперсий, исчисленных от любых других величин.
или
.
В случае когда А приравнивается нулю и, следовательно, отклонения не вычисляются, формула принимает следующий вид:
, или
.
4.Среднее квадратическое отклонение находится как корень из дисперсии. Показывает (как и среднее линейное отклонение) на сколько в среднем индивидуальные значения признака отклоняются от средней арифметической:
,
.
5.Коэффициент вариации – это относительный показатель, исчисляемый как отношение среднего квадратического отклонения к средней арифметической:
.
Считается, что если коэффициент вариации превышает 33%, то совокупность нельзя признать качественно однородной. Если Kv ≤ 33%, то можно утверждать, что совокупность более или менее однородна, а следовательно, средняя, рассчитанная по такой совокупности, типична. Необходимость исчисления коэффициента вариации вызвана тем, что показатели вариации в абсолютных величинах, как правило, непосредственно несравнимы.
Пример. Рассчитать показатели вариации по имеющимся данным (табл. 8.1).
Таблица 8.1 – Распределение предприятий по объему продаж
Группа предприятий по объему продаж, млн.руб. | Число предприятий в группе |
1-5 | |
5-9 | |
9-13 | |
13-17 | |
17-21 | |
ИТОГО |
Алгоритм расчета показателей вариации следующий:
1) определим размах вариации:
R = 21 – 1 = 20 млн. руб.
2) найдем середину интервалов по исходным данным (xi) и запишем в табл. 8.2;
3) определим среднее значение по формуле средней арифметической взвешенной, для этого введем графу (xi fi):
млн. руб.
4) для расчета среднего линейного отклонения введем графы и
:
млн. руб.
Таково в среднем отклонение вариантов признака от их средней величины.
5) для расчета дисперсии введем графы и
:
.
6) рассчитаем дисперсию упрощенным способом, для этого введем графу ( ):
.
7) извлечем из дисперсии корень и получим среднее квадратическое отклонение:
млн. руб.
8) определим коэффициент вариации:
или 66%.
Kv > 33%, следовательно, изучаемая совокупность качественно неоднородна и рассчитанное среднее значение нетипично.
Таблица 8.2 – Расчет показателей вариации
Группа предприятий по объему продаж, млн.руб. | Число предприятий в группе, fi | Середина интервала, xi | xi fi | | | | | |
1-5 | 3,1 | 65,1 | 9,61 | 201,81 | ||||
5-9 | 0,9 | 9,9 | 0,81 | 8,91 | ||||
9-13 | 4,9 | 24,5 | 24,01 | 120,05 | ||||
13-17 | 8,9 | 17,8 | 79,21 | 158,42 | ||||
17-21 | 12,9 | 12,9 | 166,41 | 166,41 | ||||
ИТОГО | — | — | 130,2 | — | 655,6 |
Дата добавления: 2015-12-26 ; просмотров: 11316 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ
Источник
Тема 9 Показатели вариации
Показатели вариации в анализе взаимосвязей
Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.
Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Особое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.
Основными показателями, характеризующими вариацию, являются:
- размах вариации;
- среднее линейное отклонение;
- дисперсия;
- среднее квадратическое отклонение;
- коэффициент вариации.
1) Размах вариации
2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:
где –абсолютные значения отклонений отдельных вариантов xi от средней арифметической ; fi – частота.
3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:
4. Среднее квадратическое отклонение – корень квадратный из дисперсии:
. В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (руб., тыс., млн и т.д.). .
5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:
Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:
Таблица 9.1 ‑ Данные о продаже основных марок холодильников:
Модель | Цена ( $ ) | Объем продаж (шт.) | xifi | |
1 | Siemens | 1000 | 30 | 30000 |
2 | Bosch | 800 | 26 | 20800 |
3 | AEG Santo | 900 | 24 | 21600 |
4 | Miele KF | 1200 | 30 | 36000 |
5 | Gorenje | 870 | 20 | 17400 |
6 | Haier | 570 | 23 | 13110 |
7 | Samsung | 760 | 30 | 22800 |
8 | Zanussi | 700 | 20 | 14000 |
9 | Daewoo | 460 | 20 | 9200 |
10 | Beko | 650 | 25 | 16250 |
11 | Candy | 480 | 20 | 9600 |
10 | Whirpool | 470 | 21 | 9870 |
ИТОГО | 8860 | 289 | 220630 |
Рассчитаем размах вариации.
R= 1200-460=740$
Пример вычисления размаха вариации
Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.
Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.
Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.
Между индивидуальными отклонениями от средней и колеблемостью признака существует прямая зависимость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.
Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной
По приведенным выше данным определим средневзвешенную цену холодильника:
Далее рассчитаем дисперсию:
. Следует отметить, что дисперсия еще не дает представления об однородности совокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рассчитан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, насколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак. .
Рассчитаем среднее квадратическое отклонение
Вывод: Таким образом, цена каждой марки холодильника отклоняется от средней цены в среднем на 271,1 $
Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости какого-либо одного признака или для определения однородности совокупности рассчитывают относительные показатели.
Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.
Определим значение показателя вариации по вышеприведенным данным таблицы
Совокупность считается однородной, если V не превышает 33%.
Если V 25% – вариация сильная.
Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).
!! Следует отметить, что коэффициент вариации может быть более 100%, что, в частности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.
Изучая вариацию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.
При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подверженным влиянию).
Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индивидуальных значений признака, используют правило сложения дисперсий.
Общая дисперсия представляет собой сумму средней из виутригрупповой и межгрупповой и дисперсий:
Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.
Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.
Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рассчитывается отдельно по каждой j-ой группе.
Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:
Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:
Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении общей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчленения общей совокупности.
Теснота связи между факторным и результативным признаками оценивается на основе эмпирического корреляционного отношения:
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
Пример. На следующем условном примере исследуем зависимость объема выполненных работ от формы собственности проектно-изыскательских организаций.
Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности
Форма собственности | Количество предприятий | Итого | |
Государственная | 4 | 10,30,20,40 | 100 |
Негосударственная | 6 | 20, 40, 60, 20, 50, 50 | 240 |
Итого | 10 | 340 |
1) Определим средний объем работ для предприятий двух форм собственности.
2) Определим средний объем работ для каждой формы собственности.
3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.
4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.
Таблица 9.3. – Вспомогательная таблица
по группе
Пример. Средняя из внутригрупповых дисперсий
Пример. Межгрупповая дисперсия
На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:
Проверка закона сложения дисперсий: 54,0+189,8=243,8
Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фактора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.
Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:
Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика
Контрольные задания
- Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:
Возраст студентов, лет | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | Всего |
Число студентов | 20 | 80 | 90 | 110 | 130 | 170 | 90 | 60 | 750 |
Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.
2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.
Источник