Способы определения числа групп

Основные задачи и виды группировок. Методы определения числа групп и размера интервала.

Группировкой называется разделение множества единиц изучаемой совокупности на группы по отдельным существенным для них признакам.

ВИДЫ: !По ЦЕЛЯМ И ЗАДАЧАМ:

Типологическая группировка направлена на выделение социально-экономических типов. Примерами такого вида группировок могут быть группы предприятий по формам собственности, по формам хозяйствования, социальные группы населения и т.д.

Структурная группировка решает задачи по изучению структурного состава той или иной однородной совокупности, структурных изменений. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д., то есть изучаются закономерности общественных явлений.

Аналитическая группировка заключается в исследовании взаимосвязей между признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. Например, группировка предприятий определенной отрасли экономики по уровню производительности труда для выявления ее влияния на себестоимость продукции.

Ряд распределения – это ряд цифровых показателей, расположенных в определенной последовательности. Бывают ряды

2.1ранжированный ряд (упорядоченный по возрастанию или убыванию);

2.2дискретный ряд (построенный по прерывистым числовым данным);

2.3интервальный вариационный ряд (по непрерывным числовым данным).

!ПО ЧИСЛУ ГРУППИРОВАЧНЫХ ПРИЗНАКОВ:

— простая(по одному признаку)

!ПО УПОРЯДОЧЕННОСТИ ИСХОДНЫХ ДАННЫХ:

Интервал – это значение варьирующего признака лежащего в определенной границе.

Каждый интервал имеет нижнюю и верхнюю границы или одну из них. Если у интервала указана лишь одна граница, то это открытый интервала, а если обе – то закрытый. Закрытые интервалы подразделяются на равные и неравные, а также специализированные и произвольные.

Методы определения числа групп.Если в основании гр. положен атрибутивный признак, то кол-во гр. будет столько, сколько существует градации данного признака. Если в основании гр-ки положен количественный признак, то для определении групп следует исходить из степени колебленности признаков и особенности объекта и цели исследования. Также используют формулу Стерджесса: m=1+3,322LgN; m-кол-во гр. N-численность совокупности.

Определение интервала. Если вариация происходит в узких границах и распределение носит равномерный характер то строят группировку с разными интервалами: где i — величина равного интервала; Xmax- Xmin — амплитуда колебания признака; n — число групп.

Другие способы определения интервала:

1.Равномерный интервал: L=N/mL-численность ед-ц в гр.

2.Интервал меняющийся в ареметической прогрессии: а-const, к-номер интервала.

3.Интервал меняющийся в геометрич. прогрессии: q- const.

Источник

Определение числа групп и интервалов группировки

Тема. 3. Статистическая сводка и группировка

Понятие сводки и группировки

Определение числа групп и интервалов группировки

Статистический ряд распределения

4. Статистическая таблица

Понятие сводки и группировки

На основе информации собранной в ходе статистического наблюдения, как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Это связано с тем, что наблюдение дает сведения по каждой единице исследуемого объекта. Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей.

Читайте также:  Дезинфекция термометра медицинского максимального проводится способом

Сводка представляет комплекс последовательных действий по обобщению конкретных единичных данных, образующих совокупность, в целях выявления типических черт и закономерностей, присущих изучаемому явлению в целом.

Задача сводки охарактеризовать исследуемый объект с помощью системы статистических показателей, выявить и измерить таким путем его существенные черты и особенности.

Основой сводки является статистическая группировка, представляющая собой разделение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам.

С помощью метода группировок решаются следующие задачи:

– выделение социально-экономических типов явлений;

– изучение структуры явления и структурных сдвигов, происходящих в нем;

– выявление связи и зависимости между признаками изучаемых явлений.

По основным показательным задачам группировки подразделяются на типологические, структурные и аналитические группировки.

По степени сложности различают простые и комбинированные (комбинационные) группировки. Все группировки, производимые по одному признаку, называются простыми, по двум и более признакам – сложными или комбинированными.

При статистическом исследовании иногда приходится производить вторичную группировку, т. е. перегруппировывать статистический материал, уже сведенный в группы. Вторичная группировка может производиться путем сведения в новые группы по тому же признаку, по которому произведена первичная группировка статистических данных. В этом случае интервалы первичной группировки либо укрупняются, либо, наоборот, расчленяются.

Определение числа групп и интервалов группировки

Прежде чем приступить к группировке статистических данных, необходимо определить основание группировки, т.е. выделить группировочный признак. Группировочный признак – это признак, по которому проводится разбивка единиц совокупности на группы.

Образование групп и интервалов группировки, при правильном выбранном группировочном признаке зависит от цели исследования, от признака, положенного в основание группировки, и характера вариации. Количество образуемых групп в некоторых случаях определяется признаком, положенным в основание группировки. Так, выбор в качестве группировочных некоторых атрибутивных признаков сам по себе предопределяет решение вопроса о числе групп. Например, группировка населения по полу приводит к образованию всего лишь двух групп. Если же в основание группировки положен количественный признак, то возникает вопрос не только о числе групп, но и об интервалах – их характере (равные, неравные и др.) и величине.

Число групп можно ориентировочно определить по формуле Стерджесса:

, (1)

где N – число единиц в совокупности.

После определения числа групп следует определить интервалы группировки. Интервал – это значения признак, лежащие в определённых границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервал, называется наименьшее значение признака в нем, верхней – наибольшее. Закрытыми называются интервалы, у которых обозначены обе границы. Открытые – интервалы, у которых указана только одна граница: верхняя у первого, и нижняя у последнего. Величина интервала – это разность между верхней и нижней границей интервала.

Интервалы бывают равные и неравные. Величину интервала при группировке с постоянным интервалом определяют по формуле:

, (2)

где , – наибольшее и наименьшее значения признака в изучаемой совокупности;

– число выделяемых групп.

При построение группировок возникает вопрос, в какую группу включать единицы объекта, значения признака у которых совпадает с границами интервалов. В этом случае применяют следующие принципы: нижняя граница формируется по принципу включительно, а верхняя – исключительно или наоборот, а так же используют открытые интервалы.

Читайте также:  Способы разрешения проблемы отрицательных внешних эффектов

Пример. Требуется произвести группировку с равным интервалами предприятия по стоимости основных фондов, при этом максимальное значение признака 2040 тыс. ден. ед., минимальное – 290 тыс. ден. ед. Совокупность включает 80 предприятий.

1. Основные производственные фонды – группировочный признак.

2. Число групп определяем используя формулу (1):

.

3. Величину интервала определяем по формуле (2):

тыс. ден. ед.

4. Строим интервалы групп:

Таблица 1 – Варианты построения групп

№ группы Интервалы
I вариант II вариант
290–540 До 540
540–790 540–790
790–1040 790–1040
1040–1290 1040–1290
1290–1540 1290–1540
1540–1790 1540–1790
1790–2040 1790 и более

Особенность первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором варианте первая и последняя группы – это группы с открытыми интервалами.

Предприятия, например, со стоимость фондов 790 тыс. ден. ед. будет включено в третью группу, 1540 – в шестую и т.д.

Источник

Способы определения числа групп

1) Формула Стерджессадля определения оптимального числа групп для данной статистической совокупности.

2) на основе показателей , где среднеквадратическое отклонение среднее арифметическое (не взвешенное) :

Величина интервала 0,5 Величина интервала величина интервала
12 групп 9 групп 6 групп
От до от до от до
От до от до от до
От до от до от до
От до от до от до
От до от до от до
От до от до от до
От до от до
От до от до
От до от до
От до
От до
От до

После определения числа групп следует определить интервалы группировки.

Интервал – значения варьирующего признака, лежащие в определенных границах.

Пример.Требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2040 млн. руб., а минимальное его значение – 290 млн. руб. Совокупность включает 80 единиц. Согласно формуле она разбита на 7 групп. Найдем млн. руб. Определим величину интервала: млн. руб.

После этого построим интервалы групп (варианты построения групп, если в основу положен непрерывный признак):

№ групп 1 вариант 2 вариант
От 290 до 540 до 540
От 540 до 790 540 – 790
От 790 до 1040 790 – 1040
от 1040 до 1290 1040 – 1290
от 1290 до 1540 1290 – 1540
от 1540 до 1790 1540 – 1790
от 1790 до 2040 1790 и более
Закрытые интервалы первый и последний – открытые интервалы

Если в основу группировки положен дискретный признак, то варианты построения интервалов будут следующие:

№ групп 1 вариант 2 вариант
От 290 до 540 до 540
От 541 до 790 541 – 790
От 791 до 1040 791 – 1040
от 1041 до 1290 1041 – 1290
от 1291 до 1540 1291 – 1540
от 1541 до 1790 1541 – 1790
от 1791 до 2040 1791 и более

Неравные интервалыприменяют, если значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений.

Прогрессивно возрастающие или прогрессивно убывающиеинтервалы основаны на прогрессии:

для арифметической прогрессии;

Читайте также:  Тианде капсулы для волос зеленые способ

для геометрической прогрессии.

Пример:

№ групп интервалы
500 – 800
800 – 1300
1300 – 2000
2000 – 2900
2900 – 4000

Специализированные интервалыприменяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

Произвольные интервалытребуют упорядочения единиц совокупности по возрастанию группировочного признака (или по убыванию). В полученном ряду значений признака первые его значения объединяются в группу до тех пор, пока исчисленный для этой группы коэффициент вариации не станет равным 33%. Это будет свидетельствовать об образовании первой группы, которая исключается из исходной совокупности. Оставшаяся ее часть принимается за новую совокупность, для которой повторяется алгоритм образования новой группы. И так до тех пор, пока все единицы совокупности не будут объединены в группы.

Статистический ряд распределения– это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

Атрибутивные ряды распределенияпостроены по качественным признакам.

Пример: Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ в !994 г. (цифры условные)

№ группы Виды юридической помощи, оказанной адвокатами Число случаев юридической помощи
всего, тыс. В % к итогу
устные советы 69,43
Составление документов 13,47
Поручения по ведению уголовных дел 13,87
Поручения по ведению гражданских дел 3,23
Всего 100,00

Вариационные ряды распределенияпостроены по количественному признаку.

Варианты – отдельные значения признака, которое он принимает в вариационном раду.

Частоты –это численности отдельных вариантов или каждой группы вариационного ряда.

Частости –это частоты. выраженные в долях единицы или в процентах к итогу.

Дискретный вариационный ряд – построен по дискретному признаку.

Пример: Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ (по данным переписи населения).

№ группы группы семей, проживающих в квартирах с числом комнат число семей
всего, тыс. ед. в % к итогу
16,3
49,7
30,7
4 и более 3,3
Всего 100,0

Интервальный вариационный ряд – построен по непрерывному признаку.

Пример: Группировка населения России по размеру среднедушевого дохода в апреле 1994 г.

№ гр. Группы населения по размеру среднедушевого денежного дохода, тыс. руб. в месяц численность населения
всего, млн. чел. в % к итогу
до 40 2,4 1,6
40-80 23,4 15,8
80-120 34,8 23,5
120-160 29,4 19,8
160-200 20,7 13,9
200-240 13,5 9,1
240-280 8,7 5,9
280 и более 15,5 10,4
Всего 148,4

Полигониспользуется при изображении дискретных вариационных рядов.

Пример: распределение жилого фонда городского района по типу квартир (цифры условные)

№ групп Группы квартир по числу комнат число квартир, тыс. ед.
Всего

Пример: распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).

№ группы группы семей по размеру жилой площади, приходящейся на одного человека, м 2 число семей с данным размером жилой площади Накопленное число семей
3 – 5
5 – 7
7 – 9
9 – 11
11 – 13
Всего

Гистограммаприменяется для изображения интервального вариационного ряда.

Кумулята –кривая сумм накопленных частот.

Огнива – кривая сумм накопленных частот при перемене местами осей координат.

Источник

Оцените статью
Разные способы