Расчет численности групп на основе метода долевой перегруппировки
Таблица 3.3
Рис. 3.1. Схема долевой перегруппировки
Таблица 3.2
Таблица 3.1
Вторичная группировка, ее виды
Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того чтобы привести такие группировки к сопоставимому виду с целью сравнительного анализа, используется вторичная группировка, суть которой состоит в перегруппировке единиц объекта без обращения к первичным данным.
Вторичная группировка – это операция по образованию новых групп на основе ранее построенной группировки.
Выделяют два метода вторичной перегруппировки: 1) объединение первоначальных интервалов и 2) долевая перегруппировка (применение метода предполагает равномерное или близкое к нему распределение единиц внутри групп).
Пример 3.1. Имеются следующие данные о доходах населения за два года.
Доходы населения условной территории (1 год)
№ п/п | Группы населения по уровню доходов (руб.) | % к итогу |
1. | до 1000 | 15,4 |
2. | от 1000 до 3000 | 35,7 |
3. | от 3000 до 7000 | 30,4 |
4. | от 7000 до 10000 | 14,1 |
5. | 10000 и более | 4,4 |
ИТОГО |
Доходы населения условной территории (2 год)
№ п/п | Группы населения по уровню доходов (руб.) | % к итогу |
1. | до 1000 | 14,8 |
2. | от 1000 до 1500 | 20,4 |
3. | от 1500 до 3000 | 19,2 |
4. | от 3000 до 4000 | 20,6 |
5. | от 4000 до 5500 | 7,8 |
6. | от 5500 до 7500 | 5,3 |
7. | от 7500 до 10000 | 5,1 |
8. | 10000 и более | 6,8 |
ИТОГО |
Приведем группировки к сопоставимому виду используя метод долевой перегруппировки. Для удобства построим схему вторичной группировки.
Источник
Сводка и группировка статистических данных
3.2. Метод группировок в статистике
Под статистической группировкой понимается распределение единиц наблюдения по группам по одному или нескольким признакам. Эти признаки называются группировочными. В зависимости от задач исследования строят типологические, структурные и аналитические группировки.
Типологическая группировка представляет собой распределение единиц наблюдения качественно неоднородной совокупности по социально-экономическим типам, классам, качественно однородным группам. Например, распределение совокупности предприятий по формам собственности (табл. 3.1); отраслям экономики; размеру бизнеса — малые, средние и крупные предприятия (отнесение к ним идет сразу по нескольким критериям); банков — на государственные и коммерческие и т.д. Основная задача типологической группировки — идентификация и описание типов исследуемого явления. Число выделяемых групп определяется количеством типов, классов, однородных групп, т.д. самим характером явления.
Форма собственности | Число предприятий и организаций, тыс. |
---|---|
Государственная | 160 |
Муниципальная | 252 |
Собственность общественных и религиозных объединений (организаций) | 252 |
Частная | 3 838 |
Прочие формы собственности, включая смешанную российскую, иностранную, совместную российскую и иностранную | 265 |
Всего | 4 767 |
Источник: Россия в цифрах. 2006: Крат. стат. сб. / Росстат. М., 2006. С. 167.
При структурной группировке разделение единиц однородной совокупности на группы происходит с целью выявления ее структуры по одному из признаков. Например, распределение наемных работников по полу, возрасту; распределение предприятий по численности работающих и т.д. Примером структурной группировки являются данные табл. 3.2.
Стаж работы, лет | Число работников | Число работников в процентах к итогу |
---|---|---|
До 2 | 10 | 5 |
2-4 | 20 | 10 |
4-6 | 30 | 15 |
6-8 | 80 | 40 |
8 и более | 60 | 30 |
Итого | 200 | 100 |
Важную роль в статистическом анализе играют аналитические группировки. С их помощью определяют наличие связи между признаками и ее направление. При этом один из признаков является результативным, а другой — факторным. Результативный признак меняется под воздействием факторного признака.
При построении аналитической группировки в качестве группировочного признака всегда выбирают факторный признак. В каждой выделенной группе рассчитывают среднее значение результативного признака. Например, в табл. 3.3 компании сгруппированы по величине затрат на рекламу. В каждой группе определен средний размер товарооборота. Из таблицы видно, что чем больше внимания компании уделяют рекламе, тем значительнее результаты их деятельности, выражающиеся в объеме товарооборота.
Затраты на рекламу в год, млн руб. | Число компаний | Объем товарооборота в среднем на одну компанию, млн руб. |
---|---|---|
До 3 | 5 | 300 |
3-5 | 20 | 305 |
5-7 | 15 | 315 |
7 и более | 10 | 320 |
Итого | 50 | 311 |
Связь между признаками называется прямой , если с ростом значений факторного признака увеличиваются значения результативного признака. Связь является обратной, если увеличение значений факторного признака приводит к уменьшению значений результативного признака. В нашем примере рост затрат на рекламу вызвал увеличение объемов товарооборота, значит между этими признаками наблюдается прямая связь .
Наряду с группировками в статистическом анализе используются классификации. Классификация — это общепринятое, традиционно применяемое, часто официально установленное разбиение совокупности на группы, являющееся определенным стандартом, при котором единицам наблюдения предъявляются строгие требования относительно их соответствия той или иной группе. В основе классификаций лежит качественный признак. К наиболее известным относятся классификации отраслей экономики, административно-территориального деления, экономических регионов, видов экономической деятельности и др. Классификации не являются чем-то стабильным, в соответствии с экономическими и политическими изменениями меняются и они.
В зависимости от количества признаков, по которым проводится группировка, различают простые и сложные группировки. Если группировка проводится по одному признаку, то она называется простой (см. табл. 3.1, 3.2). Если единицы совокупности группируются сразу по двум или более признакам, то такая группировка называется сложной. При этом внутри групп, образованных по одному признаку, единицы совокупности подразделяются на подгруппы по другому признаку. Примером сложной группировки является группировка учащихся на потоке по двум признакам — полу и возрасту. Ее результаты могут быть представлены в виде таблицы (табл. 3.4).
Возраст, лет | Пол | Итого | |
---|---|---|---|
мужчины | женщины | ||
До 14 | 10 | 8 | 18 |
15 | 8 | 9 | 17 |
16 | 12 | 13 | 25 |
17 и более | 11 | 10 | 21 |
Итого | 41 | 40 | 81 |
Вторичная группировка данных. На практике часто возникают ситуации, когда по имеющимся сгруппированным данным требуется построить новую группировку. При этом, как правило, массив первичных данных оказывается недоступным. Тогда прибегают к методам вторичной группировки данных.
Вторичной группировкой называется перегруппировка уже сгруппированных данных без обращения к массиву первичных данных. Для этой цели применяются два подхода: объединение первоначальных интервалов, если границы новых и старых групп совпадают, и долевая перегруппировка данных при несовпадении границ.
Метод объединения первоначальных интервалов продемонстрируем на следующем примере. Предположим, что исходные данные представляют собой ряд, приведенный в табл. 3.5.
Номер интервала | Заработная плата, руб. | Численность работающих, чел. |
---|---|---|
1 | 2 000-3 000 | 16 |
2 | 3 000-4 000 | 40 |
3 | 4 000-5 000 | 65 |
4 | 5 000-6 000 | 58 |
5 | 6 000-7 000 | 44 |
6 | 7 000 и выше | 17 |
Итого | — | 240 |
Перегруппируем данные и образуем новые интервалы: «2000-4000», «4000-6000», «6000 и выше». Поскольку границы новых и старых интервалов совпадают, легко видеть, что в первый новый интервал «2000-4000» попадут работники первого и второго интервалов исходной группировки (16 + 40 = 56 чел.), во второй новый интервал — работники третьего и четвертого интервалов исходной группировки (65 + 58 = 123 чел.), в третий новый интервал — работники двух последних интервалов (44 + 17 = 61 чел.). Результаты перегруппировки представлены в табл. 3.6.
Номер интервала | Заработная плата, руб. | Численность работающих, чел. |
---|---|---|
1 | 2 000-4 000 | 56 |
2 | 4 000-6 000 | 123 |
3 | 6 000 и выше | 61 |
Итого | — | 240 |
Долевая перегруппировка базируется на принципе равномерности распределения единиц наблюдения внутри границ интервальных групп. В результате ее проведения рассчитывают, какая часть единиц наблюдения перейдет из старой интервальной группы в новую.
Пример 3.1. «Перегруппируем данные табл. 3.5 и образуем новые интервалы: «2000-3400»; «3400-4800»; «4800-6200»; «6200 и выше». Распределим единицы совокупности по новым интервалам.
В первый новый интервал войдут из исходной группировки все единицы первого интервала и часть единиц из второго интервала. Эту часть мы определяем следующим образом. Новая граница «3400» разбивает второй интервал на два отрезка: «3000-3400» и «3400-4000». Находим, какую долю составляет длина отрезка «3000-3400» от длины второго интервала. Она равна Значит, от 40 единиц, находившихся во втором интервале исходной группировки, следует взять для нового первого интервала 16 единиц
Тогда первый новый интервал будет содержать 32 единицы (16 + 16).
Во второй новый интервал войдут оставшиеся от второго интервала исходной группировки 24 единицы (40 — 16) и часть единиц из третьего интервала. Для этого мы находим, какую долю составляет отрезок «4000-4800» от длины третьего интервала «4000-5000». Она равна Значит, от 65 единиц следует взять для второго нового интервала 52 единицы
Итак, второй интервал новой группировки будет содержать 76 единиц (24 + 52).
В третий интервал вторичной группировки войдут оставшиеся 13 единиц (65 — 52 = 13) третьего интервала исходной группировки, все единицы ее четвертого интервала (58 ед.) и 9 единиц пятого интервала
В последний интервал новой группировки войдут оставшиеся 35 единиц (44 — 9 = 35) пятого интервала и все 17 единиц последнего интервала, т.е. 52 единицы (35 + 17).
При проверке правильности расчетов видим, что сумма единиц совокупности осталась равной 240.
Результаты вторичной группировки приведены в следующей таблице.
Источник