Теория статистики: конспект лекций
Данное учебное пособие предназначено для подготовки студентов экономических вузов к сдаче экзаменов. Издание содержит полный курс лекций по теории статистики, составленный профессиональными экономистами. Студентам предлагается ознакомиться с вопросами теории статистики. Рассматриваются методы статистического наблюдения, сводка, групировка данных, средней величины, показатели вариации, корреляционный и регрессивный анализы, анализ временных рядов, индексы, использование графического метода и многое другое. Издание предназначено для студентов, обучающихся по специальности «Статистика» и другим экономическим специальностям.
Оглавление
- ЛЕКЦИЯ № 1. Статистика как наука
- ЛЕКЦИЯ № 2. Статистическое наблюдение
- ЛЕКЦИЯ № 3. Сводка и группировка статистических данных
Приведённый ознакомительный фрагмент книги Теория статистики: конспект лекций предоставлен нашим книжным партнёром — компанией ЛитРес.
ЛЕКЦИЯ № 3. Сводка и группировка статистических данных
1. Основное содержание и задачи статистической сводки
Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве. Для получения сводной характеристики всего объекта при помощи обобщающих показателей нужно систематизировать и обобщить результаты, которые были получены в ходе статистического наблюдения. Это даст нам возможность выявить особенности и черты статистической совокупности в целом и отдельных ее составляющих, обнаружить закономерности изучаемых социально–экономических явлений и процессов. Данную систематизацию называют сводкой первичного статистического материала.
Второй этап статистической работы — статистическая сводка — это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом.
Статистическая сводка — это переход от единичных данных к сведениям о группах единиц и совокупности в целом.
Проведение сводки включает три этапа:
1) предварительный контроль — это проверка данных;
2) группировка данных по заданным признакам — это определение производных показателей;
3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.
Смысловая согласованность статистических сведений — это предварительный контроль. В соответствии с программой статистической сводки для того, чтобы в дальнейшем предоставить полученную информацию в доступном для восприятия виде, используется статистическая группировка данных.
Полученные результаты группировки оформляются в виде группировочных таблиц, содержащих сводную характеристику исследуемой совокупности по одному или нескольким признакам, которые взаимосвязаны логикой анализа. Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.
Простая статистическая сводка — это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.
Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.
Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.
Сложная статистическая сводка — это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц. На основе всестороннего теоретического анализа сущности и содержания изучаемых явлений и процессов проводится статистическая сводка. Программой и планом проведения статистической сводки обеспечивается достоверность и обоснованность ее результатов.
Программа статистической сводки содержит перечень групп на которые может быть разбита или разбивается совокупность единиц статистического наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей. От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:
1) выбирается группировочный признак для образования однородных групп;
2) определяется порядок формирования и число групп;
3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;
4) создаются макеты статистических таблиц для предоставления результатов сводки.
Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц.
Сводка также бывает децентрализованной и централизованной.
Децентрализованная статистическая сводка — это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.
Централизованная статистическая сводка — это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.
По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.
2. Сущность и классификация группировок
Научно обоснованное распределение на группы дает возможность сделать правильные выводы об изучаемой совокупности и происходящих в ней процессах.
Принципы научной группировки были изложены в работах В. И. Ленина. Статистическая группировка, как указывал В. И. Ленин, не является второстепенным вопросом. Она требует всестороннего социально–экономического анализа изучаемых явлений, Решающее значение в статистической группировке имеет правильный выбор группировочных признаков в соответствии с задачами статистического исследования. В основу группировки должны быть положены самые существенные, самые важные для изучаемого вопроса признаки, которые позволят выявить социально–экономические типы явлений. Блестящим примером применения статистических группировок для выявления социально–экономических типов может служить таблица из работы В. И. Ленина «Развитие капитализма в России».
Статистическая группировка — это один из основных этапов проведения статистического исследования.
Процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых статистических единиц в совокупности по определенным для них признакам называют статистической группировкой Важнейшим статистическим методом обобщения данных являются статистические группировки.
Источник
ТЕХНИКА И СПОСОБЫ СВОДКИ
ПОНЯТИЕ И СОДЕРЖАНИЕ СТАТИСТИЧЕСКОЙ СВОДКИ
Полученные в процессе статистического наблюдения данные характеризуют лишь отдельные элементы совокупности — ее единицы, но не изучаемую совокупность в целом. С их помощью без предварительной обработки данных нельзя сделать выводы об объекте в целом.
Для того чтобы выявить характерные черты этой совокупности и обнаружить связи между ее элементами, их закономерности, все собранные сведения (содержащиеся в документах первичного учета) необходимо систематизировать, подсчитать данные, расчленить по группам, соединить в целое, свести воедино, суммировать и подытожить результаты подсчетов. Это достигается на втором этапе статистического исследования — в статистической сводке.
Статистическая сводка представляет собой проверку, систематизацию, научную обработку материалов статистического наблюдения. Это, прежде всего, подсчет первичного статистического материала (например, карточек на лиц, совершивших преступления), подытоживание отдельных единиц и сведение их в массы или совокупности в целях получения обобщенной характеристики изучаемого явления по ряду существенных для него признаков (например, число несовершеннолетних, совершивших преступления).
Целью сводки является систематизация первичных данных и получение на этой основе сводной характеристики объекта исследования в целом при помощи обобщающих статистических показателей. То есть если при статистическом наблюдении собирают данные о тех или иных признаках каждой единицы совокупности, то результатом сводки являются подробные сведения, отражающие в целом всю совокупность.
Сводка в узком понимании представляет собой операцию по подсчету итоговых данных, характеризующих совокупность.
Сводка в широком понимании представляет собой научную обработку первичных статистических сведений, включает в себя группировки исследуемых явлений, получение системы показателей для характеристики типичных групп и подгрупп, подсчет групповых и общих итогов, внесение их в формы статистических таблиц.
Сводка статистических материалов осуществляется на основе научно разработанной программы.
Программа статистической сводки включает:
1. выбор группировочных признаков (например, вид преступления, способ совершения, время совершения пр.);
2. определение порядка формирования групп;
3. перечень показателей, которые надо подсчитать для характеристики групп и объекта в целом (например, количество преступлений, количество лиц, совершивших преступление и т.д.);
4. дифференциацию территориальных границ, в которых надо произвести разработку материала (область, край, республика и т.п.).
Содержание программы сводки определяется теми задачами, которые поставлены перед данным конкретным статистическим исследованием.
Так, сводка данных уголовно-правовой статистики должна дать все материалы, которые нужны как правоохранительным органам и органам юстиции (МВД, Прокуратуре, Верховному Суду, Минюсту), так и их структурам для определения количественно-качественных параметров правонарушений и эффективного управления процессом поддержания в стране режима законности.
ТЕХНИКА И СПОСОБЫ СВОДКИ
По технике исполнения различают первичную и вторичную сводку.
· Первичная сводка — отработка и подсчет первичных данных (по документам первичного учета), непосредственно собранных в процессе статистического наблюдения.
· Вторичная сводка — обработка и подсчет сведенных данных первичной сводки. Она производится по данным отчетности и специально организованных статистических наблюдений.
По форме обработки статистических данных сводка производиться:
· в централизованном порядке (первичные данные сосредоточиваются в одном центральном органе и обрабатываются только в нем);
· в децентрализованном порядке (документы первичного учета обобщаются на местах и в вышестоящий орган направляются уже в подытоженном виде);
· в смешанном порядке (обработка первичного материала происходит частично на местах и завершается полностью в вышестоящем государственном органе).
К достоинствам первого вида сводки относится возможность более легкого осуществления методологического руководства, использования квалифицированных кадров и обработки данных при помощи современных вычислительных средств.
Существенные ее недостатки — затруднения в исправлении ошибок первичных документов в необходимых случаях; замедленное получение некоторых итогов, важных для местных органов.
Децентрализованная сводка дает большую возможность, чем предыдущая, проверить на месте точность представленных данных и быстро получить необходимые итоговые данные.
Источник
Сводка и группировка данных
Поможем написать любую работу на аналогичную тему
Понятие сводки. Статистическая сводка – это научно организованная обработка материалов статистического наблюдения, ее целью является получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально–экономических явлений.
Статистические сводки различаются по ряду признаков:
— по сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала — это простая сводка. Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц;
— по способу разработки сводки делятся на централизованные, когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). При децентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности);
— по технике выполнения сводка подразделяется на механизированную и ручную.
Таким образом, статистическая сводка представляет собой систематизацию и группировку цифровых данных, характеристику образованных групп системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.
Метод группировки. Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.
Группировка – это разбиение совокупности на группы, однородные по какому–либо признаку. Особым видом группировки является классификация. Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация видов экономической деятельности, классификация основных фондов).
Отличительными чертами классификации являются: а) в основу кладется качественный признак, б) стандартность, в) устойчивость.
Метод группировки основан на двух категориях – группировочном признаке и интервале.
Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные – по качественному признаку и количественные.
Группировочные признаки классифицируются следующим образом:
— по форме выражения: атрибутивные, не имеющие количественного выражения (профессия, образование); количественные: 1) дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2) непрерывные – значения, которые могут быть как целые, так и дробные (возраст, рост);
— по характеру колеблемости: альтернативные, которыми одни единицы обладают, а другие нет (например, качество); имеющие множество количественных значений;
— по роли признака во взаимосвязи изучаемых явлений: факторные, воздействуют на другие признаки; результативные, испытывающие на себе влияние других.
После определения основания группировки необходимо найти количество групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Если в основу группировки положен количественный признак, то для нахождения оптимального числа групп используется формула Стерджесса:
n = 1 + 3,322 ln N ,
где n – число групп;
ln – натуральный логарифм;
N – количество элементов совокупности.
После определения числа групп следует определить интервалы группировки.
Интервал – представляет собой промежуток между максимальным и минимальным значениями признака в группе.
Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные интервалы в экономической практике используются чаще. При неравном интервале, ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величину равного интервала (h) можно найти по следующей формуле:
,
где – максимальное значение признака в совокупности;
– минимальное значение признака в совокупности.
Полученную по формуле величину округляют. Она является шагом интервала.
Существуют следующие правила определения шага интервала.
Если величина интервала представляет собой величину, имеющую один знак до запятой (например, 0,76; 1,585; 3,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала (0,8; 1,6; 3,8).
Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа (например, 14,532, это значение можно округлить до 15).
Если величина интервала представляет собой трех, четырехзначное число и так далее, то значение интервала можно округлить до ближайшего числа кратного 50 или 100. Например, 138 следует округлить до 150.
Существуют открытые и закрытые интервалы.
Открытые – это интервалы, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами. Например, до 5, менее 4,5 или 10 и более, свыше 105. Ширина открытого интервала принимается равной ширине смежного с ним интервала.
Закрытые, когда есть и нижняя и верхняя граница. Если в совокупности неделимые единицы, например, количество человек, комнат в квартире, то группы целесообразно формировать следующим образом 1–3, 4–7, 8–11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп, например, рост студента в сантиметрах 90–120, 120–150, 150–180.
Для выполнения статистических расчетов необходимо нахождение серединного значения интервала, его можно определить несколькими способами.
Суммируем верхнюю и нижнюю границу интервала и делим на 2.
К середине 2–го интервала прибавляем величину интервала.
От середины 2–го интервала минус величину интервала (для открытого).
К середине предпоследнего интервала прибавляем величину интервала (для открытых).
Виды статистических группировок. Существуют следующие виды группировок: типологическая, структурная, аналитическая и комбинированная.
Суть типологической группировки заключается в выделении из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Если атрибутивный признак, то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основе количественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0–2; дошкольный 3–6; школьный 7–17; трудоспособный 16–54 для женщин и 16–59 для мужчин. Типологические группировки широко применяются в исследовании социально–экономических явлений и процессов.
Структурная группировка – это группировка, используемая для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов и др.
Аналитическая группировка – используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенностями аналитической группировки являются следующие: во–первых, в основу кладется факторный признак; во–вторых, каждая выделенная группа характеризуется средними значениями результативного признака.
Комбинированная группировка – это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования, они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.
В зависимости от числа признаков, положенных в основание комбинированной группировки, ее делят на простую группировку, выполненную по одному признаку и сложную – производимую по двум и более признакам.
Вторичная группировка. Вторичной группировкой называется перегруппировка уже сгруппированного материала, без обращения к первичным данным.
К ней прибегают, когда из большого числа первоначально образованных групп надо получить меньшее число более крупных, когда в целях сравнения нужно привести в сопоставимый вид по–разному сгруппированный материал.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам, а также когда границы новых и старых интервалов совпадают.
Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.
Статистические таблицы. Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.
В статистических таблицах различают подлежащее и сказуемое. Подлежащим – является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.
Статистические таблицы могут быть простыми и сложными. К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов. В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.
Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми. При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.
К числу сложных таблиц относят корреляционные и балансовые таблицы.
Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по–разному.
Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называется сложной.
Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства». Применение комбинационных таблиц относится к более позднему периоду (1882).
Статистические графики. Статистический график – это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.
Основоположником графического метода в статистике считают английского экономиста У. Плейфейра. В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных.
Основные элементы графика включают в себя:
Поле графика – это место, на котором он выполняется.
Графический образ – это символические знаки, с помощью которых изображаются статистические данные.
Пространственные и масштабные ориентиры.
Экспликация графика – это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.
По способу построения графики делятся на диаграммы, картограммы, картодиаграммы.
Диаграмма представляет чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.
· Линейные диаграммы, для них применяется система прямоугольных координат. Достоинства в том, что на одном и том же графике можно изобразить несколько показателей, что важно для сравнения.
· Столбиковые диаграммы в них используется прямоугольная система координат. При этом каждое значение изучаемого показателя изображается в виде вертикального столбика. Основание выбирается произвольно, а высота соответствует изображаемым данным. Расстояние между столбиками должно быть одинаковым. Уровни показателя изображаются внутри столбика.
· Ленточные (полосовые) графики Основания столбиков располагаются вертикально, а масштабная линейка наносится на горизонтальную ось. Применяется в практике для систематического отображения хода выполнения производственных заданий нарастающих итогом.
· В круговых диаграммах площадь окружности принимается за величину всей изучаемой совокупности, а площади отдельных секторов отображают удельный вес (долю) ее составных частей. Необходимо иметь в виду, что 1% = 3,6°.
· Радиальная диаграмма строится на базе полярных координат. Началом отсчета в них служит центр окружности, а носителями масштабных шкал являются радиусы круга. Обычно в основе радиальных диаграмм лежат повторяющиеся годовые циклы с помесячным или поквартальными данными. Например, годовой цикл делится на 12 частей. На каждом радиусе в соответствии с установленным масштабом наносятся точки, соответствующие изучаемым за каждый месяц данным. Полученные таким образом точки, соединяют между собой линиями. В результате получается спиралеобразная линия, характеризующая внутригодовые циклы.
· В фигурных диаграммах данные изображаются рисунками – символами, которые в наибольшей степени соответствуют существу отображаемых явлений. Применяют для рекламы. В них каждому знаку–символу условно придается определенное числовое значение, и путем последовательного их расположения на поле графика формируются соответствующие полосы. Недостатком является то, что наряду с целыми фигурами приходится иметь дело с их частями.
· Знаки Варзара. Русский статистик В.Е.Варзар (1851-1940) предложил использовать прямоугольные фигуры для графического изображения трех показателей, один из которых является произведением двух других. В каждом прямоугольнике сумма прямоугольника равна величине третьего показателя, который равен произведению двух первых (например, стоимость это произведение цены за единицу продукции на количество этой продукции).
Картограмма – это схематичная карта или план местности, на которой отдельные территории в зависимости от величины изображаемого показателя обозначаются с помощью графических символов (штриховки, расцветки, точек).
Картодиаграмма – представляет собой сочетание контурной карты (плана) местности с диаграммой. В отличие от диаграммы, используемые геометрические символы располагаются по всей карте.
В настоящее время разработаны пакеты прикладных программ компьютерной графики такие как Statgraf , Supercalc, Exel.
Источник