Математические свойства дисперсии.
1. Дисперсия, рассчитанная по отношению к средней величине, является минимальной.
2. Дисперсия постоянной величины равна 0.
3. Если все значения признака (варианты) увеличить (уменьшить) на какое-то постоянное число А, то дисперсия новой совокупности не изменится.
4. Если все значения признака (варианты) увеличить (умножить) в К раз, где К – постоянное число, то дисперсия новой совокупности увеличится (уменьшится) в К 2 раз.
5. Если вычислена дисперсия по отношению к числу В, отличному от средней величины, то дисперсию исходной совокупности можно рассчитать по формуле: .
6. Дисперсию исходной совокупности можно рассчитать как разность между средней квадратов признака и квадратом средней величины.
Расчет дисперсии способом моментов.
Возраст депутата (полных лет) (X) | Численность депутатов (кол-во человек) (ƒ) | Середины интервалов (X) | X-24,5 | | | |
20-29 | 24,5 | |||||
30-39 | 34,5 | |||||
40-49 | 44,5 | |||||
50-59 | 54,5 | |||||
60-69 | 64,5 | |||||
Итог: |
В этом случае дисперсия рассчитывается по формуле , где i – величина равного интервала или любое постоянное число, отличное от 0; m1— момент первого порядка, m2 – момент второго порядка, который рассчитывается по формуле:
.
А=24,5; i=10; ;
=10 2 (6,22-2,317 2 )=85,15
Расчет дисперсии методом средних.
Этот способ расчета основан на использовании последнего свойства дисперсии.
Возраст депутата (полных лет) (X) | Численность депутатов (кол-во человек) (ƒ) | Середины интервалов (X) | X 2 | X 2 *ƒ |
20-29 | 24,5 | 600,25 | 600,25 | |
30-39 | 34,5 | 1190,25 | ||
40-49 | 44,5 | 1980,25 | ||
50-59 | 54,5 | 2970,25 | 89107,5 | |
60-69 | 64,5 | 4160,25 | 29121,75 | |
Итог: | 193320,5 |
;
Правила сложения дисперсии.
Если исходная совокупность разделена на группы по какому-то существенному признаку, то вычисляют следующие виды дисперсий:
1) Общую дисперсию исходной совокупности по формуле: , где
— общая средняя величина исходной совокупности; f – частоты исходной совокупности. Общая дисперсия характеризует отклонение индивидуальных значений признака от общей средней величины исходной совокупности.
2) Внутригрупповые дисперсии по формуле: , где j — номер группы;
— средняя величина в каждой j-ой группе;
— частоты j-ой группы. Внутригрупповые дисперсии характеризуют отклонение индивидуального значения признака в каждой группе от групповой средней величины. Из всех внутригрупповых дисперсий вычисляют среднюю по формуле:
, где
— численность единиц в каждой j-ой группе.
3) Межгрупповую дисперсию по формуле: . Межгрупповая дисперсия характеризует отклонение групповых средних величин от общей средней величины исходной совокупности. Правило сложения дисперсий заключается в том. что общая дисперсия исходной совокупности должна быть равна сумме межгрупповой и средней из внутригрупповых дисперсий:
. Результат отношения межгрупповой к общей дисперсии исходной совокупности называется эмпирическим коэффициентом детерминации. Он показывает долю вариации изучаемого признака, обусловленную вариацией группировочного признака.
Дисперсия альтернативного признака.
Наряду с изучением вариаций количественных признаков определяют вариацию альтернативных признаков. Обозначим через pдолю единиц совокупности, обладающих альтернативным признаком; через q – долю единиц совокупности не обладающих альтернативны признаком. p+q=1
Наличие признака у единиц совокупности обозначается цифрой 1, отсутствие признака – 0. Вычислим среднюю величину альтернативного признака: . Средняя величина альтернативного признака равна доле единиц совокупности, обладающих этим альтернативным признаком. вычислим дисперсию альтернативного признака:
. Дисперсия альтернативного признака равна произведению доли единиц совокупности, обладающих этим признаком и доли единиц совокупности не обладающих данным признаком.
Лекция №7
Выборочное наблюдение.
Выборочным называют не сплошное наблюдение, при котором обследованию и изучению подвергаются не все единицы исходной совокупности, а только часть единиц, при этом результат обследования части совокупности распространяется на всю исходную совокупность. Совокупность, из которой производится отбор единиц для дальнейшего обследования и изучения называется генеральной и все показатели, характеризующие эту совокупность, называются генеральными. Средняя величина признака в генеральной совокупности обозначается через , а численность единиц в генеральной совокупности обозначается через N.
Совокупность отобранных единиц называется выборочной и все показатели, характеризующие эту совокупность, называются выборочными. Средняя величина признака в выборочной совокупности обозначается через , а численность единиц выборочной совокупности обозначается через n.
Возможные пределы отклонений выборочной средней величины от генеральной средней величины называют ошибкой выборки. Чем больше ошибка выборки, тем в большей степени выборочные показатели отличаются от генеральных.
Задача выборочного наблюдения состоит в том, чтобы на основе данных выборочной совокупности дать верное представление о генеральной совокупности, т. е. необходимо максимально приблизить выборочные показатели к генеральным и знать возможный предел отклонений этих величин. При прочих равных условиях чем больше численность единиц выборочной совокупности, тем меньше величина ошибки выборки. Средняя ошибка выборки обозначатся буквой и характеризует среднюю величину отклонений выборочных показателей от генеральных и при этом должно соблюдаться следующее соотношение:
.
Так как средняя ошибка выборки характеризует среднюю величину возможных отклонений выборочных показателей от генеральных, то всегда найдутся единицы генеральной совокупности, которые будут выходить за возможные пределы, такие, как и
.
Если мы увеличим возможные пределы отклонений выборочных показателей от генеральных, то с большей вероятностью сможем утверждать, чтот показатели генеральной совокупности отличаются от выборочных показателей не более чем на какую-нибудь величину, которую называют предельной ошибкой выборки. Предельная ошибка выборки обозначается буквой и вычисляется по формуле
, где
— средняя ошибка выборки; t – коэффициент доверия, зависящий от вероятности, с которой можно гарантировать, что предельная ошибка выборки не превысит t-кратную среднюю ошибку, и всегда будет соблюдаться следующее неравенство:
.
Таблица для справки:
Процент вероятности | Коэффициент доверия (t) |
68,3% | 1,0 |
95,0% | 1,96 |
95,4% | 2,0 |
99,0% | 2,58 |
99,7% | 3,0 |
99,9% | 3,28 |
По способу отбора единиц в выборочную совокупность различают следующие виды выборочного наблюдения (выборки):
- собственно-случайная
- механическая
- типическая
- серийная
По методу отбора единиц в выборочную совокупность различают повторный и бесповторный отбор.
При повторном отборе обследованная единица после изучения вновь возвращается в генеральную совокупность и не исключена возможность дальнейшего отбора этой единицы в выборочную совокупность.
При бесповторном отборе обследованная единица не возвращается в генеральную совокупность и не участвует в дальнейшем отборе единиц в выборочную совокупность.
1) Собственно-случайная выборка заключается в том, что отбор единиц в выборочную совокупность производится без определенной системности, например, методом жеребьевки. При этом каждая единица генеральной совокупности имеет одинаковую вероятность быть отобранной в выборочную совокупность. Средняя ошибка выборки рассчитывается по формулам:
Для повторного отбора: ; для бесповторного отбора:
; где
— дисперсия выборочной совокупности.
2) Механическая выборка является разновидностью собственно-случайной выборки и заключается в том, что вся генеральная совокупность разбивается на определенное количество равных частей и затем из каждой части случайным образом производится отбор единиц в выборочную совокупность. Для определения средней ошибки выборки применяют те же формулы, что и при собственно-случайной выборке.
3) Типическая выборка проводится в тех случаях, когда вся генеральная совокупность разбивается на качественно-однородные группы и затем из каждой группы, случайным или механическим образом производится отбор единиц в выборочную совокупность.
Формула для повторного отбора: ; для бесповторного отбора:
; где
— средняя из внутригрупповых дисперсий.
4) Серийная выборка состоит в том, что обследованию подвергаются не отдельные единицы совокупности, а целые группы или серии единиц. При этом, в данной группе обследованию подвергаются все единицы. Средняя ошибка выборки определяется по формулам: Для повторного отбора: ; для бесповторного отбора:
; где
— межгрупповая дисперсия; r – количество групп или серий в выборочной совокупности; R – количество групп или серий в генеральной совокупности.
Для определения необходимой численности единиц в выборочной совокупности используют формулы, применяемые для расчета средней ошибки выборки.
Лекция №8.
Ряды динамики.
Одной из задач статистики является изучение изменения социально-экономических явлений и процессов во времени. Эта задача решается с помощью составления и анализа рядов динамики.
Ряд динамики представляет собой последовательность числовых значений изучаемого статистического показателя за определенные периоды времени. Числовые значения, составляющие ряд динамики называются уровнями ряда и обозначаются yi (i=1,2,…,n). В зависимости от вида показателей, составляющих ряд динамики, различают ряды абсолютных, относительных и средних величин. Уровни ряда динамики могут относиться к определенным моментам или периодам времени. В зависимости от этого ряды динамики подразделяются на моментные и интервальные.
Моментным называют ряд динамики, уровни которого характеризуют величину изучаемого показателя на определенный момент времени (на конкретную дату). Например: приводится численность населения Российской Федерации (млн. чел.): на 01.01.1999 – 146,3; на 01.01.2000 – 145,6; на 01.01.2001 – 144,8; на 01.01.2002 – 144,0; на 01.01.2003 -145,2.
Интервальным называют ряд динамики, уровни которого характеризуют величину изучаемого показателя за определенный период времени. Например: приводится объем кредитных вложений в экономику страны: 2000 г. – 808; 2001 г. – 1286; 2002 г. – 1755.
Источник