13. Методика расчёта ошибок выборки для средней и доли. Определение численности выборочной совокупности
Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами: N – объем генеральной совокупности (число входящих в нее единиц); n – объем выборки (число обследованных единиц); — генеральная средняя (среднее значение признака в генеральной совокупности);
— выборочная средняя;p – генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности); w – выборочная доля. Доля выборки есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:
. Выборочная доля (w ), определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности n: w = m / n . Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки. Ошибка выборки
— разность соответствующих выборочных и генеральных характеристик: для средней количественного признака
; для доли (альтернативного признака)
. Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения.
Предельная ошибка выборки для средней при повторном отборе . При случайном бесповторном отборе нужно умножить подкоренное выражение на 1 – (n/N).
Формулы для определения необходимой численности выборки n получают из формул ошибок выборки (нужно выразить n). Формулы показывают, что с увеличением предполагаемой ошибки выборки значительно уменьшается необходимый объем выборки. Для расчета объема нужно знать дисперсию.
14. Виды и формы взаимосвязей социально-экономических явлений. Корреляционная связь, ее особенности, методы выявления и оценки тесноты связи. Корреляционная связь – частный случай статистической связи при котором разным значениям переменной соответствуют разные средние значения другой переменной. Классификация связи:1.По степени тесноты связи: -функциональные у=f(х)
—стахостические коррялиционные связи у = f(х) + ε 2. По направлении:
-прямые и обратные.При прямой связи с увеличением факторного признака, увеличивается результативный. При обратной с увеличением факторного признака, результативный уменьшается. 3. По аналитическому выражению.-прямолинейная у = ах+в -криволинейная у = х 3 4. По количеству взаимодействующих факторов:
5. По силе связи: -слабые и сильные. Чем ближе она к функциональной, тем она считается сильнее.I.Исследование связи начинается с качественного, теоретического анализа явления, определение факторного и результативного признака и проверки наличие связи.Наличие связи проверяется с использованием методов: 1.Метод параллельных рядов. Факторные признаки располагаются в порядке возрастания. Параллельно им записываются значение результативного признака.. Связь существует с возрастанием одного растет другое, связь прямая. Сопоставляя значение этих двух рядов делают вывод о наличии и направление связи.2.Графический метод. Заключается в построении графика, где по оси х откладывается значение факторного признака, по оси у – результативного признака. Совокупность точек х и у образуют корреляционное поле, по их расположению можно сделать вывод о наличии и направлении связи. 3.Метод корреляционных таблиц. Корреляционная таблица – это таблица в подлежащей которой перечисляется значение факторного признака или группы, сказуемым значение результативного признака или их группы. В клетке таблицы записываются частоты.Если частоты концентрируются вдоль главной диагонали, то делают вывод о наличии прямой связи, если она концентрируется вдоль побочной диагонали – то наличие обратной связи, если расположены беспорядочно, то отсутствие связи.4.Метод аналитической группировки. Совокупность разбивается на группы по факторному признаку.И каждая группа характеризуется средним значением факторного и результативного признака.Сопоставляя среднее значение делают вывод о наличии направление связи.
II.Этап изучение совокупности. Оценка существенности связи. Оцениваются с помощью критерия Филлера. Для этого рассчитывается фактическое значение критерия. Ф расч. сравнивается с табличной. Фрасч.>Фтабл. – вывод о существенности связи. Фрасч. Фтабл. – вывод о существенности связи. Фрасч. 6 / 11 6 7 8 9 10 11 > Следующая > >>
Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.
Источник
Методы оценки ошибки выборки
При проведении выборочного наблюдения нельзя даже теоретически получить абсолютно точные данные, как при сплошном исследовании. Обусловлено это тем, что наблюдению подвергается не вся совокупность, а только её часть, поэтому при проведении выборочного наблюдения неизбежна некоторая свойственная ему погрешность (ошибки).
Ошибкой статистического наблюдения считается величина отклонения между расчётным и фактическим значениями признаков изучаемых объектов.
Ошибка выборки— это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, метода отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования. Чем больше величина этой ошибки, тем больше показатели выборочного наблюдения отличаются от показателей генеральной совокупности.
Общая величина ошибки выборочного наблюдения складывается из ошибки регистрации и ошибки репрезентативности.
Ошибка регистрации возникает при неправильном установлении факта в процессе наблюдения. Они свойственны как сплошному наблюдению, так и выборочному, но в выборочном их меньше.
Ошибка репрезентативности присуща только несплошным наблюдениям и представляет собой расхождение между выборочной характеристикой и характеристикой генеральной совокупности. Она обусловлена тем, что наблюдению подвергается не вся совокупность, а лишь её часть, и отобранные единицы не вполне отражают вариацию единиц генеральной совокупности. Величина ошибки выборки характеризует степень надёжности результатов выборки, и её необходимо учитывать при оценке параметров генеральной совокупности.
Ошибки репрезентативности бывают систематическими и случайными. Систематические ошибки могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдений или в связи с нарушением установленных правил отбора (отбираются либо заведомо лучшие, либо худшие единицы совокупности). В этом случае ошибка приобретает преднамеренный (тенденциозный) характер, и наблюдение теряет свой смысл. Общее правило отбора гласит, что у отдельных единиц генеральной совокупности должны быть совершенно одинаковые условия и возможности попасть в число единиц, входящих в выборку. Это характеризует независимость результата выборки от воли наблюдателя. Воля же наблюдателя порождает тенденциозные ошибки.
Ошибка выборки при случайном отборе носит случайный характер. Она характеризует размеры отклонений генеральных характеристик от выборочных. Возникновение случайных ошибок репрезентативности объясняется недостаточно верным представлением в выборочной совокупности различных категорий единиц генеральной совокупности, в силу чего распределение отобранной совокупности единиц не вполне точно воспроизводит распределение единиц генеральной совокупности.
Величина случайной ошибки репрезентативности выборки зависит от следующих условий:
1) принятый способ формирования выборочной совокупности (бесповторный отбор даёт меньшую ошибку);
2) объём выборки;
3) от степени варьирования изучаемого признака в генеральной совокупности.
Теоретическим обоснованием появления случайных ошибок выборки является теория вероятностей и её предельные теоремы. Сущность предельных теорем состоит в том, что в массовых явлениях совокупное влияние случайных причин на формирование закономерностей и обобщающих характеристик будет сколь угодно малой величиной или практически не зависит от случая.
Так как случайная ошибка выборки возникает в результате случайных различий между границами выборочной и генеральной совокупностей, при достаточно большом объёме выборки эта ошибка будет сколь угодно мала. Этот вывод, опирающийся на доказательстве предельных теорем, позволяет предполагать, что характеристики выборочного наблюдения могут достаточно хорошо представлять характеристики генеральной совокупности.
Случайные ошибки могут быть доведены до незначительных размеров, а главное, их размеры и пределы можно определить с достаточной точностью на основании закона больших чисел.
Случайная ошибка репрезентативности выборки разделяется на среднюю и предельную.
Средняя (стандартная) ошибка выборки – такое расхождение между средними выборочной и генеральной совокупности, которое не превышает среднего квадратического отклонения ±s.
В математической статистике доказывается, что значения средней ошибки простой случайной выборки определяются по следующим формулам:
а) для повторного отбора:
б) для бесповторного отбора:
где – средняя ошибка выборочной средней;
– дисперсия выборочной совокупности;
– среднее квадратическое отклонение в выборке;
n — численность выборки;
N — численность генеральной совокупности.
Дисперсия генеральной совокупности связана с выборочной дисперсией по формуле:
Для больших выборок (n>30) поправка на объём выборки необязательна, и можно считать генеральную и выборочную дисперсию тождественными, а значит, и величины их средних ошибок.
Средняя ошибка выборочной доли простой случайной выборки :
а) для повторного отбора:
б) для бесповторного отбора:
где – выборочная доля единиц, обладающих изучаемым признаком.
Предельная ошибка выборки –максимально возможное расхождение выборочной и генеральной средних, т. е. максимум ошибки при заданной вероятности её появления:
.
Предельная ошибка выборочной доли: .
Множитель t в этих формулах называется коэффициентом доверия. Он представляет собой показатель кратности средней ошибки выборки и зависит от значения доверительной вероятности Р, с которой гарантируется величина предельной ошибки выборки.
В математической статистике доказывается, что вероятность появления заданной предельной ошибки подчиняется нормальному закону распределения, выражающемуся через функцию Лапласа. Значения функции Лапласа для разных t рассчитаны и имеются в специальных таблицах, из которых в статистике широко применяется сочетание:
Вероятность | 0,683 | 0,866 | 0,950 | 0,954 | 0,988 | 0,990 | 0,997 | 0,999 |
t | 1 | 1,5 | 1,96 | 2 | 2,5 | 2,58 | 3 | 3,5 |
Задавшись конкретным уровнем вероятности, выбирают величину коэффициента доверия t и определяют предельную ошибку выборки.
Тогда доверительный интервал для генеральной средней зависит от величины предельной ошибки выборки: .
Из вышесказанного следует, что лишь с определённой степенью вероятности можно утверждать, что показатели генеральной совокупности и их отклонения не превысят величину .
Аналогичным образом определяется доверительный интервал для генеральной доли: p .
Таким образом, чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и, следовательно, тем ниже точность оценки.
Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики генеральной совокупности, а лишь её доверительный интервал с заданным уровнем вероятности. И это серьезный недостаток выборочного метода статистики.
В порядке случайной выборки исследован возраст 100 студентов вуза из общего числа 200 человек. Результаты обработки материалов наблюдения приведены в таблице:
Возраст, лет | 17 | 18 | 19 | 20 | 21 | 22 | 23 |
Число студентов, чел. | 11 | 13 | 18 | 23 | 17 | 10 | 8 |
Установить: 1) средний возраст студентов вуза по выборке;
2) величину ошибки при определении возраста студентов на основе выборки;
3) вероятные пределы колебания возраста для всех студентов при вероятности 0,997.
Решение:
1). Средний возраст студентов вуза (выборочная средняя) определяется по формуле средней арифметической взвешенной:
Дисперсия выборочной средней:
2). Средняя ошибка случайной выборки:
3). Предельная ошибка выборки (P=0,997, t=3):
4). Пределы колебания возраста студентов в генеральной совокупности:
Таким образом, средний возраст всех студентов вуза находится в пределах от 19,48 до 20,20 лет.
При 20%-м выборочном наблюдении (по способу случайной бесповторной выборки) населения города с численностью 380000 чел. установлено: удельный вес населения в возрасте до 16 лет составил 14%. Определить с вероятностью 0,954 пределы, в которых будет находиться доля этой группы населения в численности населения всего города.
Решение:
1). Зная объём генеральной совокупности и долю отбора (20%, или 0,2), находим объём выборки:
2). Средняя ошибка выборочной доли:
3). Предельная ошибка выборочной доли (P=0,954, t=2):
4). Доверительный интервал для генеральной доли:
Таким образом, доля населения в возрасте до 16 лет в общей численности населения города с вероятностью 95,4% находится в пределах от 13,775% до 14,225%, то есть составляет интервал от 52345 чел. до 54055 чел. из 380000 чел.
При выборочном обследовании 10 % изделий партии готовой продукции по методу бесповторного отбора получены следующие данные о содержании влаги в образцах.
Влажность, % | Число образцов, fi | хi |
До 13 | 4 | 12 |
13 – 15 | 18 | 4 |
15 – 17 | 50 | 16 |
17 – 19 | 22 | 18 |
19 и выше | 6 | 20 |
Итого: | 100 |
Определить: средний % влажности, дисперсию, среднее квадратическое отклонение; с вероятностью 0,954 возможные пределы, в которых ожидается средний % влажности всей готовой продукции; с вероятностью 0,997 возможные пределы удельного веса стандартной продукции при условии, что к нестандартной партии относятся изделия с влажностью до 13 и выше 19%.
Решение:
Средний процент влажности генеральной совокупности может быть любым значением, находящимся в пределах от 15,82 до 16,33.
;
Таким образом, удельный вес стандартных изделий в генеральной совокупности находится в пределах 81 % – 99 %.
Источник