Статистика: конспект лекций.
6.4. Способы отбора и виды выборки.
В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный и бесповторный. При повторном отборе каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку. Этот способ отбора построен по схеме «возвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отбираемых единиц. При бесповторном отборе каждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Этот способ отбора построен по схеме «невозвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.
В зависимости от методики формирования выборочной совокупности различают следующие основные виды выборки:
Типическую (стратифицированную, районированную);
Собственно случайная выгборка формируется в строгом соответствии с научными принципами и правилами случайного отбора. Для получения собственно случайной выборки генеральная совокупность строго подразделяется на единицы отбора, и затем в случайном повторном или бесповторном порядке отбирается достаточное число единиц.
Случайный порядок подобен жеребьевке. На практике он чаще всего применяется при использовании специальных таблиц случайных чисел. Если, например, из совокупности, содержащей 1587 единиц, следует отобрать 40 единиц, то из таблицы отбирают 40 четырехзначных чисел, которые меньше 1587.
В том случае, когда собственно случайная выборка организуется как повторная, расчет стандартной ошибки производится в соответствии с формулой (6.1). При бесповторном способе отбора формула для расчета стандартной ошибки будет:
Где 1 – n / N – доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе при прочих равных условиях всегда меньше, чем при повторном. Бесповторный отбор организовать легче, чем повторный, и он применяется намного чаще. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле (5.1). Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, большая и, следовательно, величина близка к единице.
Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невозможно, так как при использовании таблиц случайных чисел необходимо пронумеровать все единицы генеральной совокупности. Довольно часто генеральная совокупность такая большая, что провести подобную предварительную работу чрезвычайно сложно и нецелесообразно, поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако организуются они так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.
При чисто механической выборке вся генеральная совокупность единиц должна быть прежде всего представлена в виде списка единиц отбора, составленного в каком-то нейтральном по отношению к изучаемому признаку порядке, например по алфавиту. Затем список единиц отбора разбивается на столько равных частей, сколько необходимо отобрать единиц. Далее по заранее установленному правилу, не связанному с вариацией исследуемого признака, из каждой части списка отбирается одна единица. Этот вид выборки не всегда может обеспечить случайный характер отбора, и полученная выборка может оказаться смещенной. Объясняется это тем, что, во-первых, упорядочение единиц генеральной совокупности может иметь элемент неслучайного характера. Во-вторых, отбор из каждой части генеральной совокупности при неправильном установлении начала отсчета может также привести к ошибке смещения. Однако практически легче организовать механическую выборку, чем собственно случайную, и при проведении выборочных обследований чаще всего пользуются этим видом выборки. Стандартную ошибку при механической выборке определяют по формуле собственно случайной бесповторной выборки (6.2).
Типическая (районированная, стратифицированная) выборка преследует две цели:
• обеспечить представительство в выборке соответствующих типических групп генеральной совокупности по интересующим исследователя признакам;
• увеличить точность результатов выборочного обследования.
При типической выборке до начала ее формирования генеральная совокупность единиц разбивается на типические группы. При этом очень важным моментом является правильный выбор группировочного признака. Выделенные типические группы могут содержать одинаковое или различное число единиц отбора. В первом случае выборочная совокупность формируется с одинаковой долей отбора из каждой группы, во втором – с долей, пропорциональной ее доле в генеральной совокупности. Если выборка формируется с равной долей отбора, по существу она равносильна ряду собственно случайных выборок из меньших генеральных совокупностей, каждая из которых и есть типическая группа. Отбор из каждой группы осуществляется в случайном (повторном или бесповторном) либо механическом порядке. При типической выборке, как с равной, так и неравной долей отбора, удается устранить влияние межгрупповой вариации изучаемого признака на точность ее результатов, так как обеспечивается обязательное представительство в выборочной совокупности каждой из типических групп. Стандартная ошибка выборки будет зависеть не от величины общей дисперсии ?2, а от величины средней из групповых дисперсий ?i2. Поскольку средняя из групповых дисперсий всегда меньше общей дисперсии, постольку при прочих равных условиях стандартная ошибка типической выборки будет меньше стандартной ошибки собственно случайной выборки.
При определении стандартных ошибок типической выборки применяются следующие формулы:
• при повторном способе отбора.
• при бесповторном способе отбора:
– средняя из групповых дисперсий в выборочной совокупности.
Серийная (гнездовая) выборка – это такой вид формирования выборочной совокупности, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий (гнезд) обследованию подвергаются все единицы. Серийную выборку практически организовать и провести легче, чем отбор отдельных единиц. Однако при этом виде выборки, во-первых, не обеспечивается представительство каждой из серий и, во-вторых, не устраняется влияние межсерийной вариации изучаемого признака на результаты обследования. В том случае, когда эта вариация значительна, она приведет к увеличению случайной ошибки репрезентативности. При выборе вида выборки исследователю необходимо учитывать это обстоятельство. Стандартная ошибка серийной выборки определяется по формулам:
• при повторном способе отбора —
Где ?– межсерийная дисперсия выборочной совокупности; r – число отобранных серий;
• при бесповторном способе отбора —
Где R – число серий в генеральной совокупности.
В практике те или иные способы и виды выборок применяются в зависимости от цели и задач выборочных обследований, а также возможностей их организации и проведения. Чаще всего применяется комбинирование способов отбора и видов выборки. Такие выборки получили название комбинированные. Комбинирование возможно в разных сочетаниях: механической и серийной выборки, типической и механической, серийной и собственно случайной и т. д. К комбинированной выборке прибегают для обеспечения наибольшей репрезентативности с наименьшими трудовыми и денежными затратами на организацию и проведение обследования.
При комбинированной выборке величина стандартной ошибки выборки состоит из ошибок на каждой ее ступени и может быть определена как корень квадратный из суммы квадратов ошибок соответствующих выборок. Так, если при комбинированной выборке в сочетании использовались механическая и типическая выборки, то стандартную ошибку можно определить по формуле.
Где ?1 и ?2 – стандартные ошибки соответственно механической и типической выборок.
Особенность многоступенчатой выгборки состоит в том, что выборочная совокупность формируется постепенно, по ступеням отбора. На первой ступени с помощью заранее определенного способа и вида отбора отбираются единицы первой ступени. На второй ступени из каждой единицы первой ступени, попавшей в выборку, отбираются единицы второй ступени и т. д. Число ступеней может быть и больше двух. На последней ступени формируется выборочная совокупность, единицы которой подлежат обследованию. Так, например, для выборочного обследования бюджетов домашних хозяйств на первой ступени отбираются территориальные субъекты страны, на второй – районы в отобранных регионах, на третьей – в каждом муниципальном образовании отбираются предприятия или организации и, наконец, на четвертой ступени – в отобранных предприятиях отбираются семьи.
Таким образом, выборочная совокупность формируется на последней ступени. Многоступенчатая выборка более гибкая, чем другие виды, хотя в общем она дает менее точные результаты, чем выборка того же объема, но сформированная в одну ступень. Однако при этом она имеет одно важное преимущество, которое заключается в том, что основу выборки при многоступенчатом отборе нужно строить на каждой из ступеней только для тех единиц, которые попали в выборку, а это очень важно, так как нередко готовой основы выборки нет.
Стандартную ошибку выборки при многоступенчатом отборе при группах разных объемов определяют по формуле.
Где ?1, ?2, ?3, . – стандартные ошибки на разных ступенях;
n1, n2, n3, ... – численность выборок на соответствующих ступенях отбора.
В том случае, если группы неодинаковы по объему, то теоретически этой формулой пользоваться нельзя. Но если общая доля отбора на всех ступенях постоянна, то практически расчет по этой формуле не приведет к искажению величины ошибки.
Сущность многофазной выгборки состоит в том, что на основе первоначально сформированной выборочной совокупности образуют подвыборку, из этой подвыборки – следующую подвыборку и т. д. Первоначальная выборочная совокупность представляет собой первую фазу, подвыборка из нее – вторую и т. д. Многофазную выборку целесообразно применять в случаях, если:
Для изучения различных признаков требуется неодинаковый объем выборки;
Колеблемость изучаемых признаков неодинакова и требуемая точность различна;
В отношении всех единиц первоначальной выборочной совокупности (первая фаза) необходимо собрать менее подробные сведения, а в отношении единиц каждой последующей фазы – более подробные.
Одним из несомненных достоинств многофазной выборки является то обстоятельство, что сведениями, полученными на первой фазе, можно пользоваться как дополнительной информацией на последующих фазах, информацией второй фазы – как дополнительной информацией на следующих фазах и т. д. Такое использование сведений повышает точность результатов выборочного обследования.
При организации многофазной выборки можно применять сочетание различных способов и видов отбора (типическую выборку с механической и т. д.). Многофазный отбор можно сочетать с многоступенчатым. На каждой ступени выборка может быть многофазной.
Стандартная ошибка при многофазной выборке рассчитывается на каждой фазе в отдельности в соответствии с формулами того способа отбора и вида выборки, при помощи которых формировалась ее выборочная совокупность.
Взаимопроникающие выгборки – это две или более независимые выборки из одной и той же генеральной совокупности, образованные одним и тем же способом и видом. К взаимопроникающим выборкам целесообразно прибегать, если необходимо за короткий срок получить предварительные итоги выборочных обследований. Взаимопроникающие выборки эффективны для оценки результатов обследования. Если в независимых выборках результаты одинаковы, то это свидетельствует о надежности данных выборочного обследования. Взаимопроникающие выборки иногда можно применять для проверки работы различных исследователей, поручив каждому из них провести обследование разных выборок.
Стандартная ошибка при взаимопроникающих выборках определяется по той же формуле, что и типическая пропорциональная выборка (5.3). Взаимопроникающие выборки по сравнению с другими видами требуют больших трудовых затрат и денежных расходов, поэтому исследователь должен учитывать это обстоятельство при проектировании выборочного обследования.
Предельные ошибки при различных способах отбора и видах выборки определяются по формуле ? = t?, где ? – соответствующая стандартная ошибка.
Источник
Виды, методы и способы отбора
Выборочная совокупность будет полно и адекватно отражать свойства генеральной совокупности в том случае, если она будет репрезентативной (представительной). Репрезентативность выборки зависит от применяемых видов, методов и способов отбора единиц.
Достоверность результатов наблюдения достигается за счет соблюдения основного принципа выборочного наблюдения: обеспечение случайности отбора единиц (равная возможность единиц попасть в выборку)
В теории выборочного наблюдения разработаны различные виды, методы и способы отбора единиц из генеральной совокупности.
Различают два вида отбора единиц в выборочную совокупность: повторный и бесповторный.
При повторном отбореотобранная единица подвергается обследованию, возвращается в генеральную совокупность и снова может быть выбранной («схема возвратного шара»). В результате вероятность попадания отдельной единицы в выборку не меняется независимо от числа отобранных единиц. На практике такой отбор применяется, когда объем генеральной совокупности не известен и теоретически возможно повторение единиц с уже встречавшимися значениями регистрируемых признаков (например, в маркетинговых исследованиях). В социально-экономических исследованиях повторный отбор встречается редко.
При бесповторном отбореотобранная единица подвергается обследованию и в дальнейшей процедуре отбора не участвует («схема безвозвратного шара»). Тем самым, вероятность попасть в выборку для оставшихся единиц увеличивается с каждым шагом отбора. Такой вид отбора практически возможен, когда объем генеральной совокупности четко определен.
В ходе выборочного наблюдения могут применяться следующие способы отбора единиц из генеральной совокупности:
§ индивидуальный отбор — в выборку отбираются отдельные единицы совокупности;
§ групповой отбор — в выборку попадают качественно однородные группы или серии единиц;
§ комбинированный отбор – сочетание индивидуального и группового способов отбора.
Выборочная совокупность может быть сформирована с помощью следующих методов отбораединиц:
1. случайный (собственно-случайный);
3. типический (расслоенный, стратифицированный);
4. серийный (гнездовой);
Приведем краткую характеристику этих методов отбора единиц.
Собственно-случайный (случайный) отбор – индивидуальный отбор единиц, каждой из которых присвоен порядковый номер, с помощью жеребьевки или таблицы случайных чисел (Приложение 3). Генеральная совокупность предварительно не разделяется на какие-либо группы. Условием репрезентативности выборки служит принцип случайности (равная возможность каждой единицы попасть в выборку). Собственно-случайная выборка может осуществляться по схемам повторного и бесповторного обора (например, проведение тиражей денежно-вещевой лотереи).
Механический отбор – отбор из предварительно упорядоченной и разбитой на равные интервалы (группы) генеральной совокупности. Размер интервала равен обратной величине доли выборки. Например, при 5 % — ной выборке отбирается каждая 20-я единица (1/0,05), при 10 %-ной выборке — каждая 10-я единица (1/0,1) и т.д. В результате, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица. При этом отбор начинается не с первой единицы совокупности, а с середины первого интервала. Для обеспечения репрезентативности все единицы генеральной совокупности должны располагаться в определенном порядке. Механический отбор всегда бывает бесповторным. Он имеет преимущество перед случайным отбором, т.к. его легче организовать.
Типический отбор(расслоенный, стратифицированный) – неоднородная генеральная совокупность вначале разбивается на качественно однородные типические группы (не обязательно равные). Затем из каждой группы производится индивидуальный отбор случайным или механическим методом. Типическая выборка применяется при изучении сложных статистических совокупностей и дает более точные результаты по сравнению с другими методами отбора. В частности, случайная ошибка при типическом отборе меньше, чем при собственно-случайном и механическом отборе. Это объясняется тем, что имевшееся соотношение между группами единиц генеральной совокупности, сохраняется и в выборочной совокупности. Типический отбор бывает повторным и бесповторным.
Из каждой типической группы в выборочную совокупность можно отбирать определенное число единиц с помощью следующих разновидностей типического отбора:
1. пропорциональный типический отбор – число единиц выборки n пропорционально удельному весу каждой группы в генеральной совокупности:
где: — объем выборки из
— ой типической группы;
— объем
— ой типической группы в генеральной совокупности.
2. непропорциональный типический отбор — число единиц выборки непропорционально удельному весу каждой группы в генеральной совокупности:
,
где — число выделенных типических групп.
3. отбор с учетом вариации признака -число единиц выборки пропорционально удельному весу в генеральной совокупности с учетом вариации признака по группам:
— для средней , где
— среднее квадратическое отклонение i – й группы;
— для доли
Серийный (гнездовой)отбор – это отбор, при котором в случайном порядке отбираются не отдельные единицы, а целые группы единиц (серии, гнезда), которые подвергаются сплошному наблюдению. Отбор отдельных серий осуществляется на основе случайного или механического метода. Серийный отбор применяется в том случае, если генеральная совокупность разбита на группы еще до начала выборочного наблюдения. На практике чаще применяется бесповторный отбор с равными сериями. Ошибка серийной выборки больше, чем при другом методе отбора. Но серийный отбор обладает организационными преимуществами, поэтому довольно часто применяется на практике. Серийную выборку применяют в двух случаях: 1) все серии имеют одинаковое количество единиц; 2) серии различны по объему. Серийный отбор обеспечивает экономию средств, если обследования распространяются на обширную территорию и гнездами являются территориальные единицы.
В рассмотренных выше методах осуществлялся одноступенчатый и многоступенчатый отбор единиц в выборочную совокупность.
При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку (собственно-случайный и серийный отбор).
При многоступенчатой выборке применяется несколько стадий (ступеней) отбора. Производят отбор отдельных групп из генеральной совокупности, затем из групп выбираются отдельные единицы (механический отбор). При этом каждая стадия имеет свою единицу отбора. Число ступеней определяется числом типов единиц отбора. Например, на последней ступени единица отбора совпадает с единицей выборки. Ошибка всей выборки складывается из ошибок на отдельных ступенях отбора.
При построении многоступенчатой выборки используется комбинация разных методов отбора, поэтому такой метод отбора иногда называют комбинированной выборкой.
От многоступенчатого отбора следует отличать многофазный отбор. В отличие от многоступенчатого отбора, он предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. При этом отобранные на каждой стадии единицы подвергаются обследованию по более широкой программе. Многофазная выборка используется для расширения программы обследования.
Особым видом выборочного наблюдения явления моментное наблюдение, т.е. выборочное наблюдение во времени. При этом все единицы изучаемой совокупности подлежат сплошному учету: объектами выборки служат отрезки времени. Поэтому понятия генеральной и выборочной совокупности относятся не к совокупности единиц, а ко времени наблюдения.
Ошибки выборки
Выборочное наблюдение носит несплошной характер, поэтому оно сопровождается ошибками (погрешностями).
Ошибки выборочного наблюдения возникают в двух случаях: 1. при сборе данных (ошибки регистрации); 2. в результате неполного учета единиц генеральной совокупности (ошибки репрезентативности).
Таким образом, любому выборочному наблюдению свойственна ошибка репрезентативности — расхождение между характеристиками выборочной и генеральной совокупности (рис 7.1).
Рис 7.1. Виды ошибок репрезентативности
Ошибка репрезентативности возникает в результате того, что выборочная совокупность не полностью отражает закономерности, присущие генеральной совокупности. Величина случайной ошибки репрезентативности зависит:
1) от объема выборки;
2) от степени вариации признака в генеральной совокупности;
3) от метода отбора единиц и т.д.
По данным выборочной совокупности оценивают показатели (параметры) генеральной совокупности. Например, используют оценку 2-х параметров:
— генеральной средней величины изучаемого признака (для количественного признака);
— генеральной доли (для альтернативного признака).
Теоретическое обоснование появления случайных ошибок выборки объясняют предельные теоремы теории вероятностей. Так как случайная ошибка выборки возникает в результате случайных различий между границами выборочной и генеральной совокупностей, то при достаточно большом объеме выборки эта ошибка будет сколь угодно мала. Поэтому характеристики выборки могут достаточно хорошо представлять характеристики генеральной совокупности. Случайные ошибки могут быть доведены до незначительных размеров, что позволит определить их размеры и пределы с достаточной степенью точности на основании закона больших чисел.
Выборочное распределение средней величины будет приближаться к нормальному распределению по мере увеличения объема выборки , независимо от характера распределения генеральной совокупности. С увеличением численности выборки
величина выборочной средней
приближается к генеральной средней
.
Одной из задач выборочного метода является определение ошибок выборки, т.е. возможных расхождений характеристик совокупностей:
1) между выборочной средней ( )и генеральной средней (
);
2) между выборочной долей единиц , обладающих изучаемым признаком, и генеральной долей (р).
Методы математической статистики позволяют измерить эти ошибки и указать границы их колеблемости. Величину ошибок можно оценить по формулам:
;
.
В статистике различают три вида ошибок выборки:
— средняя ошибка ;
— предельная ошибка ;
— относительная ошибка .
Вид формулы средней ошибки выборки зависит от метода отбора. Рассмотрим порядок расчета ошибок выборки при собственно-случайном отборе.
Средняя ошибка выборки —характеризует среднюю величину возможных расхождений выборочных (средняя
, доля
) и генеральных характеристик (средняя
, доля
) совокупности. Представляет собой среднее квадратическое отклонение возможных значений характеристик выборочной совокупности от характеристик генеральной совокупности.
Рассмотрим формулы средней ошибки выборки длясредней
и доли
при повторном и бесповторном отборе:
1. При повторном отборе:
1.1. Средняя ошибка выборочной средней :
1.2. Средняя ошибка выборочной доли :
2. При бесповторном отборе:
2.1. Средняя ошибка выборочной средней :
2.2. Средняя ошибка выборочной доли :
где — дисперсия признака в генеральной совокупности;
— объем выборки;
— выборочная доля единиц, обладающих изучаемым признаком;
дисперсия доли (альтернативного признака).
Замечание. На практике величина дисперсии признака в генеральной совокупности , как правило, неизвестна. Поэтому в формулы ошибки выборки подставляют дисперсию выборочной совокупности
. Это возможно, поскольку между дисперсиями генеральной и выборочной совокупностей существует следующая взаимосвязь:
При большой численности выборочной совокупности сомножитель
стремится к единице, и выборочная дисперсия
практически совпадает с генеральной
, т.е.
.
Замечание. Поскольку при бесповторном отборе в ходе выборки объем генеральной совокупности сокращается, то в формулу для расчета средней ошибки включают дополнительный множитель
.
Средняя ошибка выборки при собственно-случайном повторном отборе зависит от:
— объема выборки (обратная зависимость);
— степени вариации признака (прямая зависимость).
Чем больше вариация признака, тем больше ошибка выборки. Для ее уменьшения необходимо увеличить объем выборочной совокупности.
Формулы расчета средних ошибок для различных методов отбора приведены в табл. 7.2.
Таблица 7.2
Формулы средних ошибок для различных методов отбора
Метод отбора | Оцениваемый параметр | Вид отбора | |
повторный | бесповторный | ||
Собственно-случайный и механический | средняя | | |
доля | | | |
Типический (пропорциональный) | средняя | | |
доля | | | |
Серийный | средняя | | |
доля | | | |
Комбинированный: — типический и серийный — собственно-случайный и серийный | cредняя | | |
cредняя | | |
Условные обозначения в таблице:
— средняя из групповых дисперсий;
доля единиц i-й типической группы (серии) выборки, обладающих изучаемым признаком;
— средняя из групповых дисперсий для доли.
М, m – количество равных серий соответственно в генеральной и выборочной совокупностях;
— межгрупповая выборочная дисперсия,
где средняя в i-й серии;
общая выборочная средняя;
— межгрупповая выборочная дисперсия доли, где
— доля единиц, обладающих признаком в выборке. При равновеликих сериях
Следует иметь в виду, что в каждой конкретной выборке разность может быть меньше, больше или равна величине средней ошибки
. Вероятность такой ошибки различна. Поэтому рассчитывают предельную ошибку выборки
.
Предельная ошибка выборки — это максимально возможное расхождение характеристик выборочной (средняя
, доля
) и генеральной совокупности (средняя
, доля
), т.е. максимум ошибки при заданной вероятности ее появления.
Величина предельной ошибки определяется по формуле:
где — коэффициент доверия, который определяется по таблице значений интеграла Лапласа при заданной доверительной вероятности
Он показывает, во сколько раз предельная ошибка выборки отличается от средней ошибки.
Соответственно, формулы предельной ошибки для средней и доли
, имеют вид:
Значения интеграла Лапласа табулированы в зависимости от значений коэффициента (Приложение 2). Поэтому на практике пользуются готовыми таблицами значений. Приведем наиболее часто употребляемые уровни доверительной вероятности
и соответствующие им значения
:
| 1,0 | 1,96 | 2,0 | 2,58 | 3,0 |
| 0,683 | 0,950 | 0,954 | 0,990 | 0,997 |
Таким образом, предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, величина которой зависит от значения коэффициента доверия t.
Например, при t = 1 с вероятностью 0,683 можно утверждать, что расхождение между выборочными и генеральными характеристиками не превысит одной величины средней ошибки выборки, т.е.
При t = 2 вероятность =0,954, значит, в среднем 954 выборки из 1000 дадут показатели выборки (средняя
, доля
), которые будут отличаться от генеральных показателей (средняя
, доля
) не более чем на величину двукратной средней ошибки выборки, т.е.
или
Появление ошибки в три раза большей, чем средняя ошибка выборки, маловероятно (1-0,997=0,003), и считается практически невозможным событием.
Пределы, в которых с данной вероятностью будет находиться неизвестная величина изучаемого показателя генеральной совокупности, называют доверительным интервалом, а вероятность
— доверительной вероятностью.
В качестве доверительной вероятности обычно принимают значения вероятностей Р и соответствующие им уровни значимости (табл. 7.3)
Таблица 7.3
Соотношение между значениями доверительной вероятности
и уровнями значимости
Вероятность | Уровень значимости |
0,90 | 0,10, или 10 % |
0,95 | 0,05, или 5 % |
0,99 | 0,01, или 1 % |
Например, 10 %-ный уровень значимости означает, что в 90 случаях из 100 характеристика генеральной совокупности, выявленная на основе выборки, будет лежать в пределах доверительного интервала. То есть, в 10 случаях из 100 существует риск совершить ошибку по выборочным данным при оценке генеральной совокупности.
Очевидно, что чем больше значение предельной ошибки , тем больше величина доверительного интервала, т.е. ниже точность оценки.
Формулы предельной ошибки позволяют определить:
§ доверительные интервалы, в которых будут находиться значения генеральных параметров:
— генеральная средняя:
— генеральная доля:
§ необходимую численность выборки , обеспечивающую с определенной вероятностью заданную точность наблюдения (
);
§ вероятность допуска той или иной заданный ошибки (определяется
и находится вероятность).
Наряду с абсолютной величиной предельной ошибки выборки рассчитывают и относительную ошибку выборки
.Она определяетсякак процентное отношение предельной ошибки выборки
к соответствующей характеристике выборочной совокупности (средняя
, доля
):
§ для средней =
§ для доли
Выборка считается репрезентативной, если 5 %.
Пример.В порядке случайной бесповторной выборки было обследовано n = 160 турфирм из N = 1500, и получены следующие данные об их объеме продаж за отчетный период (табл. 7.4).
Источник