Статистика: конспект лекций.
6.4. Способы отбора и виды выборки.
В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный и бесповторный. При повторном отборе каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку. Этот способ отбора построен по схеме «возвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отбираемых единиц. При бесповторном отборе каждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Этот способ отбора построен по схеме «невозвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.
В зависимости от методики формирования выборочной совокупности различают следующие основные виды выборки:
Типическую (стратифицированную, районированную);
Собственно случайная выгборка формируется в строгом соответствии с научными принципами и правилами случайного отбора. Для получения собственно случайной выборки генеральная совокупность строго подразделяется на единицы отбора, и затем в случайном повторном или бесповторном порядке отбирается достаточное число единиц.
Случайный порядок подобен жеребьевке. На практике он чаще всего применяется при использовании специальных таблиц случайных чисел. Если, например, из совокупности, содержащей 1587 единиц, следует отобрать 40 единиц, то из таблицы отбирают 40 четырехзначных чисел, которые меньше 1587.
В том случае, когда собственно случайная выборка организуется как повторная, расчет стандартной ошибки производится в соответствии с формулой (6.1). При бесповторном способе отбора формула для расчета стандартной ошибки будет:
Где 1 – n / N – доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе при прочих равных условиях всегда меньше, чем при повторном. Бесповторный отбор организовать легче, чем повторный, и он применяется намного чаще. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле (5.1). Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, большая и, следовательно, величина близка к единице.
Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невозможно, так как при использовании таблиц случайных чисел необходимо пронумеровать все единицы генеральной совокупности. Довольно часто генеральная совокупность такая большая, что провести подобную предварительную работу чрезвычайно сложно и нецелесообразно, поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако организуются они так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.
При чисто механической выборке вся генеральная совокупность единиц должна быть прежде всего представлена в виде списка единиц отбора, составленного в каком-то нейтральном по отношению к изучаемому признаку порядке, например по алфавиту. Затем список единиц отбора разбивается на столько равных частей, сколько необходимо отобрать единиц. Далее по заранее установленному правилу, не связанному с вариацией исследуемого признака, из каждой части списка отбирается одна единица. Этот вид выборки не всегда может обеспечить случайный характер отбора, и полученная выборка может оказаться смещенной. Объясняется это тем, что, во-первых, упорядочение единиц генеральной совокупности может иметь элемент неслучайного характера. Во-вторых, отбор из каждой части генеральной совокупности при неправильном установлении начала отсчета может также привести к ошибке смещения. Однако практически легче организовать механическую выборку, чем собственно случайную, и при проведении выборочных обследований чаще всего пользуются этим видом выборки. Стандартную ошибку при механической выборке определяют по формуле собственно случайной бесповторной выборки (6.2).
Типическая (районированная, стратифицированная) выборка преследует две цели:
• обеспечить представительство в выборке соответствующих типических групп генеральной совокупности по интересующим исследователя признакам;
• увеличить точность результатов выборочного обследования.
При типической выборке до начала ее формирования генеральная совокупность единиц разбивается на типические группы. При этом очень важным моментом является правильный выбор группировочного признака. Выделенные типические группы могут содержать одинаковое или различное число единиц отбора. В первом случае выборочная совокупность формируется с одинаковой долей отбора из каждой группы, во втором – с долей, пропорциональной ее доле в генеральной совокупности. Если выборка формируется с равной долей отбора, по существу она равносильна ряду собственно случайных выборок из меньших генеральных совокупностей, каждая из которых и есть типическая группа. Отбор из каждой группы осуществляется в случайном (повторном или бесповторном) либо механическом порядке. При типической выборке, как с равной, так и неравной долей отбора, удается устранить влияние межгрупповой вариации изучаемого признака на точность ее результатов, так как обеспечивается обязательное представительство в выборочной совокупности каждой из типических групп. Стандартная ошибка выборки будет зависеть не от величины общей дисперсии ?2, а от величины средней из групповых дисперсий ?i2. Поскольку средняя из групповых дисперсий всегда меньше общей дисперсии, постольку при прочих равных условиях стандартная ошибка типической выборки будет меньше стандартной ошибки собственно случайной выборки.
При определении стандартных ошибок типической выборки применяются следующие формулы:
• при повторном способе отбора.
• при бесповторном способе отбора:
– средняя из групповых дисперсий в выборочной совокупности.
Серийная (гнездовая) выборка – это такой вид формирования выборочной совокупности, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий (гнезд) обследованию подвергаются все единицы. Серийную выборку практически организовать и провести легче, чем отбор отдельных единиц. Однако при этом виде выборки, во-первых, не обеспечивается представительство каждой из серий и, во-вторых, не устраняется влияние межсерийной вариации изучаемого признака на результаты обследования. В том случае, когда эта вариация значительна, она приведет к увеличению случайной ошибки репрезентативности. При выборе вида выборки исследователю необходимо учитывать это обстоятельство. Стандартная ошибка серийной выборки определяется по формулам:
• при повторном способе отбора —
Где ?– межсерийная дисперсия выборочной совокупности; r – число отобранных серий;
• при бесповторном способе отбора —
Где R – число серий в генеральной совокупности.
В практике те или иные способы и виды выборок применяются в зависимости от цели и задач выборочных обследований, а также возможностей их организации и проведения. Чаще всего применяется комбинирование способов отбора и видов выборки. Такие выборки получили название комбинированные. Комбинирование возможно в разных сочетаниях: механической и серийной выборки, типической и механической, серийной и собственно случайной и т. д. К комбинированной выборке прибегают для обеспечения наибольшей репрезентативности с наименьшими трудовыми и денежными затратами на организацию и проведение обследования.
При комбинированной выборке величина стандартной ошибки выборки состоит из ошибок на каждой ее ступени и может быть определена как корень квадратный из суммы квадратов ошибок соответствующих выборок. Так, если при комбинированной выборке в сочетании использовались механическая и типическая выборки, то стандартную ошибку можно определить по формуле.
Где ?1 и ?2 – стандартные ошибки соответственно механической и типической выборок.
Особенность многоступенчатой выгборки состоит в том, что выборочная совокупность формируется постепенно, по ступеням отбора. На первой ступени с помощью заранее определенного способа и вида отбора отбираются единицы первой ступени. На второй ступени из каждой единицы первой ступени, попавшей в выборку, отбираются единицы второй ступени и т. д. Число ступеней может быть и больше двух. На последней ступени формируется выборочная совокупность, единицы которой подлежат обследованию. Так, например, для выборочного обследования бюджетов домашних хозяйств на первой ступени отбираются территориальные субъекты страны, на второй – районы в отобранных регионах, на третьей – в каждом муниципальном образовании отбираются предприятия или организации и, наконец, на четвертой ступени – в отобранных предприятиях отбираются семьи.
Таким образом, выборочная совокупность формируется на последней ступени. Многоступенчатая выборка более гибкая, чем другие виды, хотя в общем она дает менее точные результаты, чем выборка того же объема, но сформированная в одну ступень. Однако при этом она имеет одно важное преимущество, которое заключается в том, что основу выборки при многоступенчатом отборе нужно строить на каждой из ступеней только для тех единиц, которые попали в выборку, а это очень важно, так как нередко готовой основы выборки нет.
Стандартную ошибку выборки при многоступенчатом отборе при группах разных объемов определяют по формуле.
Где ?1, ?2, ?3, . – стандартные ошибки на разных ступенях;
n1, n2, n3, ... – численность выборок на соответствующих ступенях отбора.
В том случае, если группы неодинаковы по объему, то теоретически этой формулой пользоваться нельзя. Но если общая доля отбора на всех ступенях постоянна, то практически расчет по этой формуле не приведет к искажению величины ошибки.
Сущность многофазной выгборки состоит в том, что на основе первоначально сформированной выборочной совокупности образуют подвыборку, из этой подвыборки – следующую подвыборку и т. д. Первоначальная выборочная совокупность представляет собой первую фазу, подвыборка из нее – вторую и т. д. Многофазную выборку целесообразно применять в случаях, если:
Для изучения различных признаков требуется неодинаковый объем выборки;
Колеблемость изучаемых признаков неодинакова и требуемая точность различна;
В отношении всех единиц первоначальной выборочной совокупности (первая фаза) необходимо собрать менее подробные сведения, а в отношении единиц каждой последующей фазы – более подробные.
Одним из несомненных достоинств многофазной выборки является то обстоятельство, что сведениями, полученными на первой фазе, можно пользоваться как дополнительной информацией на последующих фазах, информацией второй фазы – как дополнительной информацией на следующих фазах и т. д. Такое использование сведений повышает точность результатов выборочного обследования.
При организации многофазной выборки можно применять сочетание различных способов и видов отбора (типическую выборку с механической и т. д.). Многофазный отбор можно сочетать с многоступенчатым. На каждой ступени выборка может быть многофазной.
Стандартная ошибка при многофазной выборке рассчитывается на каждой фазе в отдельности в соответствии с формулами того способа отбора и вида выборки, при помощи которых формировалась ее выборочная совокупность.
Взаимопроникающие выгборки – это две или более независимые выборки из одной и той же генеральной совокупности, образованные одним и тем же способом и видом. К взаимопроникающим выборкам целесообразно прибегать, если необходимо за короткий срок получить предварительные итоги выборочных обследований. Взаимопроникающие выборки эффективны для оценки результатов обследования. Если в независимых выборках результаты одинаковы, то это свидетельствует о надежности данных выборочного обследования. Взаимопроникающие выборки иногда можно применять для проверки работы различных исследователей, поручив каждому из них провести обследование разных выборок.
Стандартная ошибка при взаимопроникающих выборках определяется по той же формуле, что и типическая пропорциональная выборка (5.3). Взаимопроникающие выборки по сравнению с другими видами требуют больших трудовых затрат и денежных расходов, поэтому исследователь должен учитывать это обстоятельство при проектировании выборочного обследования.
Предельные ошибки при различных способах отбора и видах выборки определяются по формуле ? = t?, где ? – соответствующая стандартная ошибка.
Источник
Способы формирования и типы выборок
Качество результатов выборочного наблюдения зависит от репрезентативностивыборки, т. е. от того, насколько она представительна в генеральной совокупности. Для обеспечения репрезентативности выборки надо соблюдать принцип случайности отбора статистических величин, который реализуется разными способами.
В статистике применяются различные способы формирования выборочных совокупностей, что обусловливается задачами исследования и зависит от специфики объекта изучения.
Основным условием проведения выборочного исследования является предупреждение возникновения систематических ошибок, возникающих вследствие нарушения принципа равных возможностей попадания в выборку каждой единицы генеральной совокупности. Предупреждение систематических ошибок достигается в результате применения научно обоснованных способов формирования выборочной совокупности.
Существуют следующие способы (виды) отбора единиц из генеральной совокупности:
1) индивидуальный отбор – в выборку отбираются отдельные единицы;
2) групповой отбор – в выборку попадают качественно однородные группы или серии изучаемых единиц (бригады, микрорайоны);
3) комбинированный отбор – это сочетание индивидуального и группового отбора.
Отбор также может быть нерайонированным, который предполагает отбор единиц в выборочную совокупность из генеральной совокупности, не разбитой на группы по каким-либо признакам, и районированным, когда генеральная совокупность делится на группы по признакам (например, отбор предприятий по отраслям). Способы отбора определяются правилами формирования выборочной совокупности.
В зависимости от способа отбора выделяют следующие виды выборок:
1). Собственно-случайная (простая случайная) выборка состоит в том, что выборочная совокупность образуется в результате случайного (непреднамеренного) нерайонированного отбора отдельных единиц из генеральной совокупности. Единица отбора совпадает с единицей наблюдения. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.
Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N, т. е. .
Так, при 5%-ной выборке из партии товара в 2 000 ед. численность выборки n составляет 100 ед. (5*2000:100), а при 20%-ной выборке она составит 400 ед. (20*2000:100) и т. д.
Примеры случайной выборки: лотерея, жеребьёвка или тираж. При этом обеспечивается абсолютно равная возможность попадания в выборку любой единицы. Этот способ можно осуществить также с помощью математических таблиц случайных чисел.
Собственно случайный отбор по методу проведения может быть повторным и бесповторным. При повторном отборе каждая единица, отобранная в случайном порядке из генеральной совокупности, после проведения наблюдения возвращается в эту совокупность, и может быть вновь подвергнута исследованию, т. е. имеет шанс попасть в новую выборку. При повторном отборе вероятность попадания каждой отдельной единицы генеральной совокупности в выборку остаётся постоянной. На практике такой способ отбора встречается редко.
Гораздо более распространен собственно случайный бесповторный отбор, при котором исследованные единицы в генеральную совокупность не возвращаются и не могут быть исследованы повторно. При бесповторном отборе вероятность попадания отдельных единиц в каждую последующую выборку меняется, для всех единиц, остающихся в генеральной совокупности после отбора, она возрастает.
Бесповторный отбор даёт более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т. п.), и тогда ведётся повторный отбор.
2). Механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы (группы) по определённому критерию (по алфавиту, через временные промежутки, по пространственному способу и т. д.). Затем из каждой группы выбирается по одной единице наблюдения. При этом размер интервала (шаг отбора) в генеральной совокупности равен обратной величине доли выборки, т. е. определяется путём деления числа единиц генеральной совокупности на число единиц выборочной совокупности: .
В выборочную совокупность входят единицы генеральной совокупности, расположенные в списке через данный интервал. Причём, если ряд не ранжирован, то первая единица выбирается наугад, а последующие – через равные интервалы. Так, при 2%-й выборке отбирается каждая 50-я единица (1:0,02), при 5%-й выборке – каждая 20-я единица (1:0,05) и т. д. Если статистические величины ранжированы, то выбираются единицы, находящиеся в серединах интервалов.
Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.
Важной особенностью механической выборки является то, что формирование выборочной совокупности можно осуществить, не прибегая к составлению списков. На практике часто используют тот порядок, который позволяет брать единицы так, как они фактически располагаются в генеральной совокупности. Принцип случайного отбора в механической выборке обеспечивается тем, что единицы в генеральной совокупности располагаются в таком порядке, который не оказывает влияние на изучаемый признак или фактор. Например, последовательность выхода готовых изделий с конвейера или поточной линии, порядок размещения единиц партии товара при хранении, транспортировке, реализации и т. д.
3). Типическая (стратифицированная) выборкапредполагает, что генеральная совокупность вначале разделяется на однородные типические группы по реально существующим признакам. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
Общий объём выборки n разбивается пропорционально между списками:
1-й вариант – пропорционально удельному весу типических групп:
,
где: n – объём выборки;
N – объём генеральной совокупности;
ni – число наблюдений из i-той типической группы;
Ni – объем i-той типической группы в генеральной совокупности.
2-й вариант – равномерный (из каждой группы поровну):
,
где k – число групп.
3-й вариант – оптимальный (для групп с большей вариацией признака объём наблюдений увеличивается):
.
Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации.
Типический отбор облегчает формирование выборочных совокупностей и обеспечивает более равномерное распределение единиц в генеральной совокупности.
Важной особенностью типической выборки является то, что она даёт более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.
Разновидностью типической выборки является систематический отбор, т. е. механический отбор из совокупности, ранжированной по какому-либо признаку, связанному с изучаемым признаком. Например, отбор рабочих по семейному бюджету, связанному с их средней заработной платой.
4). Серийная (гнездовая) выборкахарактеризуется тем, что генеральная совокупность первоначально разбивается не на отдельные единицы совокупности, а на определённые равновеликие или неравновеликие серии, или гнёзда (единицы внутри серий связаны по определённому признаку), из которых путём случайного отбора отбираются серии, и затем внутри отобранных серий проводится сплошное наблюдение.
Например, при 10% обследовании качества продукции можно проверять каждую 10-ю единицу (механический отбор), при серийном – через 9 часов каждый 10-й час обследуется вся выпущенная продукция в течение целого часа.
Серийный отбор применяется редко, так как даёт высокую ошибку выборки.
5).Моментная выборка означает, что на определённые моменты времени фиксируется наличие отдельных элементов изучаемого процесса.
При моментном наблюдении обычно характеризуется альтернативный признак (работа или простой). При этом в качестве численности выборочной совокупности, принимается число записей моментного обследования. Например, изучение использования работниками рабочего времени и времени работы оборудования.
Моментное наблюдение может охватывать все единицы совокупности, стать сплошным.
6). Комбинированная выборка представляет собой сочетание нескольких способов выборки. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.
Выборки также подразделяются на одноступенчатые и многоступенчатые.
При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.
При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, из них – подгрупп, а из последних выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность.
Типичный отбор состоит в многоступенчатой выборке из сочетания нескольких стадий отбора, причём на каждой стадии имеется своя единица отбора (отрасль предприятия, численность работников и средняя заработная плата).
В случае многофазной выборки из исходной выборки составляются определённые подвыборки для последующих исследований по более обширной программе. Главное отличие многофазной выборки от многоступенчатой заключается в том, что на всех его этапах используются одни и те же единицы отбора, а каждая последующая фаза опирается на совокупность единиц наблюдения предыдущей фазы. При ступенчатом отборе единицы отбора меняются на каждой ступени.
По степени охвата единиц генеральной совокупности выборки разделяются на большие и малые.
Малая выборка – такое выборочное наблюдение, численность единиц которого находится в интервале от 4-5 до 30, в противоположном случае выборка считается большой. Хотя общий принцип выборочного наблюдения – чем больше выборочная совокупность, тем точнее показатели, – иногда используют малую выборку. Малая выборка применяется при исследовании качества продукции с последующим уничтожением проверяемой единицы.
Источник