Статистика: конспект лекций.
6.4. Способы отбора и виды выборки.
В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный и бесповторный. При повторном отборе каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку. Этот способ отбора построен по схеме «возвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности не меняется независимо от числа отбираемых единиц. При бесповторном отборе каждая единица, отобранная в случайном порядке, после ее обследования в генеральную совокупность не возвращается. Этот способ отбора построен по схеме «невозвращенного шара»: вероятность попасть в выборку для каждой единицы генеральной совокупности увеличивается по мере производства отбора.
В зависимости от методики формирования выборочной совокупности различают следующие основные виды выборки:
Типическую (стратифицированную, районированную);
Собственно случайная выгборка формируется в строгом соответствии с научными принципами и правилами случайного отбора. Для получения собственно случайной выборки генеральная совокупность строго подразделяется на единицы отбора, и затем в случайном повторном или бесповторном порядке отбирается достаточное число единиц.
Случайный порядок подобен жеребьевке. На практике он чаще всего применяется при использовании специальных таблиц случайных чисел. Если, например, из совокупности, содержащей 1587 единиц, следует отобрать 40 единиц, то из таблицы отбирают 40 четырехзначных чисел, которые меньше 1587.
В том случае, когда собственно случайная выборка организуется как повторная, расчет стандартной ошибки производится в соответствии с формулой (6.1). При бесповторном способе отбора формула для расчета стандартной ошибки будет:
Где 1 – n / N – доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе при прочих равных условиях всегда меньше, чем при повторном. Бесповторный отбор организовать легче, чем повторный, и он применяется намного чаще. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле (5.1). Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, большая и, следовательно, величина близка к единице.
Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невозможно, так как при использовании таблиц случайных чисел необходимо пронумеровать все единицы генеральной совокупности. Довольно часто генеральная совокупность такая большая, что провести подобную предварительную работу чрезвычайно сложно и нецелесообразно, поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако организуются они так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.
При чисто механической выборке вся генеральная совокупность единиц должна быть прежде всего представлена в виде списка единиц отбора, составленного в каком-то нейтральном по отношению к изучаемому признаку порядке, например по алфавиту. Затем список единиц отбора разбивается на столько равных частей, сколько необходимо отобрать единиц. Далее по заранее установленному правилу, не связанному с вариацией исследуемого признака, из каждой части списка отбирается одна единица. Этот вид выборки не всегда может обеспечить случайный характер отбора, и полученная выборка может оказаться смещенной. Объясняется это тем, что, во-первых, упорядочение единиц генеральной совокупности может иметь элемент неслучайного характера. Во-вторых, отбор из каждой части генеральной совокупности при неправильном установлении начала отсчета может также привести к ошибке смещения. Однако практически легче организовать механическую выборку, чем собственно случайную, и при проведении выборочных обследований чаще всего пользуются этим видом выборки. Стандартную ошибку при механической выборке определяют по формуле собственно случайной бесповторной выборки (6.2).
Типическая (районированная, стратифицированная) выборка преследует две цели:
• обеспечить представительство в выборке соответствующих типических групп генеральной совокупности по интересующим исследователя признакам;
• увеличить точность результатов выборочного обследования.
При типической выборке до начала ее формирования генеральная совокупность единиц разбивается на типические группы. При этом очень важным моментом является правильный выбор группировочного признака. Выделенные типические группы могут содержать одинаковое или различное число единиц отбора. В первом случае выборочная совокупность формируется с одинаковой долей отбора из каждой группы, во втором – с долей, пропорциональной ее доле в генеральной совокупности. Если выборка формируется с равной долей отбора, по существу она равносильна ряду собственно случайных выборок из меньших генеральных совокупностей, каждая из которых и есть типическая группа. Отбор из каждой группы осуществляется в случайном (повторном или бесповторном) либо механическом порядке. При типической выборке, как с равной, так и неравной долей отбора, удается устранить влияние межгрупповой вариации изучаемого признака на точность ее результатов, так как обеспечивается обязательное представительство в выборочной совокупности каждой из типических групп. Стандартная ошибка выборки будет зависеть не от величины общей дисперсии ?2, а от величины средней из групповых дисперсий ?i2. Поскольку средняя из групповых дисперсий всегда меньше общей дисперсии, постольку при прочих равных условиях стандартная ошибка типической выборки будет меньше стандартной ошибки собственно случайной выборки.
При определении стандартных ошибок типической выборки применяются следующие формулы:
• при повторном способе отбора.
• при бесповторном способе отбора:
– средняя из групповых дисперсий в выборочной совокупности.
Серийная (гнездовая) выборка – это такой вид формирования выборочной совокупности, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий (гнезд) обследованию подвергаются все единицы. Серийную выборку практически организовать и провести легче, чем отбор отдельных единиц. Однако при этом виде выборки, во-первых, не обеспечивается представительство каждой из серий и, во-вторых, не устраняется влияние межсерийной вариации изучаемого признака на результаты обследования. В том случае, когда эта вариация значительна, она приведет к увеличению случайной ошибки репрезентативности. При выборе вида выборки исследователю необходимо учитывать это обстоятельство. Стандартная ошибка серийной выборки определяется по формулам:
• при повторном способе отбора —
Где ?– межсерийная дисперсия выборочной совокупности; r – число отобранных серий;
• при бесповторном способе отбора —
Где R – число серий в генеральной совокупности.
В практике те или иные способы и виды выборок применяются в зависимости от цели и задач выборочных обследований, а также возможностей их организации и проведения. Чаще всего применяется комбинирование способов отбора и видов выборки. Такие выборки получили название комбинированные. Комбинирование возможно в разных сочетаниях: механической и серийной выборки, типической и механической, серийной и собственно случайной и т. д. К комбинированной выборке прибегают для обеспечения наибольшей репрезентативности с наименьшими трудовыми и денежными затратами на организацию и проведение обследования.
При комбинированной выборке величина стандартной ошибки выборки состоит из ошибок на каждой ее ступени и может быть определена как корень квадратный из суммы квадратов ошибок соответствующих выборок. Так, если при комбинированной выборке в сочетании использовались механическая и типическая выборки, то стандартную ошибку можно определить по формуле.
Где ?1 и ?2 – стандартные ошибки соответственно механической и типической выборок.
Особенность многоступенчатой выгборки состоит в том, что выборочная совокупность формируется постепенно, по ступеням отбора. На первой ступени с помощью заранее определенного способа и вида отбора отбираются единицы первой ступени. На второй ступени из каждой единицы первой ступени, попавшей в выборку, отбираются единицы второй ступени и т. д. Число ступеней может быть и больше двух. На последней ступени формируется выборочная совокупность, единицы которой подлежат обследованию. Так, например, для выборочного обследования бюджетов домашних хозяйств на первой ступени отбираются территориальные субъекты страны, на второй – районы в отобранных регионах, на третьей – в каждом муниципальном образовании отбираются предприятия или организации и, наконец, на четвертой ступени – в отобранных предприятиях отбираются семьи.
Таким образом, выборочная совокупность формируется на последней ступени. Многоступенчатая выборка более гибкая, чем другие виды, хотя в общем она дает менее точные результаты, чем выборка того же объема, но сформированная в одну ступень. Однако при этом она имеет одно важное преимущество, которое заключается в том, что основу выборки при многоступенчатом отборе нужно строить на каждой из ступеней только для тех единиц, которые попали в выборку, а это очень важно, так как нередко готовой основы выборки нет.
Стандартную ошибку выборки при многоступенчатом отборе при группах разных объемов определяют по формуле.
Где ?1, ?2, ?3, . – стандартные ошибки на разных ступенях;
n1, n2, n3, ... – численность выборок на соответствующих ступенях отбора.
В том случае, если группы неодинаковы по объему, то теоретически этой формулой пользоваться нельзя. Но если общая доля отбора на всех ступенях постоянна, то практически расчет по этой формуле не приведет к искажению величины ошибки.
Сущность многофазной выгборки состоит в том, что на основе первоначально сформированной выборочной совокупности образуют подвыборку, из этой подвыборки – следующую подвыборку и т. д. Первоначальная выборочная совокупность представляет собой первую фазу, подвыборка из нее – вторую и т. д. Многофазную выборку целесообразно применять в случаях, если:
Для изучения различных признаков требуется неодинаковый объем выборки;
Колеблемость изучаемых признаков неодинакова и требуемая точность различна;
В отношении всех единиц первоначальной выборочной совокупности (первая фаза) необходимо собрать менее подробные сведения, а в отношении единиц каждой последующей фазы – более подробные.
Одним из несомненных достоинств многофазной выборки является то обстоятельство, что сведениями, полученными на первой фазе, можно пользоваться как дополнительной информацией на последующих фазах, информацией второй фазы – как дополнительной информацией на следующих фазах и т. д. Такое использование сведений повышает точность результатов выборочного обследования.
При организации многофазной выборки можно применять сочетание различных способов и видов отбора (типическую выборку с механической и т. д.). Многофазный отбор можно сочетать с многоступенчатым. На каждой ступени выборка может быть многофазной.
Стандартная ошибка при многофазной выборке рассчитывается на каждой фазе в отдельности в соответствии с формулами того способа отбора и вида выборки, при помощи которых формировалась ее выборочная совокупность.
Взаимопроникающие выгборки – это две или более независимые выборки из одной и той же генеральной совокупности, образованные одним и тем же способом и видом. К взаимопроникающим выборкам целесообразно прибегать, если необходимо за короткий срок получить предварительные итоги выборочных обследований. Взаимопроникающие выборки эффективны для оценки результатов обследования. Если в независимых выборках результаты одинаковы, то это свидетельствует о надежности данных выборочного обследования. Взаимопроникающие выборки иногда можно применять для проверки работы различных исследователей, поручив каждому из них провести обследование разных выборок.
Стандартная ошибка при взаимопроникающих выборках определяется по той же формуле, что и типическая пропорциональная выборка (5.3). Взаимопроникающие выборки по сравнению с другими видами требуют больших трудовых затрат и денежных расходов, поэтому исследователь должен учитывать это обстоятельство при проектировании выборочного обследования.
Предельные ошибки при различных способах отбора и видах выборки определяются по формуле ? = t?, где ? – соответствующая стандартная ошибка.
Источник
Вопрос 2. Способы отбора единиц из генеральной совокупности.
Существует 5 основных способов отбора единиц из генеральной совокупности в выборочную.
1. Собственно-случайный отбор состоит в том, что выборочная совокупность образуется в результате случайного отбора n отдельных единиц из генеральной совокупности N объектов. При этом количество отобранных в выборку единиц обычно определяется исходя из принятой доли выборки. Важным условиям репрезентативности собственно-случайной выборки является то, что каждой единице генеральной совокупности представляется равная возможность попасть в выборку. Формирование собственно-случайной выборки осуществляется с помощью:
· фишек (жеребьевки), при этомвсе единицы совокупности нумеруются, номера записываются на карточки, а потом единицы совокупности выбираются в случайном порядке;
· таблицы случайных чисел или специальной программы – генератора случайных чисел (как правило, используются на практике).
Собственно-случайный отбор может быть как бесповторным, так и повторным. Собственно случайный отбор даёт лотерея или жеребьёвка. Например, в тираже выигрышей денежно-вещевой лотереи или государственных займов обеспечивают абсолютно равную возможность попадания в тираж (выборку) любого номера билета. Владельцы каждого номера билета имеют равную возможность на выигрыш.
2.Простой отбор с помощью регулярной процедурыили механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы. Такой отбор осуществляется с применением механической составляющей (номера квартиры, даты, дня недели, буквы алфавита). На практике механическая выборка обычно осуществляется при помощи так называемого шага отбора
1) Все единицы совокупности нумеруются
2) Определяется шаг отбора
При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.
На практике собственно случайный отбор в чистом виде применяется очень редко. Обычно применяют механический отбор единиц выборочной совокупности, который является разновидностью собственно-случайного отбора. При механическом отборе 100 студентов из 1000 поступают так: составляют алфавитный список, в который включают всех студентов, и определяют интервал, равный частному от деления генеральной совокупности на численность выборочной совокупности. Например, интервал равен 10. Величина интервала при механическом отборе равен обратной величине относительного объёма выборки. Например, при 5%-ной выборке интервал равен 20.
Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. По отношению к изучаемому показателю единицы генеральной совокупности могут быть упорядочены по существенному, второстепенному или нейтральному признаку.
При упорядочении по существенному или второстепенному признаку в выборочную совокупность должна отбираться та единица, которая находится в середине каждой группы.
При упорядочении по нейтральному признаку из первой группы генеральной совокупности можно взять любую единицу. Для обеспечения репрезентативности во всех последующих группах механической выборки берут лишь те единицы, которые соответствуют порядковому номеру единицы, отобранной в первой группе. Принцип случайного отбора в механической выборке обеспечивается тем, что единицы генеральной совокупности располагаются в таком порядке, который не оказывает никакого влияния на поведение интересующего исследователя признака.
Механическая выборка является бесповторной. Механический способ отбора удобен к применению и в тех случаях, когда генеральная совокупность формируется постепенно, и заранее список её единиц составить нельзя. Например, при выборочном обследовании покупателей магазина, посетителей поликлиник и т.д. В данных случаях заранее составить списки генеральной совокупности нельзя, так как она формируется постепенно. Но, обследуя, например каждого пятого, или десятого и т.д. посетителя можно организовать механическую выборку, обеспечивая случайность отбора.
3. На практике исследователи чаще всего имеют дело с неоднородными по изучаемым показателям совокупности (например, изучение платёжеспособного спроса населения на услуги сервиса). В этом случае обычно прибегают к предварительному районированию генеральной совокупности, т.е. разбивают на группы (на отдельные типы) по признакам, от которых зависят изучаемые показатели. Внутри этих групп производится механический отбор или собственно-случайный отбор единиц выборочной совокупности. Такой способ отбора называется.
Типическая выборка — отбор в соответствии с принятой схемой (собственно-случайной или механической (последний также носит название типический отбор с механической выборкой или механический отбор с предварительным районированием), который производится из генеральной совокупности, предварительно разделенной на типы (однородные группы).
Способ проведения типической выборки:
1. вся совокупность делится на типические группы
2. из каждой типической группы отбирается некоторое количество единиц
Репрезентативность типической выборки обеспечивается расчленением генеральной совокупности на качественно однородные группы, что обусловливает представительство в выборке каждой типологической группы.
В некоторых источниках типическую выборку называют стратифицированной. Стратифицированныйотбор заключается в том, что генеральная совокупность объема N подразделяется на части совокупности или слои (страты) объема N1, N2, … , Nr, так что N1 + N2 + … + Nr = N. Страты — однородные объекты с точки зрения статистических характеристик (например, население по возрасту делится на две страты – в трудоспособном и нетрудоспособном возрасте; банки – по размеру капитала). В этом случае выборки называются стратифицированными (расслоенными, типическими,районированными).
Типический отбор выгодно применять тогда, когда неравномерно распределяются показатели между группами, иначе говоря, при большой дисперсии групповых средних (межгрупповая вариация). Кроме того, при типическом отборе достигается более полное представление в выборе отдельных типов изучаемого явления. Поэтому можно сказать, что при изучении сложных совокупностей предварительное (выделение групп) является одним из важнейших принципов научной организации выборочного наблюдения.
4. При серийной (гнездовой) выборке из генеральной совокупности отбирают не отдельные единицы, а целые их серии (гнезда). В состав серий или гнёзд входят единицы, связанные определённым образом: например, территориально (селения, районы и др.), организационно (студенческие группы, предприятия и т.д.), упаковкой (продукция, оформляемая в пачки, коробки, ящики, и т.д.) и др. группы. Отбор серий производится посредством собственно-случайной или механической выборки. Внутри каждой из попавших в выборку серий обследуются, как правило, все без исключения единицы, т. е. применятся, как правило, сплошное наблюдение. Серийная (гнездовая) выборка удобна втом случае, если необходимо обследовать сразу «блок» или серию объектов (например, партию товара, продукцию определенной серии или предприятия территориально-административной единицы).
5. Комбинированный отбор предполагает сочетание перечисленных способов (например, стратифицированный и случайный или случайный и механический).
Источник