Способы формирования выборочных совокупностей
Результаты выборочного наблюдения во многом зависят от способов формирования и отбора единиц в выборочную совокупность. Основным принципом правильности отбора единиц является строго объективный подход к отбору единиц для наблюдения. Соблюдение этого принципа позволяет предотвратить систематических (тенденциозных) ошибок и наиболее точно и полно представить генеральную совокупность.
Предупреждение систематических ошибок достигается в результате применения научно-обоснованных способов формирования выборочной совокупности.
При формировании выборочной совокупности должны быть обеспечены два условия:
1) равные возможности для каждой единицы генеральной совокупности попасть в выборку (так называемый принцип рівноможливості);
2) достаточно представительная численность выборочной совокупности.
В статистике применяются различные виды и способы формирования выборочной совокупности. В каждом конкретном случае в зависимости от целого ряда условий, а именно задач исследования, сущности исследуемого явления, специфики объекта, объема совокупности, колебания признака, наличия материальных и трудовых ресурсов, выбирают наиболее оптимальную систему формирования выборочной совокупности, которая определяется видом и способом отбора.
По видам различают: 1) индивидуальный отбор - в выборку попадают отдельные единицы генеральной совокупности; 2) групповой отбор - в выборку попадают качественно однородные группы или серии изучаемых единиц; 3) комбинированный отбор как комбинация индивидуального и группового отбора.
Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике применения выборочного наблюдения наибольшее распространение получили следующие виды выборки: собственно-случайная, механическая, типичная, серийная (гнездовая) и комбинированная. Эти способы могут быть применены и в сочетании друг с другом.
При собственно-случайной выборке отбор единиц из генеральной совокупности производится без предварительного расчленения ее на какие-либо группы и единица наблюдения совпадает с учетной единицей.
Суть случайного отбора заключается в том, что каждая единица наблюдения попадает в выборку случайно - по жребию. В зависимости от способа отбора единиц различают повторный и безповторний отбор.
При повторном отборе (по схеме возвращенного слоя) каждая единица после ее регистрации возвращается в генеральную совокупность и снова может быть отобранной. Этот способ отбора обеспечивает постоянство состава генеральной совокупности. Вероятность попадания каждой единицы в выборку остается постоянной, следовательно, сохраняется независимость следующего извлечения единиц от предыдущих.
При бесповторном отборе (по схеме неповерненок) слоя) каждая единица после ее регистрации в генеральную совокупность не возвращается и в дальнейшем отборе не участвует, то есть и сама единица не может дважды попасть в выборку. Поэтому бесповторная выборка лучше репрезентирует генеральную совокупность и, следовательно, дает меньшую ошибку, чем повторная.
В отличие от повторного отбора при бесповторном отборе не сохраняется постоянство генеральной совокупности, а вероятность попадания отдельных единиц в выборку все время изменяется (для единиц, что остались, она растет). В связи с этой особенностью в формулы средней и предельной ошибок выборки вводится поправочный коэффициент, о чем уже упоминалось выше.
Чтобы избавиться от элементов субъективности при отборе единиц из генеральной совокупности можно пользоваться таблицей случайных чисел.
Случайный отбор дает хорошие результаты в однородных совокупностях, т.е. в тех, где вариация признака является незначительной. Если же совокупность неоднородна и состоит из разных типов явлений, то необходимо применить типичную выборку.
Механический отбор - это разновидность случайного отбора. Суть его заключается в том, что все единицы генеральной совокупности располагаются в определенном порядке (по возрастанию или убыванию, по алфавиту, географическим положением и т.д.), а затем чисто механически через определенный интервал отбираются единицы в выборочную совокупность.
Например, если нужно отобрать 100 объектов из генеральной совокупности численностью 1000 единиц, то величина интервала составит к = N: п = 1000: 100 = 10, то есть следует отобрать по одной единице с каждого десятка. Чтобы обеспечить случайность отбора целесообразно первую выборку из первого интервала провести по жребию. Если отбор начинают с третьего объекта, то в выборку попадут 3-й, 13-й, 23-й и т.д. объекты.
Среднее и предельные ошибки выборки при механическом отборе рассчитывают по тем же формулам, что и для случайного бесповторного отбора, поскольку механический отбор, как правило, проводится безповторно.
При типичном отборе всю генеральную совокупность предварительно разделяют на типовые группы по исследуемой признаку, а затем из каждой группы случайным или механическим способом отбирают необходимое количество единиц. При этом до начала отбора необходимо обеспечить принцип пропорционального представительства каждой группы в соответствии с их численностью или их средних квадратических отклонений или дисперсий. Возможен также отбор, пропорциональный обоим показателям - численности единиц в типичных группах и степени вариации признака. Такой отбор называется оптимальным. На практике чаще всего применяют выборку пропорционально численности типических групп.
Расчленение совокупности на типовые группы дает возможность устранить влияние межгрупповой (систематической) вариации на результаты выборки, поскольку в выборке обеспечивается представительство всех групп, что может не иметь места при случайном отборе. Итак, самой выборке воспроизводится (отображается) межгрупповая вариация. Остается вариация выборочных данных вокруг средних (внутригрупповая или остаточная вариация), которую определяют по каждой из выделенных типовых групп.
Поэтому размер средней ошибки выборки будет определяться только величиной внутригрупповой (остаточной) вариации (&1.ір) признаки, которая меньше общей на величину межгрупповой вариации. Остаточную дисперсию вычисляют как среднюю арифметическую взвешенную из средних квадратов отклонений, которые измеряют остаточную вариацию в каждой группе.
Средняя ошибка типовой выборки рассчитывается по формуле:
Приведем формулы предельных ошибок выборки для выборочной средней и доли для типичной выборки:
Типический отбор дает более точный результат по сравнению со случайным или механическим отбором, поскольку расчленением совокупности на типовые группы обеспечивается попадание в выборку единиц от всех выделенных групп и типов.
Суть серийного отбора заключается в том. что отбору подлежат не отдельные единицы генеральной совокупности, а целые серии таких единиц. В отобранных методом случайного бесповторного или механического отбора сериях проводят сплошной описание всех единиц, которые в них вошли. При этом общее число серий, которые составляют генеральную совокупность, рассматривают как общую численность Nc, а количество отобранных - как объем выборки пс.
Поскольку при серийном способе формирования выборочной совокупности каждая серия выступает как самостоятельная единица наблюдения, то вариация внутри серий (внутрішньосерійна, аг,£) при расчете средней ошибки должна быть исключена. Следовательно, средняя ошибка выборки в этом случае зависит только от міжсерійної вариации в"*,,:
Формулы предельных ошибок выборки для средней и для доли при серийном отборе будут иметь вид:
Комбинированный отбор.
Рассмотрены способы выборки на практике применяются не только самостоятельно, но и в комбинировании в разных сочетаниях и с разной последовательностью. Так, например, можно комбинировать серийный отбор из собственно случайной выборке. При этом генеральная совокупность сначала делится на серии и отбирается необходимое число серий, а дальше в отобранных сериях производится случайный отбор единиц в выборочную совокупность. Возможна также комбинация типичной и серийной выборки, когда серии отбираются в установленном порядке с нескольких типовых групп.
Различают также одноступенчатый и многоступенчатый способы отбора единиц в выборочную совокупность.
При одноступінчастій выборке каждая отобранная единица сразу же подлежит изучению. Так обследуют единицы выборочной совокупности при собственно-случайной выборке.
При многоступенчатой выборке сначала проводят отбор из генеральной совокупности отдельных групп, а затем из отобранных групп формируют выборку второго, третьего и т.д. порядка, которую и анализируют.
В статистической практике наиболее широкое применение получили двухступенчатая и трехступенчатая выборки. Примером двухступенчатой выборки может быть анализ качества семян, при котором сначала отбирают пробы из партии семян, а затем из отобранных проб выделяют навеску для определения его качества (всхожести, чистоты и других посевных качеств семян). Примером трехступенчатой выборки является отбор семей для бюджетного обследования, при котором на первой стадии с учетом производственного направления отбирают районы, на второй - предприятия, и, наконец, на третий - отдельные семьи.
Многоступенчатая выборка дает, как правило, менее точные результаты по сравнению с одноступінчастою, поскольку ее ошибки складываются из ошибок на отдельных ступенях отбора. Однако на практике, если одноступенчатую выборку организовать сложно, используют многоступенчатую выборку.
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе данных, полученных по выборке и распространение этих данных на всю совокупность. При этом выборочные средние и относительные показатели должны быть распространены на генеральную совокупность с учетом возможных предельных ошибок выборки.
Существует два способа такого распространения: 1) способ прямого перечисления; 2) способ поправочных коэффициентов.
Суть способа прямого пересчета заключается в перемноженні среднего значения признака найденного в результате выборочного наблюдения на число единиц генеральной совокупности. Предположим, что при изучении шерстної продуктивности овец выборочным наблюдением в личных подсобных хозяйствах населения было установлено, что средний настриг на овцу составил 3,0 кг. Зная, что в хозяйствах населения 2000 овец, можно способом прямого перечисления достать величину валового настрига шерсти; 3,0 o 2000 = 6000 кг, или 6,0 т. Если при этом известно, что предельная ошибка выборки с вероятностью Р = 0,95 равна 0,1 кг и, следовательно, генеральная средняя с такой же вероятностью колеблется в пределах от 2,9 до 3,1 кг, то общий валовой настриг шерсти будет колебаться от 5,8 до 6,2 т.
Способ поправочных коэффициентов применяется в случаях, когда целью выборочного наблюдения является уточнение результатов сплошного наблюдения. При уточнении данных сплошного наблюдения на основе выборочного наблюдения определяется так называемый поправочный коэффициент, которым и пользуются для внесения поправок в данные сплошного наблюдения. Предположим, что по данным сплошного наблюдения в хозяйствах населения зарегистрировано 1500 коров. Контрольными обходами было охвачено 10% дворов, где зарегистрировано 160 коров, а по данным сплошного наблюдения числилось 155 коров. Поправочный коэффициент составит (160:155)400=1,0322, или 103,22%. Таким образом, недоучет коров при сплошном наблюдении составил 3,22%, а фактическая численность коров в хозяйствах населения с поправкой на недоучет составляет: 1500 o 1,0322 = 1548 коров.