Выборочное наблюдение
Понятие выборочного наблюдения и его теоретические основы
Как отмечалось в разделе 2, по степени охвата единиц исследуемой совокупности статистическое наблюдение может быть сплошным и несплошным.
Сплошное наблюдение предусматривает обследование всех без исключения единиц генеральной совокупности. Например, для определения общей численности населения во время переписи собирают данные о каждом отдельном человеке, который проживает в стране, для установления объема произведенной продукции (зерна, молока, мяса и т.д.), ведут ежедневный учет ее выхода и т. д.
Однако по некоторым причинам (большой трудоемкости, длительности проведения, высокой стоимости и т.д.) сплошное наблюдение часто бывает экономически нецелесообразным или практически неосуществимым. Поэтому на практике преимущественно применяют несплошное наблюдение, разновидностью которого является выборочное.
Выборочным наблюдением в статистике называют такой вид наблюдения, который дает возможность сделать вывод о всей совокупности единиц при обследовании только ее части. Примером выборочного наблюдения может быть выборочное обследование условий жизни домохозяйств, определение потерь урожая, качества продукции, полевые опыты и т.д.
Совокупность методов математической статистики, применяемые для обоснований и заключений при проведении выборочного наблюдения, называют выборочным методом.
Выборочное наблюдение является одним из видов несплошного наблюдения, что наиболее широко применяется. Выборочными данными пользуются достаточно широко в различных сферах общественной жизни. Например, для оценки качества сельскохозяйственной продукции (зерна, молока и т.д.) нет необходимости в исследовании всего объема продукции, для этого достаточно лишь взять определенное количество проб.
Выборочное исследование получило широкое распространение в государственной и ведомственной статистике. В статистической практике выборочное наблюдение применяется для обследования условий жизни домохозяйств, жилищных условий семей рабочих и служащих, их заработной платы, цен на рынках, в научной работе при статистической обработке результатов исследования, для изучения и контроля качества продукции, общественного мнения и т.п.
В сельском хозяйстве выборочное наблюдение применяется для определения качества продукции, потерь урожая, засоренности посевов, всхожести, влажности, засоренности зерна, использования рабочего времени, контрольных проверок переписи скота и т.д.
При соблюдении правил научной организации обследования выборочное наблюдение дает достаточно точные результаты, поэтому его часто применяют для уточнения данных сплошного учета. Так, при проведении переписи населения организуют выборочные контрольные обходы для проверки правильности записей сплошного наблюдения, во время переписи (учета) скота на основе выборочных данных определяют процент недоучета скота у населения и др.
В некоторых случаях выборочное наблюдение используют для исследования процессов и явлений, сплошное наблюдение которых нецелесообразно вследствие слишком большого объема работ, например обследование семейных бюджетов, регистрация цен на рынках, изучение потребительского спроса населения и т.п.
В проведении ряда исследований выборочное наблюдение является единственно возможным, например при контроле качества продукции, если проверка сопровождается уничтожением или порчей образцов, обследуются (определение жирности молока, всхожести зерна, прочности тканей на разрыв, продолжительности горения электрических ламп и т.д.).
Широкому использованию выборочного наблюдения в статистической практике способствует современная вычислительная техника, которая позволяет значительно усложнить процедуры обработки исходной информации, а потому повысить надежность статистических показателей, получают по данным выборки.
Из всех видов несплошного наблюдения главным является выборочное наблюдение, поскольку только данные этого наблюдения позволяют научно-обоснованно и с необходимой вероятностью распространить данные, полученные по части совокупности на всю совокупность.
Научно организованное выборочное наблюдение имеет ряд существенных преимуществ перед сплошным.
1. Экономия трудовых, материальных ресурсов и средств за счет сокращения объемов работ по сбору, обработке и обобщении данных. Например, если в выборке подлежит 10% общей численности единиц, то объем работ сокращается по сравнению со сплошным обследованием в 10 раз.
2. Проведение наблюдения в сжатые сроки и по более широкой программе, получения конечных результатов исследования в более короткие сроки.
3. Сведение к минимуму порчи или даже уничтожения исследуемых образцов при проверке их качества.
4. Достижения большей точности результатов наблюдения благодаря сокращению ошибок, возникающих при регистрации. В процессе проведения выборочного наблюдения необходимо дать правильное представление об сводные показатели всей совокупности на основе обследования ее части при условии соблюдения всех требований и принципов проведения статистического наблюдения и научно организованной работы по отбору единиц.
Совокупность отобранных для обследования единиц принято называть выборочной, а совокупность единиц, из которой производится отбор, - генеральной.
Свойство выборочной совокупности воспроизводить генеральную совокупность получила название репрезентативности, что означает представительство с определенной точностью и достоверностью. В связи с тем, что при выборочном наблюдении обследуется только часть единиц генеральной совокупности, характеристики выборочной совокупности, как правило, отличаются от характеристик выборочной совокупности, т.е. имеют место так называемые ошибки репрезентативности (соответствия, отображения).
Поэтому одной из основных задач выборочного метода является получение таких выборочных характеристик, которые бы как можно точнее воспроизводили характеристики генеральной совокупности, то есть давали наименьшие ошибки репрезентативности.
Объективную гарантию репрезентативности полученной выборочной совокупности дает применение соответствующих научно обоснованных способов отбора единиц, подлежащих обследованию. В процессе формирования выборочной совокупности должен быть обеспечен строго объективный подход к отбору единиц, что гарантирует равную возможность каждой единицы генеральной совокупности попасть в выборку. Количество отобранных при этом единиц должно быть достаточно большим.
Цель выборочного наблюдения заключается в том, что на основе отобранных из генеральной совокупности для обследования единиц необходимо дать оценку неизвестным параметрам генеральной совокупности.
Теоретической основой выборочного метода является математические теоремы закона больших чисел, изложение которых дается в курсе математической статистики и теории вероятностей.
Большой вклад в разработку теоретических основ выборочного метода внесли Я.Бернуллі, С.Пуассон, К.Пірсон, Р.фишер, В.Госсет. П.Л.Чебишев, О.М.Ляпунов и др. Неравенство П.Л.Чебишева относительно выборочного метода может быть сформулирована так: при неограниченном увеличении числа независимых наблюдений (п -"со) в генеральной совокупности с ограниченной дисперсией с вероятностью сколь угодно близкой к единице, можно ожидать, что отклонение выборочной средней от генеральной средней будет сколь угодно малое, то есть
где Г - вероятность неравенства, что стоит в скобках; есть --какое угодно малое положительное число; х и х - выборочная и генеральная средняя.
На основе теорем закона больших чисел решаются два взаимосвязанных и важных в практическом отношении вопросы выборочного наблюдения: расчет необходимой численности выборки и определения ошибок выборки при заданном уровне доверительной вероятности.
Результаты выборочного наблюдения характеризуются средними и относительными обобщающими показателями. Обобщающие показатели генеральной совокупности (средняя, доля, дисперсия и др.) называют генеральными, а соответствующие обобщающие показатели выборочной совокупности -выборочными.
В выборочном наблюдении приняты такие обозначения. Объем генеральной совокупности обозначают через N а выборочной - через п. Среднюю величину и дисперсию признака в генеральной совокупности называют генеральной средней и генеральной дисперсией. Генеральную среднюю обозначают через X, а генеральную дисперсию - за <зг.
Среднюю величину и дисперсию признака в выборочной совокупности называют выборочной средней и выборочной дисперсией. Выборочную среднюю обозначают через х , а выборочную дисперсию - через ст2.
Долю единиц, обладающих данным признаком в генеральной совокупности, называют генеральной долей. Относительная величина доли, полученная в результате выборочного наблюдения, называется выборочной долей или частістю. Частость показывает, какая доля единиц выборочной совокупности владеет исследуемой признаку. Генеральную долю обозначают через р, а частость - через ср.
Приведем пример расчета указанных показателей для генеральной и выборочной совокупности. Предположим, что из 300 одинаковых по площади участков посева, но с разной урожайностью ячменя, представляющих генеральную совокупность, отобраны в случайном порядке 30 участков (10% всех участков), составляющих выборочную совокупность (табл. 6.1).
Таблица 6.1. Урожайность ячменя и число участков генеральной и выборочной совокупностей
Определим по этим данным среднюю урожайность, дисперсию и долю участков с урожайностью 25 ц/га и более для генеральной и выборочной совокупностей: а) для генеральной совокупности средняя урожайность
доля участков с урожайностью 25 ц/га и более
б) для выборочной совокупности
доля участков с урожайностью 25 ц/га и более
Итак, генеральная средняя составляет 25,0 ц/га, генеральная дисперсия -0,50, а генеральная доля - 0,77, соответственно выборочная средняя - 25,1 ц/га, выборочная дисперсия - 0,49. выборочная частость - 0,80. Как видно, те же показатели генеральной и выборочной совокупностей не совпадают. В абсолютном выражении разница между средними составляет 0,1 ц/га, между частицами - 0,03. Незначительные расхождения между средними и относительными показателями свидетельствуют о том, что выборочная совокупность достаточно точно репрезентирует генеральную совокупность.