Определение необходимой численности выборки
При организации выборочного наблюдения возникает вопрос о том, какой должна быть численность выборочной совокупности, при которой пределы возможной ошибки не превысят некоторой заранее заданной исследователем величины. Необходимо установить такую численность выборки, которая с доверительным уровнем вероятности Р обеспечивала бы получение данных, достаточно полно отражают обобщающие характеристики генеральной совокупности.
Слишком большая выборка приведет к нерациональных затрат трудовых и материальных средств, а недостаточная - к большим ошибкам. Следовательно, надо установить оптимальную численность выборки, которая бы гарантировала нужную точность результатов и надежность выводов наблюдения.
Необходимая численность выборки зависит от следующих факторов:
1. Размера предельной ошибки выборки ер, т.е. величины возможных отклонений показателей генеральной совокупности от показателей выборочной совокупности. Чем меньше размер заданной предельной ошибки, тем больше должна быть численность выборки.
При определении необходимой численности выборки предельная ошибка выборки заранее задается самим исследователем в зависимости от характера решаемых задач и требуемой точности выводов. На практике обычно исходят из того, что предельная ошибка выборки по отношению к средней ошибки не превышает 1-5%. Другими словами, этот процент не должен превышать принят доверительный уровень значимости а.
2. Степени вариации изучаемого признака. Чем больше вариация (дисперсия, коэффициент вариации и др.,), тем большей должна быть численность выборки.
3. Уровня доверительной вероятности Р, с которой требуется гарантировать допустимые размеры предельной ошибки выборки. Вероятность в свою очередь связана с нормированным отклонением и. Чем больше заданный уровень доверительной вероятности Р, тем более нормированное отклонение и, тем большей должна быть численность выборочной совокупности.
4. Способа отбора единиц в выборочную совокупность (повторный или безповторний отбор).
Следовательно, при определении необходимой численности выборки должны быть заданы следующие условия: а) размер предельной ошибки; б) уровень вариации (дисперсия, коэффициент вариации и др.); в) уровень доверительной вероятности и значения нормированного отклонения, что соответствует ей.
Формулы для расчета необходимой численности выборки выводятся из формул предельных ошибок для средней и для доли путем соответствующих алгебраических преобразований:
Приведем формулы необходимой численности выборки для различных способов отбора;
а) при определении среднего размера признака и о
п = £2 - собственно случайная и механическая повторная выборка;
При исчислении необходимой численности выборки нужно знать меру колебания исследуемого признака. Однако, дисперсия признака или ее доля р в генеральной совокупности, как правило, неизвестны и будут определяться только после проведения выборочного наблюдения. Не зная этих величин, можно определить необходимую численность выборки.
Трудности, которые возникают, можно решить следующими путями:
1. Вместо фактического значения а0 или г подставляют данные предыдущих выборочных наблюдений, которые проводились в аналогичных целях.
2. Можно провести пробные обследования на небольшом объеме выборки и по данным нескольких таких обследований взять наибольшее значение дисперсии или доли.
3. Неизвестную величину среднего квадратического отклонения можно найти примерно по величине размаха предполагаемой вариации (К - хтах ~ хтіп). Доказано, что с вероятностью Р = 0,997 можно утверждать, что размах вариации в нормальном распределении признака заключается в бст (крайние значения находятся на расстоянии в ту или другую сторону от средней величины на 3 ст), то есть ІР = бст, отсюда ст = 1/6 ИР.
4. Если расчет необходимой численности выборки проводится для альтернативной признаки и ее доля неизвестна хотя бы примерно, то она принимается равной своему максимальному значению 0,5 и дает величину дисперсии, которая равна 0,25 (рд = 0,5 o 0,5).
Тогда формулы для определения необходимой численности выборки при повторном и бесповторном отборе вступят соответственно такого вида:
Нередко на практике при определении необходимой численности выборки предельная ошибка выборки задается не абсолютной величиною. а величиной относительной ошибки, которая выражается в процентах. В этом случае вариация признака должна быть выражена в процентах, то есть дисперсию признака заменяют на коэффициент вариации (V).
Численность выборки для случая, когда предельная ошибка задается в процентах, определяется по следующим формулам:
Рассмотрим примеры расчета необходимой численности выборки при повторном и безповторній выборке.
Повторный отбор. Пример. В TOB проектируется выборочное определение жирности молока, принимаемого от населения. Общее поголовье коров в личных подсобных хозяйствах населения составляет 180 голов. За проведенными ранее исследованиями установлено, что средняя жирность молока составляет 3,6%, а среднее колебания жирности равна 0,2% (ст = 0,2%).
Нужно определить, какое поголовье коров следует подвергнуть выборочному обследованию, чтобы определить среднюю жирность молока с предельной ошибкой
0,1% (% = 0.1%). Доверительный уровень вероятности Р = 0,9545, которому соответствует нормированное отклонение и = 2 (прил. 2).
При случайном повторном отборе численность выборки определяется по формуле
Итак, выборочному обследованию достаточно подвергнуть 16 коров, чтобы с доверительной вероятностью Р = 0,9545 (вероятность ошибки в 5 случаях из 100) определить среднюю жирность молока с ошибкой, не превышающей 0,1%.
Для получения более высокой гарантии результатов выборочного наблюдения можно увеличить точность выборки, то есть уменьшить размеры допустимой предельной ошибки. Так, если предельную ошибку выборки уменьшить в два раза с 0,1 до 0,05%, то при тех же условиях ст = 0,2% и и = 2,0 численность выборки составит:
Следовательно, увеличение точности выборки в два раза приводит к росту численности выборки в 4 раза (16 o 4 = 64).
Безповторний отбор.
Пример. На свиноферме с общим поголовьем поросят в возрасте 2 - 4 месяца N = 2000 голов необходимо определить среднюю живую
массу одной головы в конце месяца с точностью 1 кг (% = 1 кг). Доверительный уровень вероятности Г = 0,9545, которому соответствует и = 2. По данным взвешивания в прошлом месяце (или пробном в данном) установлено, что колебания живой массы в стаде составляет 4 кг (ег= 4 кг).
Необходимо установить, какую численность поросят следует отобрать для взвешивания, чтобы средняя живая масса была получена с точностью до 1 кг. Так как взвешивание проводится безповторно, то
Итак, достаточно взвесить 62 головы, чтобы без больших затрат и быстро получить ответ с заданной, практически вероятной точностью.