ПРОВЕРКА однородности выборок
В исследованиях по педагогике или психологии часто возникает необходимость выяснить, различаются генеральные совокупности, из которых взяты выборки. Например, отличаются между собой экспериментальная и контрольная группа учеников по результатам тестирования учебных достижений. Методы проверки статистических гипотез об однородности выборок могут быть реализованы на основе параметрических и непараметрических критериев для независимых (несвязанных) и зависимых (связанных) выборок. Итак, гипотезы об однородности выборок - это гипотезы о сходстве или различии двух и более выборок.
Для варианта независимых выборок постановка математико-статистической задачи выглядит так: две выборки объемом п 1 и п 2 взято случайным методом из двух генеральных совокупностей, непрерывные функции распределения которых Р 1 (х) и Р 2 (х) неизвестны. Нужно проверить их однородность (неоднородность). Нулевая и альтернативная гипотезы имеют вид:
Но: Р1 (х) = Р2 (х) Яи: Р1 (х) Ф Р2 (х).
В математике разработано несколько методов (критериев) проверки однородности двух независимых выборок. Однако с точки зрения прикладной статистики в исследователя нередко возникает проблема оптимального выбора критерия проверки однородности. Поэтому рассмотрим и проанализируем особенности и возможности использования нескольких критериев.
Критерий Стьюдента t
Для проверки однородности несвязанных выборок нередко используется критерий Стьюдента и, статистика которого имеет вид
где X 1 и X 2, s 1 2 и s в, п 1 и п 2 - средние, дисперсии и объемы первой и второй выборок соответственно.
Критическое значение критерия и кр для заданного уровня значимости а и числа степеней свободы (п 1 + п 2 -2) можно получить из таблиц распределения Стьюдента, а также с помощью функции = СТЬЮДРАСПОБР (). Если | и |> | и кр |, то гипотезу однородности (гипотезу Н 0 об отсутствии различия) отклоняют.
Пример 5.5. Проверить статистические гипотезы на уровне значимости 0,05 по однородности двух независимых выборок по критерию Стьюдента (эмпирические данные рис. 5.11 представлены условными значениями).
Последовательность решения:
o Ситуации соответствует вариант не направлены гипотез: Н 0: / и} - / и 2 = 0 (это не отличается от / х 2)
Нет: ц} - ц 2 Ф 0 (и} отличается от / х 2).
o Проверка предположений: распределение исследуемых параметров, а также дисперсии неизвестны; выборки несвязанные; объемы выборок разные; измерения интервальные.
o Расчеты эмпирического критерия показано на рис. 5.11 и 5.12. Эмпирическое значение критерия и ЭМП можно оценить также из элементарных расчетов:
o Критическое значение и кр для уровня значимости 0,05 можно получить по
Функция = СТЬЮДРАСПОБР (), которая возвращает значение и 0 05 ~ 2,03 двустороннего ^ -критерия, что соответствует варианту не направлены гипотез.
o Принятие решения. Поскольку и ЭМП <и 0о05, то есть 1,77 <2,04, нулевая гипотеза Н 0 принимается на уровне значимости 0,05.
o Формулировка выводов. На уровне значимости 0,05 отсутствуют основания утверждать о неоднородности независимых выборок. Однако следует иметь в виду, что статистика критерия Студента проверяет не истек функций распределения выборок, а совпадение характеристик случайных величин - математических ожиданий.
Проверку гипотез можно провести путем определения вероятности г. ЭМП с помощью функции = СТЬЮДРАСП (Б27; Б26 + С26-2 2) (см. Ячейку В29 рис. 5.11 и 5.12 г. ем "~ 8,48%). Если р ЭМП - 0; нулевая гипотеза Н 0 отвергается. Как видим, это условие не выполняется: 8,48%> 5%, а это значит, что нулевая гипотеза h 0 должна быть принята.
Экспресс-оценка вероятности р ем "можно провести и с помощью функции MS Excel = ТТЕСТ (). Аргументами функции выступают: выборочные массивы и некоторые параметры. Для двусторонней модели нулевая гипотеза h 0 принимается на уровне значимости а, если выполняется условие а <ТТЕСТ < 1-я, иначе h 0 отклоняется. В ячейку В30 внесены выражение = TTECT (B3: B20; C3: C22, 2, 2) и получено уже известное значение, равное примерно 8,48% (см. рис. 5.11 и 5.12 ). Следовательно, на уровне значимости а = 0,05 (5%) условие 5% <8,48% <95% выполняется, поэтому нулевая гипотеза h 0 принимается.
Проверку статистических гипотез относительно однородности двух независимых выборок можно осуществить с помощью пакета "Анализ данных" раздел "Двовы выборочно t-тест с одинаковыми дисперсиями" (рис. 5.13).
Рис. 5.13. Меню пакета "Анализ данных"
Для реализации этого средства в соответствующее диалоговое окно необходимо ввести параметры, как показано на рис. 5.14, выполнить команду «ОК» и получить результаты т-тестирования (рис. 5.15).
Рис. 5.14. Диалоговое окно "Двовибирковий?-Тест с одинаковыми дисперсиями"
Рис. 5.15. Результаты двовибиркового?-Теста
Двовибирковий?-Тест (рис. 5.15) рассчитывает значения основных статистик (средние, дисперсии), эмпирических и теоретических критериев, дает возможность принимать статистические решения аналогичны предыдущим. Однако этот метод предусматривает выполнение требования равенства дисперсий совокупностей.