Различия в значениях средних (F-критерий для двух связанных выборок)
Процедуры проверки гипотез о равенстве средних для двух независимых (несвязанных) выборок на основе критерия Стьюдента и продемонстрировано в разделе 5.3, формула (5.10). Для двух связанных выборок, если есть естественная парность наблюдений, например, тестирование объектов дважды - до и после эксперимента, используется так называемый двовибирковий и критерий Стьюдента. Статистика критерия имеет вид:
2 o а г
и = - <п, (5.22)
где а = 1 V а и - среднее разниц; п - объем выборки; ^ = (Х и1 - х и2) - розни-п
| Х (а - а,) 2
эта значений; х а -, 1 ---- стандартное отклонение а ,. Для статистику не
V п - 1
предполагается равенство дисперсий совокупностей, из которых выбраны данные.
Пример 5.13. Можно утверждать на уровне значимости 0,05 (0,01) о том, что средние показатели выборки до и после экспериментальной действия отличаются друг от друга? Эмпирические данные представлены на рис. 5.30.
Последовательность решения:
o Формулировка гипотез:
Н 0: ц 1 - ц 2 = 0 (г. 1 не отличается от / х 2) Н 1: ц 1 - ц 2 ф 0 (р 1 отличается от / х 2).
o Проверка предположений: исследуемый параметр нормальный распределение; дисперсии совокупностей неизвестны; выборки связаны; измерения по шкале отношений.
o Выбор статистического критерия. Согласно предположениям условиям соответствует модель двустороннего и критерия Стьюдента для связанных выборок:
2 o а Г
o Результаты расчета эмпирического критерия и ЭМП показано на рис. 5.30, необходимые для этого формулы - на рис. 5.31. Эмпирическое значение критерия равно:
i = - ^. / Ги. 3,87 "™ 0,47.
o Определение критического значения двустороннего t-критерия Стьюдента можно выполнить с помощью функции = СТЬЮДРАСПОБР (). Для принятого уровня значимости а = 0,05 (0,01) и степеней свободы df = "1 = 11-1 = 10 критическое значение равно: t 0i05 ~ 2,23 (t 0i01 ~ 3,17).
o Принятие решения. Поскольку t eMn> t 0> 01 (3,87> 3,17), нулевая гипотеза Н 0 отклоняется на уровне значимости 0,01.
o Формулировка выводов. Основания утверждать, что показатели выборок не отличаются друг от друга, отсутствуют на уровне значимости 0,01 .. Предлагаем самостоятельно прокомментировать значение показателя р ем ".
Различия в значениях дисперсий (F-критерий Фишера для двух несвязанных выборок)
Сравнение дисперсий двух совокупностей гораздо интереснее, чем задача проверки соответствия дисперсии некотором предполагаемом значению. Для проверки гипотезы о равенстве дисперсий двух независимых совокупностей используется критерий Фишера F, статистика которого имеет вид
F = si 2 / S2 2, (5.23)
где s один два и s два два - дисперсии выборок.
При этом объемы выборок могут быть как одинаковые, так и разные. Пример 5.14. Можно утверждать, что показатели выборочных дисперсий по данным рис. 5.32 статистически не отличаются друг от друга? Последовательность решения:
o Формулировка гипотез. Условиям проверки единообразия дисперсий а два одна и & полученных из двух совокупностей, соответствует вариант не направлены гипотез:
Н 0: а 2 1 = а 2 2 (а 2 1 не отличается от а 2 ф) Н 1: а 2 1 Ф а 2 2 (а 2 1 отличается от а 2 ф).
o Проверка предположений: исследуемый параметр нормальный распределение; выборки несвязанные; замеры сделаны по шкале интервалов.
o Выбор статистического критерия. Ситуации соответствует модель двустороннего
Б критерия Фишера: Г ем "= 8 2 / +8 2.
o Результаты расчета ¥ ГМП показано на рис. 5.32, необходимые для этого формулы - на рис. 5.33. Дисперсии выборок +8 +2 ~ 1,54 +8 +2 ~ 0,70. Отсюда значение эмпирического критерия следующее: ¥ ГМК = 1,54 / 0,70 ~ 2,21.
o Определение критического значения критерия Б. Для двусторонней модели на уровне значимости а устанавливаются два критические значения Г кр для точек (а / 2) и (1-я / 2) Б-распределения, то есть Б а / 2 и Б 1. а / 2 с числом степеней свободы = п 1 1 = 14-1 = 13 и ¿# 2 = п 2 - 1 = 16-1 = 15
Для принятого уровня значимости а и степеней свободы а / 1 и а / 2 критические значения двустороннего критерия можно получить с помощью функции = РРАСПОБР (). Для а = 0,05 получим 7 ^ 025 = 2,92 и 7 ^ 975 ~ 0,33; для а = 0,01 критические значенняF 0 005 ~ 4,18 и F 0 995 ~ 0,22.
o Принятие решения. Поскольку значение f eMr p 2,21 не находящееся в одной критической зоне (0,33 <2,21 <2,92), принимается нулевая гипотеза Н 0.
o Формулировка выводов. Даже на уровне значимости 0,05 нет оснований утверждать, что показатели дисперсий отличаются друг от друга.
Проверку статистических гипотез о существенности разницы дисперсий двух никак связанных выборок можно провести путем оценки вероятности р ем "с помощью функции = FPACn (B23; B22-1; C22-1), внесенного в ячейку В28 (см. Рис. 5.32 и 5.33). Как видим, г. ем "~ 0,072 (7,2%). Нулевая гипотеза н 0 принимается при р ем "> а. В нашем примере даже на уровне значимости а = 0,05 (5%) это условие выполняется: 7,2%> 5%. Это значит, что нулевая гипотеза н 0 должна быть принята, как это сделано выше.
Экспресс-оценка можно провести с помощью функции MS Excel = 3> TECT (B3: B18; C3: C18) / 2, внесенного в ячейку В29 (см. Рис. 5.32 и 5.33). Поскольку функция возвращает одностороннюю вероятность единообразия двух совокупностей, для двусторонней вероятности следует брать ее половину. Аргументами функции выступают выборочные массивы. Для двусторонней модели нулевая гипотеза н 0 принимается на уровне значимости а, если выполняется условие а <ФТЕСТ <1- а.
В нашем примере даже на уровне значимости а = 0,05 (5%) условие 5% <7,2% <95% выполняется, а это значит, что н 0 принимается.
Проверку статистических гипотез относительно разницы дисперсий можно выполнить с помощью пакета "Анализ данных" раздел "Двовибирковий F-тест для дисперсий" (рис. 5.34).
Рис. 5.34. Меню пакета "Анализ данных"
Для этого в диалоговом окне необходимо ввести параметры, как показано на рис. 5.35, выполнить команду «ОК» и получить результаты (рис. 5.36).
Рис. 5.35. Диалоговое окно "Двовибирковий Р-тест для дисперсий"
Рис. 5.36. Результаты двовибиркового Р-теста
Компьютерный средство выполняет расчеты основных статистик (средние, дисперсии), а также значение эмпирических и теоретических ^ -критерия, которые позволяют сделать выводы о разнице дисперсий на уровне значимости а.