ДИСПЕРСИОННЫЙ АНАЛИЗ
Основной целью дисперсионного анализа, фундаментальная концепция которого была предложена Фишером в 1920 г., Является исследование значимости различия между средними нескольких групп данных или переменных. Если сравниваются средние двух групп, дисперсионный анализ даст тот же результат, что и обычный г-критерий для независимых или зависимых выборок. Однако использование дисперсионного анализа имеет преимущества особенно для малых выборок.
В дисперсионном анализе проверка статистической значимости различия между средними нескольких групп осуществляется на основе выборочных дисперсий. Эта проверка проводится с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внут-ришньогруповою изменчивостью), а вторая связана с различием средних значений. Если это различие значимо, нулевая гипотеза о существовании различия между средними значениями откидывается на определенном уровне значимости.
Дисперсионный однофакторный анализ
Дисперсионный однофакторный анализ используется в исследованиях изменения результативного признака под влиянием изменения условий или градаций фактора. Суть математических преобразований дисперсионной метода заключается в том, чтобы сопоставить дисперсии по факторам с дисперсией всех значений, полученных в эксперименте. Однофакторный анализ требует не менее трех градаций фактора и не менее двух испытаний в каждой градации. При проведении дисперсионного анализа необходимо проверить нормальность распределения исследуемой случайной величины и отсутствие различия дисперсий совокупностей. Это можно выполнить методами проверки статистических гипотез (см.раздел 5).
Предположим, что анализируется влияние фактора А на к уровнях А 1, ^ 4 2, а к. Например, в эксперименте это можно реализовать, если задействовать к выборок с различными градациями условий. На каждом уровне Ли (для каждой выборки) проведения п спостереженьх / 1, х / 2, х ш (см. Табл. 6.1).
Таблица 6.1
Номера наблюдений |
Уровни фактора А |
||
А2 |
А к |
||
1 |
х и |
х 21 ooo |
хи |
2 |
х 22 |
хк2 |
|
И |
х первых |
х 2 И o |
х и |
п |
х 1п |
х 2п |
х кп |
Х1 |
Х2 o .. |
Хк |
Рассмотрим оценки различных дисперсий.
Дисперсия я 2 для уровня Аи (для определенной выборки) может быть записана как
Дисперсия я 0, характеризующий вариативность вне влияния фактора А
Общая дисперсия я всех пк наблюдений равна
Дисперсия я 2 А, характеризующий изменение средних х / под влиянием фактора А:
1 к _ =
к ~ 1 ¡= 1
Проверка влияния фактора А на смену средних может быть сведена к сравнению дисперсий я 2 А и я 2. Влияние фактора А считаться значимым на гальке
а если является значимым отношение 5 1я 2, то есть если
+5 2 Л и ^> ^ а [к 1; к (п -1)], где к 1; к (п -1) - степени свободы ^ -распределение, 5 и я 7] - ^ -критерий Фишера. Пример 6.1. Двести предположение о том, что фактор скорости предъявления слов влияет на показатели их воспроизведения (данные в таблице рис. 8.1). Последовательность решения:
o Формулировка гипотез.
Н 0: фактор скорости не более выраженным, чем случайным; Н 1: фактор скорости более выраженным, чем случайным.
o Проверка предположений: исследуемый параметр нормальный распределение; выборки несвязанные одинаковых объемов; измерения по шкале отношений.
o Определение эмпирического критерия Г ЭМП базируется на сопоставлении квадратов сумм по столбцам с суммой квадратов всех эмпирических значений. Каждый столбец представляет выборку и соответствует определенной градации фактора скорости.
o Введенные обозначения:
п = 6 - количество наблюдений (строк)
к = 3 - количество факторов (столбиков)
пк = 6-3 = 18 - общее количество индивидуальных значений;
7 - индекс строк изменяется от 1 до п (7 = 1, 2, ..., п)
и - индекс столбиков изменяется от 1 до к (и = 1, 2, ..., к).
o Математические расчеты (см. рис 6.1 6.2):
- Рассчитать суммы в ячейках В13: В15 по формулам
i = 1 7 = 1 п м кп ^ и = 1)
а именно
Есть 1 = 6 2 + семь 2 + 6 2 + 5 2 + _ + 5 2 + 5 2 = 432; и 2 = - (34 2 + +29 2 + 23 2) = 421;
6
и 3 ^^ (34 + 29 + 23) 2 = 410,89; 3 o 6
- Рассчитать эмпирический критерий ¥ ГМП в ячейке В16 по формуле
Рис. 6.1. Результаты Рис. 6.2. Расчетные формулы
дисперсионного анализа однофакторного дисперсионного анализа
o Критическое значение ^ кр можно получить с помощью функции
= РРАСПОБР () для уровня значимости для а = 0,05 (0,01) и числа степеней свободы к 1 = 3-1 = 2 и к (п -1) = 3 (6-1) = 15. Г 0и05 ~ 3,68 и Г 0и01 ~ 6,36.
o Принятие решения. Поскольку ¥ ГМП> Р 0? 01 (6,89> 6,36), нулевая гипотеза Н 0 отклоняется на уровне значимости 0,01.
o Формулировка выводов. Различия в объеме воспроизведения слов (фактор скорости) более выраженными, чем случайным. Эту зависимость можно представить графически на рис. 6.3.
Рис. 6.3. Зависимость среднего объема воспроизведенных слов от скорости предъявления
Расчеты однофакторной модели можно провести с помощью пакета "Анализ данных" раздел "Однофакторный дисперсионный анализ" (рис. 6.4).
Рис. 6.4. Меню пакета "Анализ данных" После введения соответствующих параметров (рис. 6.5) можно получить результаты однофакторного дисперсионного анализа (рис. 6.6).
Рис. 6.5. Диалоговое окно
Рис. 6.6. Результаты однофакторного дисперсионного анализа (а = 0,05)
Компьютерный пакет "Анализ данных" выполняет расчеты основных статистик (суммы, средние, дисперсии, значение эмпирических и теоретических критериев и т.п.), что дает основания исследователю для статистических выводов.