Дисперсионный двухфакторный анализ
Дисперсионный двухфакторный анализ применяется в тех случаях, когда исследуется одновременное действие двух факторов на различные выборки объектов, то есть когда различные выборки оказываются под влиянием различных сочетаний двух факторов. Может случиться, что одна переменная значимо действует на изучаемый признак только при определенных значениях другой переменной. Например, усиление мотивации может повышать скорость решения задач в высокоинтеллектуальных лиц и снижать ее в низькоинтелектуальних. Итак, дисперсионный двухфакторный анализ позволяет оценить не только влияние каждого из факторов, но и их взаимодействие.
Суть метода остается той же, как и при однофакторной модели, но в двухфакторной дисперсионной анализе можно проверить большее количество гипотез, однако расчеты несколько сложнее, чем в однофакторных комплексах.
Дисперсионный двухфакторный анализ предъявляет особые требования к формированию комплексов. Для каждого фактора должно быть не менее двух градаций; в каждой ячейке комплекса должно быть не менее двух наблюдаемых значений для выявления взаимодействия градаций; комплекс должен быть симметричной системой: каждой градации фактора А должна соответствовать одинаковое количество градаций фактора В, результативный признак должна иметь нормальное распределение; факторы должны быть независимыми, что может быть подтверждено отсутствием корреляционной связи между переменными-факторами.
Пример 6.2. Четырем группам по 4 испытуемых в различных комбинациях скорости предъявлении и длины слова были предложены задания из 10 слов для воспроизведения их через некоторое время (табл. 6.2).
Таблица 6.2
Факторы |
Группы: |
|||
А1В1 |
А2В1 |
А1В2 |
А2В2 |
|
А - длина |
короткие слова |
длинные |
короткие слова |
длинные |
В - скорость |
высокая |
низкая |
||
1 |
7 |
5 |
4 |
6 |
2 |
5 |
4 |
3 |
4 |
3 |
4 |
3 |
3 |
7 |
4 |
7 |
4 |
4 |
5 |
Средние: |
5,75 |
4,00 |
3,50 |
5,50 |
Необходимо доказать значимость предположения о том, что между факторами длины слова (А) и скоростью их предъявления (В) наблюдается взаимодействие при большой скорости предъявления лучше запоминаются короткие, при низкой скорости - длинные слова, что показано на рис . 6.7.
Рис. 6.7. Зависимость среднего количества воспроизведенных слов от их длины и скорости предъявления
Последовательность решения:
o Формулировка гипотез. Учитывая условия исследования, необходимо выяснить три комплекта не направлены гипотез, касающихся влияния фактора А отдельно от фактора В, влияния фактора В отдельно от фактора А и гипотезы о влиянии взаимодействия градаций факторов А и В.
Количество воспроизведенных слов различной длины и скорости их предъявления
1-й комплект гипотез:
Н 0 (1): различия в объеме воспроизведения слов, обусловленные действием фактора А, являются не более выраженными, чем случайные различия между показателями;
Над: различия в объеме воспроизведения слов, обусловленные действием фактора А, более выраженными, чем случайные различия между показателями.
2-й комплект гипотез:
Н 0 (2 /: различия в объеме воспроизведения слов, обусловленные действием фактора В, являются не более выраженными, чем случайные различия между показателями;
Н 1 (2 в различия в объеме воспроизведения слов, обусловленные действием фактора В, более выраженными, чем случайные различия между показателями.
3-й комплект гипотез:
Н 0 (3 /: влияние фактора А на объем воспроизведения слов одинаков при различных градациях фактора В и наоборот;
Н 1 (3): влияние фактора А на объем воспроизведения слов разный при разных градациях фактора В и наоборот.
o Проверка предположений: исследуемый параметр нормальный распределение; выборки несвязанные одинаковых объемов; измерения по шкале отношений.
o Определение эмпирического критерия. Ситуации соответствует модель двустороннего ^ -критерия, для которого необходимо определять трех эмпирические значения:
¥ А - характеризует вариативность признака, обусловленную действием фактора А; ¥ в - характеризует вариативность признака, обусловленную действием фактора В; ¥ ЛВ - характеризует вариативность, обусловленную взаимодействием факторов Л и В.
o Введенные обозначения:
п = 4 - количество объектов (строк в группе испытаний)
И = 2 - количество факторов л;
т = 2 - количество факторов В;
пот = 2-2-4 = 16 - общее количество значений;
к - индекс объектов изменяется от 1 до п (i = 1, ..п)
и - индекс факторов Л меняется от 1 до и (7 =
7 - индекс факторов В изменяется от 1 до т (к = 1, .. т).
o Расчеты критериев F A, F B и F a s рекомендуется начинать с построения по эмпирическим данным специальной таблицы, воспроизводит двухфакторный дисперсионный комплекс (рис.6.8 и 6.9)
Рис. 6.8. Результаты двухфакторного дисперсионного анализа
o Рассчитать средние значения:
в ячейках В11: С12 для каждой выборки
- 1 ^ - 1
х i = -2 ^ х ик (например, хп = - (7 + 5 + 4 + 7) = 5,75) п к = 1 4
в ячейках Б3: Е10 повторить значение для каждой выборки;
в ячейках В 13: С 13 по фактору А (по колонке)
- 1 1 - 1
х * / = - ^ х ИИ (например, х * 1 = ~ (5,75 + 3,50) = 4,63);
1 и = 1 два
в ячейках 011: 012 по фактору В (по строкам)
хи * = - В х (например, х1 * = - (5,75 + 4,00) = 4,88);
т i = 1 две
в ячейках Б13: Е13 для всех выборок
х = во- (х = (5,75 + 4,00 + 3,50 + 5,50) * 4,69)
1 'т, = 1 и = 1 2 o 2
o Рассчитать суммы квадратов разностей в ячейках В18: В22 с помощью формул и соответствующих выражений (см. рис. 6.9):
o Рассчитать средние квадраты в ячейках В23: В26 с помощью формул и соответствующих выражений:
1 ~ (1 -1); 2 ~ (т-1); 3 ~ (1 - 1) (т-1); 4 ~ 1 ■ т ■ (п - 1).
o Рассчитать эмпирические критерии в ячейках В23: В25:
Р А - 4 = 056 - 0,46; Г в - 4 - 0,06. 0,05; Е М - I = 14,06. 11,44; А я четыре 2 1,23 'в я четыре 2 1,23' АВ я 2 1,23 ''
o Критические значения ¥ -критерия можно получить с помощью функции = РРАСПОБР для принятого уровня значимости а и степеней свободы. И / А = (1-1) = (2-1) = 1, <# В = (т-1) = (2-1) = 1, с $ АВ = (1-1) (т-1) = 1 Си / 2 = 1-т-(п-1) = 12. Следовательно, и соответствующие критические значения для Р КРА, Р КРО, Р воровал также будут одинаковы. На уровне значимости 0,05 критическое значение Р (112) ~ 4,75.
Рис. 6.9. Расчетные формулы двухфакторного дисперсионного анализа
o Принятие решения. Поскольку F A <F (112) (0,46 <4,75) и F B <F (112) (0,05 <4,75), нулевые гипотезы И 0 (и) и H 0 ( 2) принимаются. В то же время, поскольку Fab> F (ij 2) (11,44> 4,75), нулевая гипотеза H 0 (3) отбрасывается.
o Формулировка выводов. Различия в объеме воспроизведения слов, обусловленные отдельно факторами А и В, не более выраженными, чем случайные. Однако влияние фактора А на объем воспроизведения слов разный при разных градациях фактора В и наоборот. Выводы принято на уровне значимости 0,05.
Аналогичные результаты можно получить с помощью пакета MS Excel "Анализ данных" раздел "двухфакторная дисперсионный анализ с повторениями". Для этого в диалоговом окне рис. 6.10 необходимо ввести соответствующие параметры и получить результаты (рис. 6.11).
Рис. 6.10. Диалоговое окно двухфакторного дисперсионного анализа для несвязанных выборок
Рис. 6.11. Итоги двухфакторного дисперсионного анализа
Итак, факторы длины слов и скорости их предъявления отдельно не влияют значимо на объем воспроизведения слов. Значимой оказывается взаимодействие факторов: короткие слова лучше запоминаются при большой скорости предъявления, а длинные - при медленной скорости предъявления.
Предлагаем самостоятельно разобраться с полученными результатами, расчетными формулами и комментарием на рис. 6.7 - 6.11.
Вопрос. Задача.
1. Охарактеризуйте основные возможности методов дисперсионного анализа.
2. Охарактеризуйте ограничения дисперсионной однофакторного анализа.
3. Назовите основу, на которой построен математический аппарат однофакторного дисперсионного анализа.
4. Назовите основу, на которой построен математический аппарат двухфакторного дисперсионного анализа.
5. Охарактеризуйте ограничения дисперсионной двухфакторного анализа.
6. Повторите математические процедуры задач за примерами 6.1 - 6.2.
7. Выполните лабораторные работы № 23 и № 24.