Дисперсионный анализ при группировке данных по одному признаку
Порядок проведения дисперсионного анализа при группировке данных по одному признаку рассмотрим на таком примере.
В опыте изучалось влияние новых комбикормов на приросты живой массы бройлеров (табл. 8.1).
Таблица 8.1. Среднесуточные приросты живой массы бройлеров, г
Анализ данных таблицы показывает, что средние приросты живой массы выше по группах бройлеров, получавших опытный комбикорм и опытный комбикорм с добавкой витаминов. Следовательно, вариация средних по вариантам опыта получилась различным составом рационов. Но приросты живой массы варьировали и внутри групп, то есть имела место внутригрупповая (остаточная) вариация, вызванная остальными неучтенных факторов. Об этом свидетельствуют средние приросты живой массы по повторностях: они колеблются от 34 до 38 г.
На основе исходных данных методом дисперсионного анализа проверим вероятность влияния разных по качеству рационов на приросты живой массы бройлеров. Для этого выдвинем и проверим статистическую гипотезу относительно средних в генеральных совокупностях.
Сформулируем нулевую и альтернативную гипотезы:
Уровень значимости примем равным а = 0,05. Самым мощным критерием проверки Но есть Б-критерий Фишера. Для проверки Н0 и формулирование выводов по результатам дисперсионного анализа необходимо вычислить фактическое значение Б-критерия Фишера и сравнить его с табличным значением Ба.
Для расчета фактического значения Б-критерия выполним все необходимые операции по его исчислению в соответствии с этапов дисперсионного анализа.
При группировке данных по одному признаку общий объем вариации можно разложить на вариацию, связанную с действием групирующей признаки (межгрупповую или систематическую), и вариацию внутригрупповое (остаточную):
Для определения сумм квадратов отклонений возведем в квадрат среднесуточные приросты и суммы приростов (табл. 8.2).
Обозначим общее число наблюдений N = 15, число вариантов опыта т = 3, число повторностей п = 5, N = т o п = 3 * 5 = 15.
Таблица 8.2. Квадраты среднесуточных приростов живой массы
На основании полученных в табл. 8.2 данных вычислим:
Определение и разложения вариации дало такие результаты: ™суг = -¥рщ + -¥зал; 180 = 130 + 50 ; 100,0% = 72,2% + 27,8%. Итак, 72,2% общей вариации среднесуточных привесов бройлеров в опыте приходится на вариацию исследуемого фактора (рационов), а 27,8% вариации обусловлены неучтенными факторами.
Установим число степеней свободы вариации для каждой суммы квадратов отклонений при N = 15, т = 3, п = 5.
Тогда число степеней свободы вариации для общей суммы квадратов отклонений
для остаточной определяется разницей так же, как и остаточная вариация: к2 = к0 - к1 = N - 1) - (т - 1) = 14 - 2 = 12.
Зная суммы квадратов отклонений и степени свободы, определим дисперсии, как отношение суммы квадратов отклонений до соответствующего числа степеней свободы вариации.
Для дисперсионного анализа вызывает интерес межгрупповая и остаточная дисперсии, а общая дисперсия в анализе не участвует, поэтому ее не вычисляем:
Сопоставим дисперсии, т.е. найдем фактическое значение Б-критерия Фишера:
Для проверки нулевой гипотезы необходимо определить табличное значение Б-критерия Фишера (прил. 4) и сравнить его с полученным фактическим значением.
V 2
Большей дисперсии рац соответствует число степеней свободы вариации ки =2 (числитель отношения), меньшей дисперсии зал число степеней свободы вариации к2 = 12 (знаменатель отношения). Итак, согласно прил. 4 теоретическое (табличное) значение Б-критерия находится на пересечении второго столбца и двенадцатой строки: Б005 = 3,88.
Сравним фактическое и табличное значение Б-критерия:
Поскольку Бфакг > Б005, выдвинута нулевая гипотеза о случайных различий в групповых средних должна быть отклонена и принята альтернативная гипотеза: значение генеральных средних существенно отличаются. Другими словами, фактические данные не согласуются с нулевой гипотезой. Следовательно, влияние различных по качеству рационов на среднесуточные приросты живой массы бройлеров достоверный и существенный.
В дисперсионном анализе при разложении общей вариации результативного признака за компонентами необходимо учитывать порядок формирования выборок: зависимые или независимые. Если в примере, который рассматривается, выборки сформированы как независимые (т.е. в каждую группу вошло по пять животных в случайном порядке), то общая сумма квадратов отклонений делится на два компонента: "¥г!Щ и "¥зал. Однако чаще в опытах с животными формируются группы животных-аналогов по числу повторностей по каждому варианту опыта. Каждый вариант опыта имеет за повторность - животное-представителя из группы аналогов.
При проведении эксперимента (рассмотренный выше пример) по проверке влияния различных рационов на приросты живой массы бройлеров могло быть сформировано пять групп животных-аналогов, поскольку имел опыт проводится в пятикратном повторении. Группы состояли из трех голов соответственно вариантам рациона и каждый вариант опыта имел представителя с одной и той же группы животных-аналогов. Следовательно, средние по повторностях (по графам табл. 8.1) отбивают тогда различия между выделенными группами. Эти различия необходимо исключить из общего варьирования приростов, поскольку они не являются случайными, не связанные с изменением рационов и в определенной мере могут затушевывать влияние на приросты исследуемого фактора.
Разложение общей вариации результативного признака при зависимом формировании выборок ведется по схеме:
то есть в отличие от независимого формирования выборок включает еще и вариацию повторностей.
По данным табл. 8.2 вычислим сумму квадратов отклонений повторностей:
Этой сумме квадратов отклонений соответствует к"оет = п - 1 = 5 - 1 = 4 тогда дисперсия повторностей составит:
Исключения из общей суммы квадратов отклонений "¥втор приводит и к изменению "¥зал соответствующих ей степеней свободы вариации:
а следовательно, и остаточной дисперсии
Сопоставим дисперсию рационов и повторностей с остаточной дисперсией. Результаты расчетов оформим в табл. 8.3.
Таблица 8.3. Анализ дисперсий
Табличное значение Б-критерия для оценки отношения дисперсии рационов до остаточной дисперсии находим на пересечении второго столбца и восьмого строки - Б005 = 4,46, а для отношение дисперсии повторностей до остаточной - на пересечении четвертого столбца и восьмого строки - Б005 = 3,84 (прил. 4). Сравнение Рфакг с табличными значениями приводит к отказу от нулевой гипотезы. Следовательно, различия между средними за рационами и повторностями не могут быть отнесены на счет случайного варьирования.