Дисперсионный анализ при группировке данных по двум признакам

В статистической практике чаще имеют дело с многофакторными исследованиями, в которых изучают влияние на результативный признак двух и более факторов одновременно.

По аналогии с комбинационными групуваннями многофакторные модели дисперсионного анализа имеют неоспоримое преимущество по сравнению с однофакторними моделями: они дают возможность выявить степень влияния не только каждого фактора в отдельности, но и их взаимодействие. Например, эффективность удобрений повышается при улучшении ухода за растениями, преимущества высокоурожайных сортов полностью проявляются при высокой агротехнике их выращивания. Эти задачи решаются с помощью построения комбинационных группировок и таблиц. Методы же разложение вариации дают числовые характеристики взаимодействия факторов, а использование вероятностных оценок позволяет сделать вывод о ее достоверности.

Дисперсионный анализ при группировке данных по двум факторам ведется по той же принципиальной схеме, что и при группировке данных по одному фактору. При этом также необходимо учитывать порядок формирования групп: случайное или неслучайное (независимые или зависимые выборки). При зависимом формировании выборок схема разложения суммы квадратов отклонений усложняется в связи с выделением суммы квадратов отклонений повторений.

Отличие многофакторного анализа от однофакторного заключается в том, что общий объем вариации раскладывается на большее число компонентов. По мере разложения совокупности на группы и подгруппы усложняются расчеты с разложения общего объема вариации на составные части, а также анализ дисперсий.

Рассмотрим схему разложение общей вариации на составные части для случая с двумя факторами (А и В). Источниками вариации при группировке данных с двумя факторами: первый фактор, А второй фактор - В, их взаимодействие - АВ, остаточное варьирование.

Тогда общую сумму квадратов отклонений можно представить в таком виде: "¥заг = "¥А + "¥в + "¥АВ + "¥зал.

Разложение общей вариации целесообразно осуществить в два этапа. Для этого нужно построить две таблицы. На первом этапе из общего варьирования следует выделить вариацию, связанную с двумя факторами и остаточную вариацию:

Такой порядок разложение общей вариации справедлив для независимых выборок. Если же выборки зависимые (например, рендомізовані блоки, латинский квадрат и т.п.), то появляется новый компонент вариации, связанный с повторностями

Тогда схема разложение общей вариации приобретает такой вид:

I этап "¥заг = "¥А+В + "¥втор + "¥зал ;

II этап "¥А+В = "¥А + "¥в + "¥АВ ;

и в целом Шзяг = "¥А + "¥в + "¥АВ + "¥втор + "¥зал.

Для случая с тремя факторами и зависимыми выборками схема разложение общей вариации усложняется:

Факторные модели с большим количеством факторов (тремя и более) целесообразно исследовать корреляционным методом с использованием ЭВМ.

Использование дисперсионного анализа при группировке данных по двум факторам рассмотрим на таком примере. В полевом опыте изучалось влияние различных доз удобрений на урожайность озимой пшеницы, висіяної на участках с различными предшественниками (табл. 8.5).

Таблица 8.5. Урожайность озимой пшеницы, ц/га

Урожайность озимой пшеницы, ц/га

Схема построения опыта такая: участок, на котором проводился эксперимент, было разбито на четыре блока, которые отличаются между собой рельефом и механическим составом почв. Каждый из вариантов опыта в случайном порядке были распределены во всех четырех блоках, чем обусловлено значительное выравнивание условий во всех проверяемых вариантах опыта. Итак, исследование проведено в четырехкратный повторности и построено по методу рендомізованих блоков (зависимые выборки).

Нужно методом дисперсионного анализа проверить статистическую гипотезу относительно средних в генеральных совокупностях.

Сравнивая среднюю урожайность по группам (предшественниках) и подгруппам (удобрениях), можно заметить, что урожайность озимой пшеницы закономерно возрастает по мере изменения предшественника и увеличение доз удобрений. Вместе с тем выдвинем нулевые гипотезы о случайности различий средней урожайности по вариантам опыта, то есть о том, что факторы не влияют на уровень урожайности озимой пшеницы:

в) Н0: эффективность взаимодействия факторов в генеральных совокупностях одинакова;

На: эффективность взаимодействия факторов в генеральных совокупностях неодинакова;

Здесь xi - средние по группам; Х] - средние по подгруппам.

Уровень значимости примем равным а = 0,05. Для проверки Ка используем критерий Б.

Схема построения опыта показывает, что общую вариацию урожайности озимой пшеницы можно разложить на 5 компонентов:

где "¥заг - вариация урожайности за счет влияния предшественников ¥п, удобрений ¥д, взаимодействия факторов (предшественников и удобрений) "¥вз, повторностей "¥втор; "¥зал - остаточная вариация.

Разложение общей вариации проведем в два этапа. На первом этапе выделим из общей вариации

то есть вариацию, который создается совместным влиянием предшественников и удобрений, вариацию по блокам (повторностях) и остаточную (отклонение индивидуальных наблюдений от средних по каждому фактору отдельно).

На втором этапе выделим вариацию (сумма квадратов отклонений), связанную с действием факторов (каждого в отдельности и их совместное взаимодействие):

Обозначим число наблюдений в опыте N = 24, количество групп по предшественниками т = 2, количество подгрупп по удобрениями И = 3 и блоками п = 4 N = тип = 2 o 3 o 4 = 24).

Для упрощения вычислений сумм квадратов отклонений уменьшим все выходные данные на постоянную величину, близкую к средней величины (а = 50) и выразим данные опыта в отклонениях от постоянной величины.

Результаты вычислений запишем в табл. 8.6.

Таблица 8.6. Отклонения от условного начала (в = х - а; а = 50)

Отклонения от условного начала

Проверим правильность расчетов: общая сумма урожайности (ix,7 = 1248,4) равна сумме отклонений от условного начала = 48,4), плюс произведение условного начала на количество наблюдений (атУ):

Для определения сумм квадратов отклонений "¥заг; "¥п+д; "¥втор и Wзaл возведем в квадрат все индивидуальные отклонения, их суммы по графе и строке и

общий итог (табл. 8.7).

Таблица 8.7. Квадраты отклонений

Квадраты отклонений

В результате возведения в квадрат отклонений получим все необходимые данные для определения сумм квадратов отклонений на первом этапе:

Пользуясь полученными суммами, определим необходимые суммы квадратов отклонений:

Для каждой суммы квадратов отклонений определим число степеней свободы вариации:

На втором этапе проведем разложение вариации, связанной с действием факторов (за счет каждого фактора и их взаимодействия):

Для расчета необходимых сумм квадратов отклонений на основании данных последнего столбца табл. 8.6 составим новую таблицу отклонений (табл. 8.8), в которой названия строк содержат градации по предшественниками, а столбцов - за дозами удобрений. Обозначим суммы отклонений по предшественниками - А, а за дозами удобрений - В и возведем в квадрат отклонения (табл. 8.9).

Таблица 8.8. Отклонения по вариантам опыта

Отклонения по вариантам опыта

Таблица 8.9. Квадраты отклонений по вариантам опыта

Квадраты отклонений по вариантам опыта

Сумма квадратов отклонений в табл. 8.9. (3115,16) равна итоге последней графы табл. 8.7. На основании этой суммы было определено вариацию урожайности, обусловленной совместным действием двух факторов:

"¥п+д = 681,18 с числом степеней свободы кп+д = 5.

Эта сумма квадратов отклонений состоит из следующих составляющих компонентов:

Определим число степеней свободы вариации для каждого из исчисленных сумм квадратов отклонений. Для этого необходимо степени свободы вариации двух факторов (кп+п = 5) распределить между тремя компонентами, которые составляют эту сумму квадратов отклонений (кп , кд и кю):

Объединим результаты вычислений двух этапов, рассчитаем и проанализируем дисперсии (табл. 8.10).

Таблица 8.10. Расчет и анализ дисперсий

Расчет и анализ дисперсий

Фактическое дисперсионное отношение найдем по формуле

о2 . п2

Например, по удобрениях составит д o = 268,94 : 1,11 =

242,29, по взаимодействию факторов эис : езад = 14,88 : 1,11= 13,40 и т.д. Табличные значения при уровне значимости а = 0,05 определим по приложению 4 для оценки отношения дисперсии предшественников до остаточной дисперсии - на пересечении 1-го столбца и 15-й строки (Б005 =4,54); для отношение дисперсии удобрений до остаточной дисперсии - 2-го столбца и 15-й строки (Б005 = 3,68) и т.д.

Сравнение фактических и табличных значений Б-критерия Фишера при заданном уровне значимости а = 0,05 показывает, что во всех случаях Тфщт > Б005.

Итак, выдвинутые нулевые гипотезы не согласуются с фактическими данными и поэтому их нужно отклонить. Различия в урожайности по факторам и повторностями являются существенными, вероятным, вероятным является проявление эффекта взаимодействия факторов.

Поскольку по результатам дисперсионного анализа нулевые гипотезы отклонено и доказана существенность различий между средними, можно оценить достоверность различий между парами средних. Для этого нужно вычислить среднюю и возможную предельную ошибку выборок (Ер) и аналогично тому, как это было сделано в предыдущем примере, найти фактические различия между парами средних и сравнить их с возможными предельными разницам (НОР).

 
< Пред   СОДЕРЖАНИЕ   След >