Гипотезы относительно нормального распределения ПРИЗНАКОВ

При использовании методов математической статистики чрезвычайно важно знать закон распределения свойства изучаемого языка. По сути, уже сама исследуемая переменная представлена массивом эмпирических данных с определенным законом распределения вероятностей реализации ее значений. Поэтому любая статистическая обработка начинается, как правило, с попытки оценить закон распределения. Стремление применить методы, разработанные для определенного закона распределения, в условиях, когда реальное распределение отличается от гипотетического, является наиболее распространенной ошибкой, что приводит в итоге и к ошибочным выводам.

Критерии проверки гипотез по закону распределения принято называть критериями согласия, которые можно разделить на две группы: общие и специальные [37, С. 20]. Общие критерии применяют к формулировкам гипотез о согласии наблюдений с любым возможным распределением. Специальные критерии согласия используют при проверке гипотезы о конкретной формы распределения - нормальной, равномерной, экспоненциальной и тому подобное. Такие критерии носят соответствующее название - критерии нормальности, критерии равномерности и т.п.

Расчеты эмпирического распределения и его графическая визуализация не дают надежных оснований для вывода о законе распределения признака в совокупности, из которой взята выборка. Между тем знание этого закона является необходимым условием использования многих математических методов. Например, применение параметрических критериев, дисперсионного анализа требует предварительной проверки нормальности распределения исследуемого признака.

Среди методов оценки законов распределения вероятностей случайных величин около двух десятков были специально разработаны для проверки нормальности. Наиболее распространенными считаются критерии асимметрии и эксцесса, хи-квадрат и др. Однако следует рекомендовать критерий Шапиро-Вилка В ¥, который по рейтингу мощности занимает первое место [37, С 278]. Рассмотрим методику, технику и особенности использования трех критериев: асимметрии и эксцесса, хи-квадрат и Шапиро-Вилка. Причем для сравнения будем использовать в учебных примерах одни и те же эмпирические данные.

Критерии асимметрии и эксцесса

Критерии асимметрии и эксцесса применяют для приблизительной проверки гипотезы о нормальности эмпирического распределения. Асимметрия характеризует степень несимметричности, эксцесс - степень заостренности (сглаженности) кривой дифференциальной функции эмпирического распределения по сравнению с функцией плотности нормального распределения.

Для нормального распределения N (¿1,0) с математическим ожиданием / г и дисперсией а 1 третий и четвертый центральные моменты имеют смысл асимметрии и эксцесса. Соответствующие коэффициенты А и Е равны нулю:

Итак, нормальное распределение является симметричный относительно среднего значения и является "идеальный» - не заостренный и не сглажен.

Дисперсии асимметрии и эксцесса соответственно равны

Считается, что при нормальном распределении выборочные показатели асимметрии и эксцесса равны нулю, но реально такое почти не наблюдается. Поэтому эмпирическое распределение считают близким к нормальному (принимают нулевую гипотезу), если выполняются условия:

| 4x | * 3ЩА) и К | ^ 5л / ЕД. (5.3)

Технологически в этом методе рассчитывают показатели t A и t E

О достоверное отличие эмпирического распределения от нормального свидетельствуют показатели t A и t E, если принимают значение 3 и более.

Пример 5.2. Проверить соответствие распределения эмпирических выборочных данных (столбцы А: В рис. 5.4) нормальному закону распределения признака.

Последовательность решения.

o Формулировка гипотез:

H 0: эмпирическое распределение не отличается от нормального; H 1: эмпирическое распределение отличается от нормального.

o Выбор статистического критерия. Для проверки статистических гипотез используем метод критериев асимметрии и эксцесса с расчетом t A и t E:

A I | E x |

и а = ^ и ^ =, (5.5)

где A x и E x - эмпирические коэффициенты асимметрии и эксцесса; m A и m E равны: m I 6 - (n - 1); m E - p4- n - (n - 2 H n - 3 H n EI. ( 5.6)

o Расчеты эмпирических критериев t A и t E (рис. 5.4) выполнено с помощью формул (см. рис. 5.5). Выборочные значения асимметрии (4 Х) и эксцесса х) по формулам (2.12) и (2.126) рассчитан с помощью функций MS Excel = СКОС () и = ЗКСЦЕСС ().

o Формулировка выводов. Численные значения критериев t A и t E (рис. 5.4) не превышают 3 (t A ~ 0,47 <3, t E ~ 0,49 <3), что дает возможность утверждать об отсутствии различий между эмпирическим и теоретическим нормальным делениями.

Однако сравнение графиков этих распределений дают основания для сомнения относительно соответствия эмпирического распределения нормальному закону (см. Рис. 5.6), что требует дополнительной проверки.

Рис. 5.6. Эмпирический и нормальный теоретический распределения

Более того, в научной и специальной литературе по математической статистике при ссылке на критерии асимметрии и эксцесса как на средство проверки нормальности распределения, нередко обращается внимание на предостережения о том, что эти критерии позволяют проверять только некоторые соотношения между моментами распределения и отнюдь не способны критериям нормальности.

 
< Пред   СОДЕРЖАНИЕ   След >