Расчеты и интерпретация МЦТ и ММ
Расчеты показателей МЦТ и ММ можно осуществить в MS Excel тремя способами с использованием:
o математических операций в соответствующих формул МЦТ и ММ;
o встроенных статистических функций MS Excel;
o специального раздела "Описательная статистика" пакета "Анализ данных". Способ 1. Результаты расчета МЦТ и ММ представлено на рис. 2.37,
соответствующие математические выражения, формулы и функции MS Excel - на рис. 2.38.
Рис. 2.38. Математические выражения для расчета МЦТ и ММ
Мода выборки Мо = 2 (значение 2 встречается в выборке 5 раз). Медиана равна
Мй - Х п / 2 + Х п / 2 + 1 _ Х 12/2 + Х 12/2 + 1 _ Х 6 + Х 7 _ 2 + 2 _ 4 _ 2
~ 2 2 ~ 2 ~ 2 ~ 2 ~.
Среднее арифметическое выборки X = - v х и = - 28 = 2,33.
п 12
Дисперсия выборки в 2 = ^ (п '_1) = 1 ^ = ~ 1,52.
Стандартное отклонение выборки в х = ^ [^ й = 1,52 "1,23. Асимметрия выборки
Способ 2. Результаты расчетов показателей описательной статистики для четырех выборок представлено на рис. 2.39, графики распределения - на рис. 2.402.43. Для расчетов были использованы такие статистических функций MS Excel:
Объем выборки = счёт () |
Дисперсия |
= дисп () |
Среднее = СРЗНАЧ () |
Ст. отклонения |
= СТАНДОТКЛОН () |
Мода = МОДА () |
Асимметрия |
= СКОС () |
Медиана = МЕДИАНА () |
Эксцесс |
= ЭКСЦЕСС () |
Рис. 2.39. Расчеты распределения, МЦТ и ММ с помощью функций табличного процессора MS Excel
Распределения рассчитан с помощью функции = ЧАСТОТА () и представлено на рис 2.40-2.43.
Как видно, все выборки унимодальном, характеризуются примерно одинаковыми МЦТ (см. Ячейки F25: J27). Распределение выборки f 1 (x) имеет нулевую асимметрию (0,00), малый положительный эксцесс (0,20) и среди четырех выборок наиболее соответствует свойствам нормального распределения (рис. 2.40).
Распределение f 2 (x) характеризуется незначительной отрицательной асимметрией (-0,18) и существенным отрицательным эксцессом (-0,75) (рис. 2.41). Распределение f 3 (x) "деформирован" в левый бок с асимметрией (0,70) и умеренным положительным эксцессом (0,26) (рис. 2.42). Распределение f4 (x) имеет отрицательную асимметрию (-0,68) еще и положительный положительный эксцесс (0,64). По сравнению со "стандартом" он менее всего соответствует требованиям нормальности среди исследуемых выборок.
Способ 3. Получить показатели МЦТ и ММ выборки с помощью пакета "Анализ данных" раздел "Описательная статистика" можно в такой последовательности действий:
o выполнить команды главного меню Excel [Сервис -> Анализ данных], выбрать раздел "Описательная статистика (рис. 2.44), вызвать диалоговое окно;
Рис. 2.44. Раздел "Описательная статистика"
o установить в диалоговом окне "Описательная статистика" (рис. 2.45) входные данные и параметры вывода, выполнить команду ОК и получить результаты в ячейках колонок С Б (рис. 2.46);
Рис. 2.45. Параметры диалогового окна
o сравнить результаты с расчетами эмпирических МЦТ и ММ предыдущего способа 1 (рис. 2.37), сделать выводы.
Рис. 2.46. Результаты расчета основных показателей описательной статистики
Итак, среди рассмотренных способов расчета статистик (показателей МЦТ и ММ), наиболее эффективным и гибким считаются средства с использованием встроенных статистических функций табличного процессора MS Excel.
Начальные и центральные моменты
Для системной характеристики вариационного ряда используют специальные показатели - начальные и центральные моменты.
Начальный момент к-то порядка вариационного ряда определяется как:
п
v k = е х к * ии. (2.13)
Центральный момент к-то порядка определяется по формуле:
п _
т к = е (х "х) к * Л, (2.14)
и = и
где Хи - варианты распределения; / и - дифференциальные относительные частоты, x - среднее арифметическое.
Очевидно, что первый начальный момент (к = 1) имеет смысл среднего арифметического вариационного ряда
п _
т 1 = х х и "- / и = х. (2.15)
Первый центральный момент (к = 1) равен нулю, что обусловлено свойствами среднего
п _
т = е (х - х) ■ / и = о. (2.16)
Второй центральный момент (к = 2) - это дисперсия ¡1 вариационного ряда
п _
т 2 = е (х ~ х) 2 ■ / и = я х 2. (2.17)
Третий центральный момент (к = 3) характеризует асимметрию распределения
тс = £ (Х и - X) 3 / и.
Если разделить третье центральный момент т 3 на куб середньоквадра ческого отклонения (я х) 3, то получим коэффициент асимметрии распределения ^ 4 х:
7% £ (х - Х) 3 В = А *. (2.18)
С 5 *) С 5 *) 1 = 1
Четвертый центральный момент т 4 дает возможность оценить "заостренность" вариационного ряда, то есть оценить эксцесс
т4 = £ (х - X) 4 /. Коэффициент эксцесса Е х определяется через 4-й центральный момент т 4:
- 3 - [5 (х; - Х) 3 Л] - 3 - Е х (2.19)
Между центральными и начальными моментами существует связь: т! = 0
что вытекает из преобразований:
п п п п
т 2 = £ (X "X) 2 / = е (* 2" 2х, Х + X v, = £ х 2 В) е (2х, Х-X 2) / и = и = и и = и и = и и = и
= В г х (х, Х + х ~ Х-X 2) / и = у г Х% / Х £ (х, -X) /; ^ 2 - ^ -0 = в г -V 2
i = 1 i = 1 i = 1
п п
Итак, если т 2 = v 2 = е х и "й;, v l = е х; 'й;, то можно получить еще одно соотношение, которое используется для расчета дисперсии:
п (п 2
i = 1 v i = 1)
Центральные моменты 3-го и 4-го порядка тоже можно записать с помощью начальных моментов:
т 3 = v 3 - 3 ^ 2 + 2v 3, (2.20)
т 4 = v 4 - 4 ^ 3 + 6v одна 2 v 2 - 3v 4 и т.д.
Практика статистических исследований ограничивается, как правило, использованием моментов до 4-го порядка.
На основе сравнения значений теоретических и выборочных моментов выполняется оценивания параметров распределений случайных величин (см., Например, раздел 4 "Методы статистического оценивания»).