ПОКАЗАТЕЛИ ВЫБОРКИ

Меры центральной тенденции (МЦТ)

Мерами центральной тенденции (МЦТ) называют многочисленные показатели типовых свойств эмпирических данных. Эти показатели дают ответа на вопрос о том, например, "который средний уровень интеллекта студентов педагогического университета?", "Которое типичное значение показателя ответственности определенной группы лиц?". Существует сравнительно небольшое количество таких показателей-мер и в первую очередь: мода, медиана, среднее арифметическое. Каждая конкретная МЦТ имеет свои особенности, которые делают ее ценной для характеристики объекта исследования в определенных условиях.

Мода Мо - это значение, которое чаще всего встречается среди эмпирических данных. Так, для ряда значений 2, 2, 3, 3, 3, 3, 4, 4, 4, 5, 5 мода равна 3 (Мо = 3). Обратите внимание на то, что мода является значение с наибольшей частотой (в примере это значение равно 3), а не частота этого значения (в примере она равна 4).

При определении моды необходимо соблюдать следующие сделок:

o мода может отсутствовать, например, для данных 2, 2, 3, 3, 4, 4, 5, 5,

o если варианты смежные и имеют одинаковую частоту, мода определяется как среднее значение соседних вариант. Например, для ряда 2, 2, 3, 4, 4, 4, 5, 5, 5 мода Мо = (4 + 5) / 2 = 4,5;

o если варианты несовместимые, может существовать несколько мод. Так, для данных 2,

2, 3, 3, 3, 4, 5, 5, 5 характерна бимодальнисть, то есть две моды Мо 1 = 3 и Мо 2 = 5,

o эмпирические данные могут иметь большие и малые моды. Например, данные 2, 2,

3, 3, 3, 4, 4, 4, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 9, 9, 9, 9 имеют одну большую моду Мо 1 = 6 и две малые моды Мо 2 = 3,5 и Мо 3 = 9.

На графиках распределения мода - это варианта с максимальной частотой. На рис. 2.25 варианта х 6 = 5 имеет наибольшую частоту (0,33), поэтому и является модой Мо = 5 Медиана МСИ - это значение, которое приходится на середину упорядоченной последовательности эмпирических данных. Для нечетного количества данных медиана определяется средним элементом Мй = х (п + 1) / 2. Например, для 11 значений 4, 4,

4, 5, 5, 5, 5, 5, 6, 6, 7 медиана равна 4 (МСИ = 5), то есть:

Мй = х (п + 1) / 2 = х (11 + 1) / 2 = х 6 = 5

Если количество значений данных является парной, то медианой является среднее значение центральных соседних элементов: Мй = Х "/ 2 + 2 х" / 2 + 1. Например, для 12 значений 3, 3, 3, 4, 4, 5, 6, 6, 6, 6, 7, 7 медиана Мй = (5 + 6) / 2 = 5,5:

Мй _ х п / 2 + х п / 2 + 1 _ х 12/2 + х 12/2 + 1 _ х 6 + х 7 _ 5 + 6 _ _ 55

~ 2 2 2 2 ~ 2 _ ,.

Среднее арифметическое X (выборочное среднее или среднее) совокупности п значений равно:

X = х1 + х2 + - + хп. (2.1)

п

- 1 п - 1

Используют другие формулы, например, X = х и сокращенно X = - ^ х и.

п i = 1 п

Так, для выборки (2, 2, 3, 3, 4, 5, 6, 7, 7, 8) среднее X равна:

X = (2 + 2 + 3 + 3 + 4 + 5 + 6 + 7 + 7 + 8) / 10 = 47/10 = 4,7. Если данные представлены делениями частот, среднее определяется как:

X = И £ и "хи (2.2)

И / и

где х - - варианты несгруппированных частот или центральные значения классовых интервалов в случае сгруппированных частот; £ - дифференциальные частоты. Особенности мер центральной тенденции:

o мода выборки вычисляется просто, ее можно определить «на глаз». Для очень больших групп данных мода является достаточно стабильной степени центра распределения;

o медиана занимает промежуточное положение между модой и средним с точки зрения ее подсчета. Эта мера особенно легко определяется при ранжированных данных;

o среднее арифметическое предусматривает использование всех значений выборки, причем все они влияют на значение этой меры.

Рассмотрим, что может произойти с модой, медианой и средним, когда изменится вдвое только одно значение, например, 10-го объекта выборки (рис. 2.28).

Рис. 2.28. Свойства МЦТ

Как видим, мода и медиана остались неизменными, в то время как среднее изменилось в значительной степени (с 4,8 до 5,7). На величину среднего особенно существенно влияют значения, находящихся далеко от центра группы данных.

С точки зрения ошибок, возникающих из-за того, когда для характеристики целой совокупности выбирается только одна единственная статистическая мера (мода, медиана или среднее), каждая мера центральной тенденции имеет свою интерпретацию

Мода является наиболее представительным значением или значением, которое лучше "заменяет все значения", если мы вынуждены выбрать одно.

Медиана - это такое значение, для которого сумма абсолютных разниц всех значений меньше суммы разниц для любого другого значения. Например, для совокупности {1, 3, 6, 8, 9} медиана МСИ = 6 Абсолютные разницы составляют: | 1-6 | = 5, | 3-6 | = 3, | 6-6 | = 0, | 8 -6 | = 2, | 9-6 | = 3. Сумма всех этих разниц 5 + 3 + 0 + 2 + 3 = 13 меньше суммы разниц по любому иное значение. Например, для 1 абсолютные разницы | 1-1 | = 0, | 3-1 | = 2, | 6-1 | = 5, | 8-1 | = 7, | 9-1 | = 8, а их сумма 0 + 2 + 5 + 7 + 8 = 22. Другие расчеты дадут сходные результаты.

Если выбрать медиану, то достигается минимальное отклонение - при условии, что "отклонения" определяется как сумма абсолютной различия каждого значения от медианной оценки. Если же вместо каждого значения берется среднее, обеспечивается минимальное отклонение - при условии, что "отклонения" определяется как сумма квадратов разностей каждого значения со средним.

Использование мер центральной тенденции в качестве характеристик случайной выборки является условием необходимым, но недостаточным. Показатели описательной статистики, кроме МЦТ, включают еще одну группу показателей - меры изменчивости (ММ).

 
< Пред   СОДЕРЖАНИЕ   След >