Квантили

Квантили называется значение ранжированы переменной, отделяет от вариационного ряда определенную долю объема совокупности. Квантиль - общее понятие. В математической статистике используются такие квантили:

o процентили (Р 1, Р 2, ..., Р99)

o дециле (П 1, П 2, ...,

o квинтили (К 1, К 2, К 3, К 4)

o квартале 62, 6 из).

Наиболее распространенными являются процентили (персентиль) и квартили.

Процентили делят упорядоченную совокупность на ста частей, то есть отделяют от совокупности по 0,01 части (по 1%).

Квартили делят совокупность на четыре части. Первый квартиль £) 1 отделяет слева 0,25 объема совокупности. Второй квартиль £) 2 делит совокупность на две равные по объему части (по 0,5), он называется медианой. Наконец, третий квартиль £) 3 отделяет слева 0,75 объема совокупности.

Между различными Квантили существуют определенные соотношения, например, между квартилями и процентилями следующие: Р 25, <2 2 = Р 50, <2 +3 = Р 75. Поэтому достаточно знать только процедуру поиска, например, процентилей, чтобы определить любые нужные квантили. Нахождение персентиль является наиболее простым. Перед началом вычисления любого процентиля следует упорядочить данные по возрастанию. Р-И процентиль предел, ниже которой лежат Р процентов значений. Вычислять квантили можно графически или по таблицам. Так из рис. 2.47 видно, что 25-й процентиль Р 25 и 1-й квартиль £) 1 равны значению 3 (Р 25 = 3 и 6 1 = 3) Итак, ниже этого значения находятся 25% всех значений. Аналогично можно найти другие соотношения, например Р 75 и £) 3 (75-й процентиль и 3-й квартиль) равны 6. Ниже этого значения находятся 75% всех значений.

Рис. 2.47. Соотношение квантилей

Для больших объемов удобнее пользоваться функциями MS Excel = персентиль () и = квартилей (). На рис. 2.47 в ячейки F4 и G4 внесены = персентиль ($ С $ 4: $ С $ 23; 04) и = KBAPTHJTb ($ C $ 4: $ C $ 23; E4) соответственно.

Функция = персентиль (.мй, седые; k) возвращает k-й процентиль для значений с массива данных (значение k задается в интервале от 0 до 1 включительно). Эту функцию можно использовать для определения границы приемлемости, например, зачислять курс учебной дисциплины только тем студентам, которые набрали баллов не менее 75-и процентов. Если k не является кратным 1 / (п - 1), то функция = персентиль () выполняет интерполяцию к k-oro процентиля. Для характеристик распределений используют квартили. Функция MS Excel = квартилей (массив; k) возвращает соответствующее табл. 2.3 значение квартиль.

Таблица 2.3

Значение функции = KBAPTHJIbOMS Excel

Через квартили могут определяться числовые характеристики центральной тенденции, изменчивости. Например, среднее квартильне отклонение - это мера разброса в распределениях, которая параметром центральной тенденции имеет медиану Мо ".

"Чувствительной" мерой рассеяния является напивинтерквартильне отклонения Е. Оно определяется как половина интервала, которому соответствует половина объема в совокупности, то есть Е = 0,5 (2 3 - где £) 3 и £) 1 - 3-й и 1-й квартили.

Нормированные данные

Нормированные данные - это данные, например, массива X (см. Рис. 2.48), полученные путем математического преобразования их по формуле

х. -X

*>, (2.21)

где ху - значенняу'-го элемента первичного массива данных X;

X и я х - среднее арифметическое и стандартное отклонение массива Х 1;

Второй - нормированное значение.

Так, нормированное значение1-го элемента 2 +1 равно (рис. 2.48):

21 = * ^ - ь 379, -1,71 1 Ух 1,63 1

Нормированные данные можно получить в такой последовательности:

o для эмпирических данных (столбцы А: В рис. 2.48) рассчитать значение

среднего X и стандартного отклонения я х в строках 16 и 17 с помощью

функций = СРЗНАЧ () и = СТАНДОТКЛОН ();

Рис. 2.48. Результаты расчета стандартизированных значений 2

o в ячейку С2 внести выражение = (В2- $ В $ 16) / $ В $ 17 и получить соответствующее нормированное значение -1,71;

o аналогичные выражения внести в ячейку С3: С15 (рис. 2.49);

o рассчитать в ячейку С16 и С17 средние значения и стандартные отклонения нормированных переменных 2 и убедиться, что они составляют 0 и 1;

Рис. 2.49. Формулы для расчета стандартизированных значений 2

o рассчитать в столбцах 0: И распределения частот £ первичных и £ норма

правленных данных с использованием функции = ЧАСТОТА () (см. рис. 2.48 - 2.49) и построить соответствующие графики (см. рис. 2.50).

(а) (б)

Рис. 2.50. Графики распределения данных: а) первичных; б) стандартизированных

Из рис. 2.50 можно убедиться, что графики вариационных распределений первичных и нормированных данных идентичны по форме, оси ординат проходят по значениям средних: для первичных это значение составляет 3,79, для нормированных - 0,00. Различны и показатели среднеквадратического отклонения - 1,63 и 1,00 соответственно. Метод нормализации довольно часто используется в статистических методах (см., Например, раздел 2.3).

Вопрос. Задача.

1. Дайте определение и охарактеризуйте особенности показателей МЦТ.

2. Как рассчитать моду, медиану и среднее арифметическое выборки.

3. Объясните понятие "унимодальнисть" и "бимодальнисть" распределения.

4. Как определить среднее арифметическое, если данные представлены делениями частот?

5. Охарактеризуйте выборочную дисперсию и стандартное отклонение, запишите расчетные формулы.

6. Какие свойства характеризуют показатели асимметрии и эксцесса?

7. Что такое начальные и центральные моменты?

8. Какие показатели выборки можно определять с помощью моментов?

9. Что такое "квантиль", которые квантили применяет математическая статистика?

10. Какое соотношение существует между квартилями и процентилями?

11. Что означает понятие "нормированные данные", которая формула преобразования?

12. Выполните математические процедуры задач по трем способами расчета показателей МЦТ и ММ в MS Excel.

13. Выполните лабораторную работу № 3.

 
< Пред   СОДЕРЖАНИЕ   След >