Квантили
Квантили называется значение ранжированы переменной, отделяет от вариационного ряда определенную долю объема совокупности. Квантиль - общее понятие. В математической статистике используются такие квантили:
o процентили (Р 1, Р 2, ..., Р99)
o дециле (П 1, П 2, ...,
o квинтили (К 1, К 2, К 3, К 4)
o квартале 62, 6 из).
Наиболее распространенными являются процентили (персентиль) и квартили.
Процентили делят упорядоченную совокупность на ста частей, то есть отделяют от совокупности по 0,01 части (по 1%).
Квартили делят совокупность на четыре части. Первый квартиль £) 1 отделяет слева 0,25 объема совокупности. Второй квартиль £) 2 делит совокупность на две равные по объему части (по 0,5), он называется медианой. Наконец, третий квартиль £) 3 отделяет слева 0,75 объема совокупности.
Между различными Квантили существуют определенные соотношения, например, между квартилями и процентилями следующие: Р 25, <2 2 = Р 50, <2 +3 = Р 75. Поэтому достаточно знать только процедуру поиска, например, процентилей, чтобы определить любые нужные квантили. Нахождение персентиль является наиболее простым. Перед началом вычисления любого процентиля следует упорядочить данные по возрастанию. Р-И процентиль предел, ниже которой лежат Р процентов значений. Вычислять квантили можно графически или по таблицам. Так из рис. 2.47 видно, что 25-й процентиль Р 25 и 1-й квартиль £) 1 равны значению 3 (Р 25 = 3 и 6 1 = 3) Итак, ниже этого значения находятся 25% всех значений. Аналогично можно найти другие соотношения, например Р 75 и £) 3 (75-й процентиль и 3-й квартиль) равны 6. Ниже этого значения находятся 75% всех значений.
Рис. 2.47. Соотношение квантилей
Для больших объемов удобнее пользоваться функциями MS Excel = персентиль () и = квартилей (). На рис. 2.47 в ячейки F4 и G4 внесены = персентиль ($ С $ 4: $ С $ 23; 04) и = KBAPTHJTb ($ C $ 4: $ C $ 23; E4) соответственно.
Функция = персентиль (.мй, седые; k) возвращает k-й процентиль для значений с массива данных (значение k задается в интервале от 0 до 1 включительно). Эту функцию можно использовать для определения границы приемлемости, например, зачислять курс учебной дисциплины только тем студентам, которые набрали баллов не менее 75-и процентов. Если k не является кратным 1 / (п - 1), то функция = персентиль () выполняет интерполяцию к k-oro процентиля. Для характеристик распределений используют квартили. Функция MS Excel = квартилей (массив; k) возвращает соответствующее табл. 2.3 значение квартиль.
Таблица 2.3
Значение функции = KBAPTHJIbOMS Excel
Через квартили могут определяться числовые характеристики центральной тенденции, изменчивости. Например, среднее квартильне отклонение - это мера разброса в распределениях, которая параметром центральной тенденции имеет медиану Мо ".
"Чувствительной" мерой рассеяния является напивинтерквартильне отклонения Е. Оно определяется как половина интервала, которому соответствует половина объема в совокупности, то есть Е = 0,5 (2 3 - где £) 3 и £) 1 - 3-й и 1-й квартили.
Нормированные данные
Нормированные данные - это данные, например, массива X (см. Рис. 2.48), полученные путем математического преобразования их по формуле
х. -X
*>, (2.21)
где ху - значенняу'-го элемента первичного массива данных X;
X и я х - среднее арифметическое и стандартное отклонение массива Х 1;
Второй - нормированное значение.
Так, нормированное значение1-го элемента 2 +1 равно (рис. 2.48):
21 = * ^ - ь 379, -1,71 1 Ух 1,63 1
Нормированные данные можно получить в такой последовательности:
o для эмпирических данных (столбцы А: В рис. 2.48) рассчитать значение
среднего X и стандартного отклонения я х в строках 16 и 17 с помощью
функций = СРЗНАЧ () и = СТАНДОТКЛОН ();
Рис. 2.48. Результаты расчета стандартизированных значений 2
o в ячейку С2 внести выражение = (В2- $ В $ 16) / $ В $ 17 и получить соответствующее нормированное значение -1,71;
o аналогичные выражения внести в ячейку С3: С15 (рис. 2.49);
o рассчитать в ячейку С16 и С17 средние значения и стандартные отклонения нормированных переменных 2 и убедиться, что они составляют 0 и 1;
Рис. 2.49. Формулы для расчета стандартизированных значений 2
o рассчитать в столбцах 0: И распределения частот £ первичных и £ норма
правленных данных с использованием функции = ЧАСТОТА () (см. рис. 2.48 - 2.49) и построить соответствующие графики (см. рис. 2.50).
(а) (б)
Рис. 2.50. Графики распределения данных: а) первичных; б) стандартизированных
Из рис. 2.50 можно убедиться, что графики вариационных распределений первичных и нормированных данных идентичны по форме, оси ординат проходят по значениям средних: для первичных это значение составляет 3,79, для нормированных - 0,00. Различны и показатели среднеквадратического отклонения - 1,63 и 1,00 соответственно. Метод нормализации довольно часто используется в статистических методах (см., Например, раздел 2.3).
Вопрос. Задача.
1. Дайте определение и охарактеризуйте особенности показателей МЦТ.
2. Как рассчитать моду, медиану и среднее арифметическое выборки.
3. Объясните понятие "унимодальнисть" и "бимодальнисть" распределения.
4. Как определить среднее арифметическое, если данные представлены делениями частот?
5. Охарактеризуйте выборочную дисперсию и стандартное отклонение, запишите расчетные формулы.
6. Какие свойства характеризуют показатели асимметрии и эксцесса?
7. Что такое начальные и центральные моменты?
8. Какие показатели выборки можно определять с помощью моментов?
9. Что такое "квантиль", которые квантили применяет математическая статистика?
10. Какое соотношение существует между квартилями и процентилями?
11. Что означает понятие "нормированные данные", которая формула преобразования?
12. Выполните математические процедуры задач по трем способами расчета показателей МЦТ и ММ в MS Excel.
13. Выполните лабораторную работу № 3.