Дихотомический коэффициент корреляции Пирсона φ
Для определения тесноты связи признаков X и Y, которые оцениваются в двух значениях 1 и 0, применяется коэффициент <р Пирсона:
Я> = и, (5.32)
Jp x ■ p y ■ (n - p x) o (n - p y)
где: p xy - число объектов, имеющих "1" и с X, и с Y; p x и p y - число объектов, имеющих "1" с X и с Y соответственно; n - общее количество объектов.
Пример 5.23. Оценить связанность между увлеченностью учеников спортом и их склонностью к математике. В таблице рис. 5.50 обозначения для X и Y: 1 -наличие признаки 0 - ее отсутствие.
Последовательность решения:
o Расчеты коэффициента <р проводим с помощью таких выражений:
- В ячейку В15 внести выражение = СЧЕТ (В3: В14)
- В ячейку В16 - выражение = СУММЕСЛИ (В3: В14; "= 1"; С3: С14)
- В ячейку В17 - выражение = СУММ (В3: В14)
- В ячейку В18 - выражение = СУММ (С3: С14)
- В ячейку В19 - выражение = (В15 * В16-В17 * В18) / КОРЕНЬ (В17 * В18 * (В15-В17) * (В15-В18)). Обычные арифметические расчеты дают аналогичный результат коэффициента корреляции <р Пирсона дляр ху = 5, р х = 6, р в = 7 и п = 12:
12o5 - 6 o 7 в> = ~ 0,51.
д / 6 o 7 o (12 - 6) o (12 - 7)
o Оценка значимости коэффициента корреляции ^. Если принять, что выборочное распределение коэффициента эр примерно описывается нормальным законом с нулевым средним и единичным стандартным отклонением, проверка нуль-гипотезы выполняется с помощью г-критерия: г ЭМП = д) -4п.
Внести в ячейку В20 выражение = В19 * КОРЕНЬ (В15) и получить 2 ЭМП:
и ЭЯП = 0,51 -712 * 1,76.
Рис. 5.50. Расчеты коэффициента корреляции <р
o Критическое значение г-критерия для а = 0,05 расположенное ниже г в / 2 стандартного нормального распределения (0,025 или 0,975). В ячейку В21 внести функцию = НОРМСТОБР (1-0,05 / 2), которая вернет значение г кр ~ 1,96.
Выводы: поскольку г ем "<и кр (1,76 <1,96), на уровне значимости 0,05 нулевая гипотеза Н 0 принимается. Таким образом, значение коэффициента эр ~ 0,51 не может свидетельствовать о существовании связи между увлеченностью спортом учащихся и проявлением склонности к математике.
Точечно-бисериальный коэффициент корреляции rpb
Точечно-бисериальный коэффициент корреляции г рь используется для эмпирических данных, значения которых получены по разным шкалам измерений, например, если переменная x измеряется дихотомической шкале, а переменная В - в шкале интервалов или отношений:
_ В 1 - В 0 и п 1 ■ п 0 г рь - ли: тг, (5.33)
* в п ■ (п - 1)
где В 1 и п 1 - среднее и количество объектов, которые имеют 1 из X; У0 и п 0 - среднее и количество У объектов, имеющих 0 с X; я в - стандартное отклонение всех п значений В; п = п 1 + п 0. Пример 5.24. Оценить связь между показателями "пол" и "рост" рис. 5.51 для 15 подростков (x = 1 для мужской, x = 0 для женского пола). Последовательность решения:
o Расчеты коэффициента корреляции г рь:
- В ячейку Е3 внести = СЧЕТ (Л3: Л12) и получить п = 10;
- В ячейку Е4 внести = СУММ (В3: В12) и получить п 1 = 6;
- В ячейку Е5 внести = Е3-Е4 и получить п 0 = 4;
- В ячейку Е6 внести = СУММЕСЛИ (В3: В12, 1; С3: С12) / Е4 и получить средний рост мальчиков в 1 "167,83 см;
- В ячейку Е7 внести = СУММЕСЛРИ (В3: В12; 0; С3: С12) / Е5 и получить средний рост девушек В 0 ~ 154 см;
- В ячейку Е8 внести = СТАНДОТКЛОН (С3: Е12) и получить стандартное отклонение 5 в = 11,35;
- В ячейку Е9 внести выражение для расчета точечно-бисериальный коэффициента = (Е6-Е7) ИЕ8 * КОРЕНЬ (Е4 * Е5ИЕ3И (Е3-1)) и получить его значение:
= 167,83 - 154 р ^ т 0,63
рь 11,35 10 o (10-1) ■
На рис. 5.51 представлены результаты расчета точечно-бисериальный коэффициента корреляции г "ь, на рис. 5.52 - соответствующие расчетные формулы.
o Оценка значимости коэффициента корреляции г рь сводится к проверке нуль-гипотезы (Н 0: г рь = 0), для которой используется статистика г-критерий Стьюдента с (п-2) степенями свободы:
г = И *. (5.34)
^ / (1 - ГД) и (п - 2) ''
Для расчета г эля в ячейку Е10 внести = Е9ИКОРЕНЬ ((1-Е9 л 2) и (Е3-2)) и получить значение г эля ~ 2,29.
o Критическое значение г-критерия можно получить с помощью функции = СТЬЮДРАСПОБР (<хИ2; п-2). При а = 0,05 и n = 10 в ячейку В256 внести функцию = СТЬЮДРАСПОБР (0,05И2; Е3-2), которая дает значение г ", = 2,75.
o Выводы: поскольку полученное значение й ЭМП -2,29 не превышает критическое значение ^ -2,75 нуль-гипотеза об отсутствии корреляции принимается. Итак, с вероятностью 95% (а = 0,05) правдоподобно, что в этой ситуации коэффициент корреляции г рь, который принимает довольно существенное значение (0,63), не является вероятным!
Вопрос. Задача.
1. Охарактеризуйте особенности применения, расчета и проверки значимости коэффициента линейной корреляции Пирсона.
2. Охарактеризуйте особенности применения, расчета и проверки значимости коэффициента ранговой корреляции Спирмена.
3. Охарактеризуйте особенности применения, расчета и проверки значимости дихотомического коэффициента корреляции Пирсона ^.
4. Охарактеризуйте особенности применения, расчета и проверки значимости точечно-бисериальный коэффициента корреляции.
6. Повторите математические процедуры задач за примерами 5.21 - 5.24.
7. Выполните лабораторные работы № 20 - № 22.