Нелинейная корреляция
Пример 2.8. Оценить связь между возрастом (переменная X) и результатами вспомогательного теста "цифра-знак" шкалы интеллекта взрослых Векслера (переменная Y). Упорядочены по возрасту данные 15 человек представлены в таблице рис. 2.58.
Последовательность решения:
o оценить характер линейности (нелинейности) связи между значениями признаков возраста (X) и теста (Y) с помощью диаграммы рассеяния (рис. 2.57);
Рис. 2.57. Диаграмма рассеяния признаков
o том, что корреляция нелинейная - сначала результаты тестирования круто растут для лиц в возрасте от 10 до 22 лет, достигают максимального значения, а затем медленно уменьшаются. Качественная картина дает основания для применения количественной меры нелинейности - корреляционного отношения, численное значение которого находится в пределах от 0 до 1:
лень в и среднего в; 5Б загап = s в ■ (п - 1) - общая сумма квадратов;
o рассчитать квадраты разниц s¡ отдельно для каждой возрастной группы (возрастные группы выделены закрашенными строками, результаты расчетов и соответствующих формул показано на рис. 2.58 и 2.59);
o внести в ячейку выражение = (С3-СРЗНАЧ ($ С $ 3: $ С $ 4)) Л 2. Аналогичный выражение внести в ячейки (возрастная группа 10 содержит только два значения теста)
o определить Si для других возрастных групп, где х = 14, 18, 22, 26, 30, 34 и 38;
o в ячейке Б18 рассчитать 88 внутр (выражение = СУММ (03: 017));
o в ячейке Б19 рассчитать 88 шгал (выражение = ДИСП (С3: С17) * (А17-1))
o в ячейке Б20 получить отношение п 2 УХС (внести выражение = 1-018 / 019);
o в ячейке Б21 рассчитать коэффициент корреляции Пирсона для всего массива с помощью функции MS Excel = Пирсон (В3: В17; С3: С17). Коэффициент корреляции равен примерно нулю (r xy ~ 0,04), что свидетельствует о (якобы) отсутствие какой-либо связи между переменными;
o рассчитать коэффициенты корреляции отдельно для частей массива: в ячейке D22 для возраста от 10 до 22 в ячейке D23 для возраста от 26 до 38.
Итак, для возраста от 10 до 22 лет коэффициент корреляции имеет высокое положительное значение (r xy = + 0,83), что подтверждает прямую связь, который можно наблюдать на диаграмме. Для возраста от 26 до 38 лет коэффициент корреляции имеет отрицательное значение (^ = - 0,69), что интерпретируется как обратная связь. Значение корреляционного отношения "0,67 подтверждает высокий уровень нелинейности связи переменных X Y.
Следует обратить внимание на то, что для коэффициента rf yxc сначала указывают индекс в, а затем - х, который является мерой прогнозирования Y по X. Важно отметить, что для линейного корреляционной связи выполняется соотношение r xy = r yx, однако rf yxc и rf xyy иметь разные значения. Если обратиться к диаграмме рассеяния (рис. 2.57), то можно отметить тот факт, что для лица, например, в возрасте 10 лет (Х = 10), можно прогнозировать среднюю оценку теста в 8 баллов (Y = (7 + 9) / 2 = 8), в то время как для оценки теста, например, в 8 баллов возраст лица может быть как около 10, так и около 38 лет.
Расчеты важных для психолого-педагогических исследований коэффициентов корреляции приведены вместе с оценкой их достоверности в разделе 5.6.
Коэффициенты взаимной связанности
Коэффициенты взаимной связанности, например, Чупрова K и Пирсона С применяются для оценки связи в ситуациях, когда каждая качественный признак состоит более чем из двух групп. Коэффициент Чупрова К используется в случае неодинаковой количества строк и столбцов таблицы сопряженности (k, Ф k2):
где к] и к 2 - количество групп первой и второй признаки (параметры x и В). Коэффициент взаимной связанности Пирсона с применяется, когда количество строк и количество столбцов в таблице сопряженности совпадают (к; = к 2):
Значения коэффициентов Чупрова К и Пирсона с меняются от 0 до 1. Пример 2.9. Оценить связанность между принадлежностью лиц к определенной социальной группе и их психическими состояниями (табл. 2.5).
Таблица 2.5
Распределение групп по психическими состояниями
Последовательность решения:
o Для ситуации с различным количеством строк и столбцов (к; Ф к 2) использовать коэффициент взаимной связанности Чупрова К.
o Внести эмпирические данные в таблицу рис. 9.20 и выполнить такие действия: - расписать подробнее выражение <р 2, исходя из условий к, = 3 и к 2 = 4:
Рис. 2.60. Результаты расчета коэффициента Чупрова К
Рис. 2.61. Формулы для расчета коэффициента Чупрова К
- Определить параметр ф 2:
<р 2 = 0,538 + 0,454 + 0,513-1 = 0,505. - Получить численное значение коэффициента взаимной связанности Чупрова К
К -и =, ^ 0,45.
В (к1 - 1) (к 2 -1) V л / (3 "1) (4 -1)
Выводы. Значение коэффициента Чупрова К ~ 0,45 свидетельствует об умеренной взаимную связанность между параметрами В и x. Направление связанности коэффициент К не указывает. Это можно оценить по форме совместного распределения.
Вопрос. Задача.
1. Что такое корреляция? Охарактеризуйте особенности корреляционной связи.
2. Какие виды связей (три типа зависимостей) между переменными X и В можно выделить?
3. Докажите, что выборочный коэффициент корреляции является случайной величиной.
4. Какой корреляционная связь называют прямым, а какой - обратным?
5. Как качественно оценить линейность (нелинейность) корреляции?
6. В каких пределах находится численное значение коэффициентами корреляции?
7. Как количественно оценить линейность (нелинейность) корреляции?
8. Запишите формулу коэффициента линейной корреляции Персона.
9. В каких пределах находится численное значение корреляционного отношения?
10. Охарактеризуйте особенности использования коэффициентов взаимной связанности Чупрова К и Пирсона С.
11. В каких пределах находится значение коэффициентов взаимной связанности Чупрова К и Пирсона С?
12. Повторите математические процедуры задач за примерами 2.7 - 2.9.
13. Выполните лабораторные работы № 4 - № 6.