Непараметрические критерии оценки корреляционной связи

Приведенные выше формулы для определения тесноты связи между признаками предусматривают, что совокупности, к которым они применяются, имеют нормальный или близкий к нормальному распределение. Если же характер распределения изучаемой совокупности даже предсказуемо неизвестен, то тесноту связи можно вычислить с помощью непараметрических критериев определения тесноты связи.

Особенностью этих критериев является то, что теснота связи между признаками определяется не количественными значениями вариантов, а с помощью сравнения их рангов. Под рангом понимают порядковый номер единицы совокупности в ранжированому ряда распределения. Чем меньше расхождения между рангами, тем теснее связь между признаками.

К непараметрических критериев показателей тесноты связи относятся коэффициенты: корреляции рангов, знаков Фехнера, ассоциации, контингенции и др.

Коэффициент корреляции рангов - это один из самых простых показателей тесноты связи (его же называют ранговым коэффициентом корреляции Спирмена). Суть его расчета заключается в следующем. Парные наблюдения двух взаимосвязанных признаков (результативной и факторной) ранжируются, а затем соответственно величине признаки им присваивается ранг от 1-п. Теснота связи определяется на основе близости рангов и формула коэффициента корреляции рангов будет иметь вид:

где и - разницы между величинами рангов в сравниваемых рядах; п - число наблюдений.

Смысл его такой же как и линейного коэффициента корреляции. Коэффициент корреляции рангов, как и линейный коэффициент корреляции может принимать значения от - 1 к + 1. в Если ранги двух параллельных рядов полностью совпадают, то ей = 0 и тогда имеет место прямая функциональная связь, а гр = 1. в При полном обратной связи (ранги размещаются в обратном порядке) гр= - 1 . в Ранжировать оба признака нужно в одном и том же порядке: или от меньших значений признака до больших, или наоборот.

Методика расчета коэффициента корреляции рангов покажем на примере определения тесноты связи между урожайностью хмеля и количеством внесенных органических удобрений на 1 га хмеля (табл. 9.5).

Рассчитан коэффициент корреляции рангов свидетельствует о наличии прямой тесной связи между урожайностью хмеля и количеством внесенных органических удобрений.

Вероятность коэффициента корреляции рангов можно проверить по таблице Фишера (прил. 9). Табличное значение коэффициента корреляции при а = 0,05 и к = п - т = 10 - 2 = 8 составляет гр = 0,632. Поскольку г^ВКИ > г005 (0,903 > 0,632), можно сделать вывод о том, что выборочный коэффициент корреляции рангов является вероятным.

Таблица 9.5. Данные для расчета коэффициента корреляции рангов

Данные для расчета коэффициента корреляции рангов

Недостатком коэффициента корреляции рангов является то, что одинаковым разницам могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков). Поэтому для последних следует считать корреляцию рангов приблизительной оценки степени тесноты связи.

Коэффициент корреляции рангов может быть также использован для определения тесноты связи между качественными (атрибутивными) признаками, которым может быть предоставлена ранговая оценка.

Коэффициент Фехнера применяется для оценки тесноты связи на основе сравнений знаков отклонений значений результативного и факторного признаков от их средних, его вычисляют по формуле

где Еа - сумма совпадений знаков; ЭЛЬ - сумма несовпадений знаков.

Коэффициент Фехнера изменяется от 0 до ±1. Если знаки всех отклонений совпадают, то ЭЛЬ = 0, а коэффициент Фехнера равен единице, что свидетельствует о наличии прямой связи. Если знаки всех отклонений будут разными, то Еа = 0, а коэффициент Фехнера равен -1, что указывает на наличие обратной связи.

Рассмотрим порядок вычисления коэффициента Фехнера на примере табл. 9.6.

Таблица 9.6. Данные для расчета коэффициента Фехнера

Данные для расчета коэффициента Фехнера

Знак минус означает, что значение признака меньше средней, знак плюс - больше средней. Совпадение знаков по обоим признакам означает согласованную вариацию, несовпадение - нарушение согласованности.

Коэффициент Фехнера для нашего примера составит

Полученная положительная величина коэффициента Фехнера свидетельствует о том, что между производством молока на 100 га сельскохозяйственных угодий и численности коров является прямая корреляционная связь.

Следует иметь в виду, что коэффициент Фехнера только констатирует наличие и направление корреляционной связи и не зависит от величины отклонений результативного и факторного признаков от соответствующих средних, в связи с чем оценка тесноты связи является приближенной. Коэффициент Фехнера может быть некоторым ориентиром в оценке интенсивности связи.

Тесноту связи между атрибутивными (качественными) признаками можно измерить с помощью специальных коэффициентов ассоциации и контингенции, предложенных соответствии Д.Юлом и К.Пірсоном.

Для их вычисления строится чотириклітинна таблица, которая показывает связь между двумя признаками, каждая из которых должна быть альтернативной, то есть такой, которая состоит из двух качественно отличных друг от друга значений (например, состояние посевов удовлетворительное или неудовлетворительное, удобренные земли или неудобрені и др.).

Общая схема чотириклітинної таблицы имеет вид (табл. 9.7).

Таблица 9.7. Чотириклітинна таблица для расчета коэффициентов ассоциации и контингенции

Чотириклітинна таблица для расчета коэффициентов ассоциации и контингенции

В этой таблице А и В признаки, между которыми изучается связь; не А и не В - противоположные (альтернативные) признаки: а, Ь, с,си - частоты соответствующих комбинаций признаков; N - общее число наблюдений.

Коэффициенты вычисляются по формулам:

Методику расчета коэффициентов ассоциации и контингенции рассмотрим на примере определения тесноты связи между двумя качественными признаками: сроками обработки хмельников пестицидами и степени их пораженности болезнями (табл. 9.8).

Таблица 9.8. Распределение участков хмельников, пораженных и не пораженных болезнями

Распределение участков хмельников, пораженных и не пораженных болезнями

В таблице а = 60; Ь = 15; с = 18; си = 47. Рассчитаем коэффициенты

Полученные коэффициенты ассоциации и контингенции указывают на достаточно тесную связь между сроками обработки и ураженістю болезнями хмельников.

При этом коэффициент контингенции дает более осторожную оценку тесноты связи между признаками.

Коэффициенты ассоциации и контингенции могут принимать любые значения от - 1 до + 1. Коэффициент контингенции всегда меньше коэффициента ассоциации. Для больших выборок (п > 30) связь практически считается

значимым, если и"а > 0,5 или Ук > 0,3. Величины коэффициентов ассоциации и контингенции, как показателей тесноты связи, толкуются так же как и величина коэффициента корреляции.

 
< Пред   СОДЕРЖАНИЕ   След >