Парная (простая) линейная корреляция

самым Простым видом корреляционной связи является связь между двумя признаками: результативным и факторным. Такую связь называют парной корреляцией или простой корреляцией.

В экономических исследованиях взаимосвязи двух факторов среди множества функций часто рассматривается прямолинейная форма связи, которая выражается уравнением прямой линии

где Ух - выровненное значение результативного признака (зависимая переменная); х-значение факторного признака (независимая переменная); а - начало отсчета, или значение Ух при Ь = 0 (экономического содержания не имеет); Ь - коэффициент регрессии, который показывает среднюю переменную зависимой переменной при изменении независимой переменной на единицу (одно свое значение).

Коэффициенты регрессии являются величинами именованными и имеют единицы измерения, соответствующие переменным, между которыми они характеризуют связь.

Если Ь > 0, то связь прямая, если Ь < 0, то связь обратная, если Ь = 0, то связь отсутствует.

Параметры уравнения а и Ь определяют способом наименьших квадратов. Он дает возможность найти ту кривую, которая по сравнению с другими кривыми проходит ближе всего к точкам корреляционного поля, отражающие фактические данные, то есть дает наименьшую сумму квадратов отклонений фактических значений результативного признака от выровненных (теоретических) значений:

Порядок получения системы нормальных уравнений при парной корреляции такой. Для получения первого уравнения системы необходимо все члены исходного уравнения корреляционной связи умножить на коэффициенты при первом неизвестном (а) и полученные произведения просуммировать. Затем для получения второго уравнения необходимо все члены исходного уравнения умножить на коэффициент при втором неизвестном (Ь) и также все произведения просуммировать.

Техника получения системы нормальных уравнений остается аналогичной и для построения системы уравнений с большим числом переменных. Так, для парного линейного связи система нормальных уравнений имеет вид:

Параметры а и B уравнения прямой линии можно определить с другими рабочими формулами :

Уравнение корреляционной связи имеют как познавательное, так и практическое значение, их используют для вычисления теоретической линии регрессии, ожидаемых (теоретических, выровненных) и прогнозируемых значений зависимой переменной при тех или иных значениях фактора (факторов). При этом следует иметь в виду, что уравнение дает среднее соотношение между результативным и факторным признаками, поэтому наибольшую точность совпадения имеют расчетные значения результативного признака при величине фактора, близкого к среднему его уровню.

Степень приближения расчетных значений результативного признака до ее фактического значения зависит от того, насколько совершенна корреляционная модель. Если она включает все основные факторы, определяющие вариацию результативного признака, то точность будет довольно высокой.

Рассмотрим пример анализа корреляционной связи между двумя признаками (парная корреляция): продуктивностью коров - надоем молока на среднегодовую корову (ц) и уровнем кормления - затратами кормов на одну корову за год (ц кормовых единиц; табл. 9.1).

Таблица 9.1. Расчет данных для определения показателей корреляционной связи

Расчет данных для определения показателей корреляционной связи

Результативным признаком в данном примере является продуктивность коров (в), а факторным - уровень кормления (х).

Для определения формы связи между продуктивностью коров и уровнем кормления построим график - корреляционное поле (рис. 9.1.). На оси абсцисс отложим значение факторного признака (независимой переменной - уровня кормления, а на оси ординат - результативного признака (зависимой переменной - продуктивности коров).

Корреляционное поле зависимости надоя на корову от затрат кормов

Рис. 9.1. Корреляционное поле зависимости надоя на корову от затрат кормов

График показывает, что в данном случае связь близок к прямолинейному и его можно выразить уравнением прямой линии

Решение этого уравнения регрессии покажет изменение продуктивности коров под влиянием уровня кормления при исключении случайных колебаний признака.

Параметры уравнения прямой линии а и B найдем из системы нормальных уравнений:

Все необходимые для решения системы уравнений данные рассчитаем в табл. 9.1. Полученные данные подставим в систему уравнений:

Поделим уравнение на коэффициенты при а то есть первое уравнение на 10, а второе - на 413:

Вычтем первое уравнение из второго:

0,4722 = 0,5806 Ь , отсюда Ь = 0,4722 : 0,5806 = 0,813 ц на 1 ц кормовых единиц. Подставим значение Ь = 0,813 в первое уравнение и найдем а:

Уравнение регрессии (корреляционное уравнение, которое выражает связь между продуктивностью коров и уровнем кормления будет иметь вид:

Коэффициент регрессии Ь = 0,813 показывает, что с повышением уровня кормления на 1 ц кормовых единиц продуктивность коров в среднем по данной совокупности хозяйств растет на 0,813 ц.

Параметры уравнения регрессии можно определить и по другим формулам:

Проверим правильность решения системы уравнений, исходя из равенства

По уравнению регрессии можно рассчитать ожидаемые (расчетные или теоретические) значения продуктивности коров (ух) при различных значениях расхода кормов на корову (*). Для этого вместо х подставим его конкретные значения:

Все вычисленные данные запишем в последнюю графу таблицы 9.1. По этим данным на рис. 9.1 построим теоретическую линию регрессии.

Проверим правильность всех расчетов сопоставив суммы фактического и расчетного надоя молока на корову:

 
< Пред   СОДЕРЖАНИЕ   След >