Особенности корреляционного анализа в рядах динамики
Приведенные выше примеры корреляционного анализа исчисленные на материалах пространственных статистических совокупностей. Однако при изучении изменения явлений во времени часто возникает необходимость оценить степень взаимосвязи уровней каких-либо рядов динамики различного содержания, но связанных между собой. Например, можно поставить вопрос, в какой степени изменение в динамике обеспеченности производства удобрениями, техникой влияет на изменение урожайности, или уровня кормления животных на их продуктивность и т.д. В этом случае применяют корреляция рядов динамики.
Корреляционный анализ динамических рядов проводится по той же схеме, что и анализ взаимосвязей в пространстве. Вместе с тем есть некоторые особенности применения методов корреляции относительно анализа рядов динамики. Одной из таких особенностей является наличие для большинства рядов динамики основной тенденции (тренда) в изменении их уровней, тогда как одним из условий применения теории корреляции является независимость отдельных наблюдений. В динамических же рядах фактором изменения уровней выступает, кроме других, и время, поэтому, как правило, каждый следующий временной уровень связан с предыдущим. Например, объемы производства сельскохозяйственной продукции безусловно величины, которые зависят от уровня их производства в предыдущие годы. То же самое можно сказать и про урожайность сельскохозяйственных культур, продуктивность животных и др. Такая зависимость между каждым последующим и предыдущим уровнями ряда динамики получила название автокорреляции.
Корреляция между уровнями динамических рядов правильно показывает тесноту связи между признаками только в том случае, если в каждом из них отсутствует автокорреляция. Наличие или отсутствие автокорреляции всегда нужно проверять и одним из условий научного применения методов корреляционного анализа относительно рядов динамики является исключение трендов с обоих рядов. В общем случае можно предполагать, что в рядах динамики, которые состоят из отклонений от тренда, автокорреляции нет.
Второй особенностью, которую необходимо учитывать при сопоставлении уровней рядов динамики, является наличие временного лага. Под временным лагом понимают, с одной стороны, период, через который наблюдается сильная корреляция между уровнями одного и того же ряда, и, с другой стороны, период отставание в развитии двух взаимосвязанных рядов. Теснейшая связь в двух взаимосвязанных рядах возникает, если сдвинуть один ряд относительно второго на период лага. Поэтому при наличии отставания в развитии двух взаимосвязанных показателей необходимо сдвинуть уровни одного ряда относительно второго на некоторый промежуток времени, что даст возможность получить более правильную оценку степени тесноты корреляционной связи.
Третьей особенностью корреляции рядов динамики является возможность переменной корреляции. Переменной корреляцией называют изменение показателей тесноты связи (коэффициентов корреляции) в течение времени. Поэтому показатель тесноты связи в динамических рядах можно представить как серию коэффициентов, рассчитанных подобно скользящей средней. За этой серией коэффициентов корреляции, вычисленных в скользящем порядке с исключением одного члена ряда и включением следующего через определенный интервал скольжения (трехлетие, пятилетие и т.д.) можно получить более полные сведения однако как менялась теснота связи во времени. Это дает возможность выявить те предпосылки, которые привели к изменению тесноты связи между отображаемыми в рядах динамики явлениями.
Наконец, четвертой особенностью корреляции в рядах динамики является то, что при их анализе, как правило, есть достаточно ограниченное количество наблюдений, особенно когда изучается изменение какого-либо явления по годам. Кроме того, привлечение к анализу данных за длительный период времени спряжено с несопоставимостью по территории, времени учета, методике исчисления показателей и т.д.
При корреляционному анализе динамических рядов приходится решать две задачи: 1) измерить связь последовательных уровней одного и того же ряда динамики; 2) измерить связь между изменениями признаков двух динамических рядов различного содержания, но связанных между собой. Для решения первой задачи вычисляются коэффициенты автокорреляции и авторегрессии, которые показывают зависимость между последовательными уровнями ряда динамики, для решения второй задачи - коэффициенты корреляции и регрессии.
Коэффициент автокорреляции вычисляется за непосредственными данным рядов динамики, когда фактические уровни одного ряда рассматриваются как значения факторного признака, а уровни этого же ряда сдвигом на один период принимаются за результативный признак.
Коэффициент автокорреляции вычисляется на основе формулы коэффициента корреляции для парной зависимости
Коэффициент корреляции рассчитывается по отклонениям от выровненных значений в обоих рядах динамики, что коррелируются. Как правило, определяют отклонения фактических уровней от тренда, что характеризует основную тенденцию развития каждого ряда динамики.
Коэффициент корреляции определяется по формуле
где сх = xi - х,; су = И - в,-
Как отмечалось выше, корелювання уровней рядов динамики правильно показывает тесноту связи между рядами только в том случае, если в каждом из них отсутствует автокорреляция. Если же по результатам расчетов коэффициентов автокорреляции будет доказано наличие автокорреляции уровней исходных рядов динамики, то не следует непосредственно коррелировать уровни сравниваемых динамических рядов, а предварительно необходимо исключить автокорреляции уровней в динамических рядах.
Есть несколько способов исключения автокорреляции. Один из них связан с корреляцией отклонений фактических уровней от тренда. Суть этого способа заключается в том, что коррелируют не сами уровни, а отклонения фактических уровней от выровненных, что отражают тренд, то есть коррелируют остаточные величины. Исключение трендов позволит ослабить автокорреляции и привести исходные данные к такому виду, который наиболее пригоден для применения классических методов теории корреляции.
При корелюванні отклонений фактических уровней ряда динамики от выровненных необходимо выполнить следующие операции:
1) осуществить аналитическое выравнивание сравниваемых рядов динамики по определенным, характерным для них, аналитическим уравнением;
2) вычислить величину отклонения каждого фактического уровня ряда динамики от соответствующего ему выровненного значения, то есть находят
йх = xi ~х,; у = И ~В,.
3) определить тесноту связи между рассчитанными отклонениями с помощью выше приведенной формулы коэффициента корреляции.
Второй способ исключения автокорреляции базируется на корелюванні последовательных разностей между каждым последующим и предыдущим уровнями, т.е. величин Д = уі ~ уі-1; Д х = xi ~ xi-1 , где А в и А xi - абсолютные приросты (снижения) с переменной базой в рядах динамики показателей в и х.
Формула коэффициента корреляции первых разностей, что используется для определения тесноты связи между исследуемыми рядами динамики имеет вид:
При этом следует иметь в виду, что разность первого порядка исключает автокорреляции в рядах динамики, в которых изменение во времени происходит по прямой линии. Если же изменение уровней рядов динамики происходит за параболой второго порядка, то исключать автокорреляции можно с помощью корелювання вторых разностей (разниц между первыми разностями).
Применение корреляционного анализа в динамических рядах покажем на примере взаимосвязи в динамике урожайности подсолнечника и количества внесенных минеральных удобрений на 1 га подсолнечника (табл. 9.9). Если коррелировать уровни этих двух рядов динамики, принимая урожайность за результативный признак (у), а количество внесенных удобрений - по факторную признак (*), то рассчитанный коэффициент корреляции покажет в котором
Таблица 9.9. Данные для расчета коэффициента корреляции в рядах динамики
степени оба коррелируемых ряда динамики склонны похожем воздействия в течение данного периода времени.
Величина коэффициента корреляции составит
Полученный коэффициент корреляции свидетельствует о наличии достаточно тесной корреляционной зависимости между урожайностью подсолнечника и количеством внесенных минеральных удобрений. Такая сильная теснота связи обусловлена тем, что в двух сравниваемых рядах динамики кратковременные колебания имеют одинаковую тенденцию, следовательно, и тренды отражают одинаковое направление изменений во времени как урожайности, так и количества внесенных удобрений.
В связи с этим перед тем как делать вывод о действительной тесноту связи между исследуемыми признаками, необходимо проверить оба ряда динамики на автокорреляции. Наиболее четко автокорреляция оказывается между уровнями рядов динамики, расположенными рядом. Чтобы оценить степень зависимости между соседними уровнями динамического ряда, вычислим коэффициенты автокорреляции для первого ряда, характеризующего динамику урожайности, и для второго ряда, характеризующего динамику количества внесенных удобрений. Автокорреляция определяется сопоставлением данных, которые относятся к двух смежных лет, то есть величин х(х) и xi+1(в). Для расчета коэффициентов автокорреляции построим две вспомогательные таблицы (табл. 9.10 и 9.11).
Таблица 9.10. Данные для расчета коэффициента автокорреляции по ряду динамики урожайности подсолнечника
Рассчитаем коэффициенты автокорреляции по каждому ряда динамики: а) для урожайности подсолнечника
Таблица 9.11. Данные для расчета коэффициента автокорреляции по ряду динамики внесения удобрений
б) для количества внесенных удобрений
Как свидетельствуют числовые значения коэффициентов корреляции, взаимосвязанных в рядах динамики существует довольно значительная автокорреляция и наш вывод о тесноте связи между уровнями динамических рядов (урожайности и удобрений) перекручивается автокорреляцией. В связи с этим не следует непосредственно коррелировать уровни рядов динамики, а сначала необходимо исключить основную тенденцию изменения уровней и коррелировать уже отклонение от тренда.
С этой целью определим линии трендов, чтобы потом их исключить из анализа. Выравнивание рядов динамики осуществим по уравнению прямой линии
уи = а0 + а1і, где и - порядковый номер года; а0 и а1 - параметры уравнения.
Для выравнивания ряда динамики урожайности составим вспомогательную табл. 9.12.
Таблица 9.12. Данные для расчета линии тренда ряда динамики урожайности
Параметры уравнения а0 и а1 найдем из системы нормальных уравнений:
Поделим первое уравнение на 10, а второе на 55:
[15,48 = а0 + 5,50а1; [17,04 = а0 + 1,00а1. Вычтем из второго уравнения первое
1,56 = 2,00 ах. Отсюда ах = 1,56 : 2,00 = 0,78 ц/га.
Определим а0
154,8 = 10 а0 + 55 o 0,78;
154,8 - 55 o 0,78 111,9
а0 =-=-= 11,19.
0 10 10
Уравнение линейного тренда имеет вид
в = 11,19 + 0,78і.
Коэффициент регрессии а1 = 0,78 ц/га показывает, что в среднем за исследуемый период урожайность ежегодно росла на 0,78 ц/га.
Подставляя в полученное уравнение значения 1(1=1, 2, 10). получим выровненные (расчетные) значения урожайности.
Проведем выравнивание ряда динамики количества внесенных удобрений, для чего составим вспомогательную табл. 9.13.
Таблица 9.13. Данные для расчета линии тренда ряда динамики удобрений
Решив систему уравнений
[ 14,5 = 10а0 + 55^ : 10; [88,4 = 55а0 + 385^ : 55, получим а0 = 1,01; а1 = 0,08 ц действующего вещества. Уравнение линейного тренда имеет вид
в = 1,01 + 0,08.
Коэффициент регрессии а1 = 0,08 ц действующего вещества показывает, что в среднем за исследуемый период дозы внесенных удобрений ежегодно увеличивались на 0,08 ц действующего вещества.
Найденные тренды окажутся выключенными, если будут вычислены отклонения от них фактических данных. Значение фактических данных и выровненных уровней и их отклонения для рядов динамики урожайности и удобрениям представлены в табл. 9.14.
Таблица 9.14. Отклонения от трендов
Расчет коэффициента корреляции выполним за отклонениями фактических уровней от трендов:
Величина рассчитанного коэффициента корреляции наиболее точно характеризует тесноту связи в рядах динамики урожайности и удобрений. Наличие высокой автокорреляции в рядах (г^ = 0,6946 и гху = 0,7547) в определенной степени усиливало высокий уровень коэффициента корреляции (г = 0,8768) в исследуемых рядах динамики.
К аналогичному выводу мы придем, если будем коррелировать разницы между последующим и предыдущим уровнями обоих рядов динамики.
Для оценки существенности выборочного коэффициента автокорреляции используют специальные таблицы с критическими значениями коэффициента автокорреляции при различных уровнях значимости (прил. 10). Фактическое значение коэффициента автокорреляции () сопоставляется с табличным (гатаЛ ) при доверительном уровне вероятности суждения и соответствующей численности выборки. Если фактическое значение будет больше его критического значения, указанного в таблице, то делают вывод о наличии автокорреляции в генеральной совокупности. Если же фактическое значение коэффициента автокорреляции будет меньше его табличного значения, то есть < гатаЛ , то нужно отказаться от гипотезы о наличии автокорреляции в генеральной совокупности.
Проведем оценку достоверности коэффициентов автокорреляции. Для этого сравним их фактические значения с табличным при уровне значимости а = 0,05 и п = 10 (число лет).
За доп. 10 установим, что табличное значение коэффициента автокорреляции составляет г005 = 0,360.
Поскольку %" > г0,05 ( 0,6946 > 0,360; 0,7547 > 0,360), можно сделать вывод о том, что полученные коэффициенты автокорреляции являются достоверными, а исследуемым рядам динамики присуща высокая автокорреляция его уровней в генеральных совокупностях.