ВАРИАЦИОННЫЙ АНАЛИЗ
Формулировка задания: провести вариационный анализ статистической совокупности по показателю, для чего:
1) построить вариационный ряд и изобразить его графически;
2) построить кумуляту и огиву (в одной системе координат);
3) рассчитать показатели структуры, силы и интенсивности вариации;
4) сделать выводы относительно исследуемой совокупности.
Решение:
1) Первый этап вариационного анализа - построение вариационного ряда. Это упорядоченное распределение единиц совокупности по возрастающим (убывающим) значения признака. На этом этапе важно правильно определить, ряд какого вида целесообразно построить. Т.к. изучаемый признак - номинальная начисленная заработная плата - относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала.
Воспользуемся формулой Стержесса:
К = 1+3,32lg80 = 7,32
В качестве длины интервала выбирается целочисленное и удобное для восприятия значение в интервале от l1 до l2 .

;

В нашем случае l1 = 3594,67 и l2 = 3145,34. Таким образом, вариационный интервальный ряд по формуле Стержесса должен состоять из 7 интервалов длиной l=3500.Но в нашем случае за длину интервала для наглядности необходимо принять 4000 руб. (Таблица 2.1).
Таблица 2.1 - Вариационный ряд
Среднемесячная начисленная заработная плата, руб. |
Количество регионов |
5 000-9 000 |
23 |
9 000-13 000 |
36 |
13 000-17 000 |
11 |
17 000-21 000 |
4 |
21 000-25 000 |
4 |
25 000-29 000 |
1 |
29 000-33 000 |
1 |
Графически интервальный вариационный ряд изображается гистограммой (рисунок 2.1):

Рисунок 2.1 Графическое отображение вариационного ряда
Из графического изображения вариационного ряда видно, что по субъектам Российской Федерации на 2007 год большая доля субъектов имеет уровень среднемесячной заработной платы от 9000 рублей до 13000 рублей (36 субъектов из 80, что составляет 45%).
2) Огива (распределение "больше чем") и кумулята (распределение "меньше чем") строятся по накопленным частотам. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают значения признака, который меньше или равен рассматриваемому значению. Расчет накопленных частот для огивы и кумуляты представлены в Таблице 2.2 и Таблице 2.3
Таблица 2.2 - Координаты точек пересечения для кумуляты
Граница интервала |
кол-во регионов |
накопленные частоты (кумулята) |
5000-9000 |
23 |
23 |
9000-13000 |
36 |
59 |
13000-17000 |
11 |
70 |
17000-21000 |
4 |
74 |
21000-25000 |
4 |
78 |
25000-29000 |
1 |
79 |
29000-33000 |
1 |
80 |
Таблица 2.3 - Координаты точек пересечения для огивы
Граница интервала |
кол-во регионов |
накопленные частоты (огива) |
5000-9000 |
23 |
80 |
9000-13000 |
36 |
57 |
13000-17000 |
11 |
21 |
17000-21000 |
4 |
10 |
21000-25000 |
4 |
6 |
25000-29000 |
1 |
2 |
29000-33000 |
1 |
1 |
Графическое изображение кумуляты и огивы выглядит следующим образом (Рисунок 2.2 и рисунок 2.3).

Рисунок 2.2 - Графическое изображение кумуляты

Рисунок 2.3 - Графическое изображение огивы
3) К показателям структуры относятся мода и медиана.
Мода - наиболее часто встречающееся значение признака.
Модальный интервал - это интервал с наибольшей частотой появления признака. В данном случае модальный интервал: от 9000 рублей до 13000 рублей.

Мо = ;
В данной совокупности большинство регионов имеют уровень безработицы близкий к 10368,4 рублей.
Медиана - значение признака, делящее совокупность на две равные части.
Медианный интервал - это интервал, в котором накопленная частота появления признака превышает половину объема совокупности.
В данном случае медианный интервал: от 9000 рублей до 13000 рублей (в данном интервале накопленная частота 59 превышает половину объема совокупности, который равен 40).

Ме = ;
Это означает, что половина регионов РФ имеют уровень среднемесячной зарплаты ниже 11956,5 рублей, а половина - выше.
Значение медианы и моды должны попадать в медианный интервал.
Мо = 10368,4 рублей; Ме = 11456,5 рублей - эти значения попадают в медианный интервал: от 9000 рублей до 13000 рублей.
Среднее значение по формуле средней взвешенной равно 11850 рублей (приложение Б).
К показателям силы вариации относятся среднее линейное отклонение (), среднее квадратическое отклонение () и дисперсия ().

;
В среднем по совокупности значения признака у отдельных единиц отклоняется от среднего значения примерно на 3553,75 рублей, что является довольно значительной цифрой.

;
СКО (корень из дисперсии) показывает, на сколько в среднем фактические значения показателя отклоняются от своего среднего значения (является более точным, чем среднее линейное отклонение). Соотношение СКО к среднему линейному отклонению зависит от наличия в совокупности резких отклонений (чем больше соотношение, тем более неоднородна совокупность). Для нормального распределения ?/d ? 1,25. В нашем же случае эта величина равна 1,40 - то есть наше распределение нельзя считать близким к нормальному. Квадрат среднего квадратического отклонения дает величину дисперсии, которая является мерой рассеивания значений признака по всем единицам совокупности под влиянием всех факторов. Чем меньше ее значение, тем лучше, тем меньше значения признака совокупности отклоняются от своего среднего значения. Полученное значение дисперсии велико, что говорит о сильном разбросе значений признака от среднего.
К показателям интенсивности относятся относительный размах вариации (), относительное линейное отклонение () и коэффициент вариации ().

;
;


.
Они используются для сравнения наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Совокупность можно считать однородной, если коэффициент вариации не превышает 33 %. Значение коэффициента вариации, равное 42%, говорит о неоднородности совокупности (относительное среднее линейное отклонение имеет тот же смысл, но является менее точным показателем: в нашем случае этот коэффициент равен 30%). Относительный размах вариации для нашей совокупности составил 212%. Это говорит о сильном разбросе значений показателя от средней величины.
Таблица 2.4 - Показатели вариации
Показатель |
Значение, рублей |
Размах вариации |
25162,70 |
Мода |
10 368,40 |
Медиана |
11 456,50 |
Среднее линейное отклонение |
3 553,75 |
Среднее квадратическое отклонение |
4 967,65 |
Дисперсия |
24 677 500,00 |
Относительный размах вариации |
2,12 |
Относительное линейное отклонение |
0,30 |
Коэффициент вариации |
0,42 |