Ряды распределения

Особым видом группировок в статистике есть ряды распределения, которые являются самым простым способом упорядочения и обобщения статистических данных. Группировка, в котором выделенные группы характеризуются только их численностью или удельным весом в общем объеме совокупности, называют статистическим рядом распределения (например, распределение хозяйств района по урожайности, продуктивности животных, рабочих по тарифному разряду и др.).

Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по групувальной признаку. Они характеризуют структуру (состав) изучаемого явления, позволяют судить об однородности совокупности, о варьирования изучаемого признака.

Ряды распределения состоят из двух элементов: наименование группы с соответствующими значениями исследуемого признака и численности единиц, вошедших в каждую группу. В этом их отличие от статистических группировок, при построении которых каждая группа характеризуется системой связанных и взаимосвязанных между собой показателей.

самым Простым видом статистических рядов распределения является ранжирований ряд, в котором значения исследуемого признака расположены в порядке возрастания или убывания. Однако ранжирований ряд еще не дает общей картины распределения, так как не видно, какая закономерность заложена в распределении, вокруг которой величины концентрируются варианты. Поэтому возникает необходимость дальнейшего обобщения статистических данных, объединение их в отдельные группы и подсчета частот для каждой группы. В результате осуществления этой операции получим вариационный ряд распределения.

Ряды распределения, образованные по качественным признаком называют атрибутивными. Примером таких рядов могут быть распределения населения по полу (табл. 3.2), образованием, животных за породой, растений по сорту и т.д.

Разновидностью атрибутивных рядов распределения есть альтернативные ряды. Альтернативными называют ряды качественных признаков, которые принимают только два значения, которые исключают друг друга: да или нет. Примером таких рядов может быть распределение хозяйств района на прибыльные и убыточные, или такие, что выполнили и не выполнили план производства продукции и т.д.

Ряды распределения, построенные по количественным признакам, называют варіаційними. Вариационный ряд распределения представляет собой упорядоченную статическую совокупность, в которой значение расположенные в ранжирований ряд с указанием для каждого интервала (группы) соответствующих частот (частостей).

Вариационные ряды распределения состоят из двух элементов: вариант и частот. в Варианта - это отдельное значение признака, которое он принимает в ряду распределения. в Частота называют численности отдельных вариант или каждой группы вариационного ряда. Частоты могут быть выражены как в абсолютных величинах, то есть числом любых единиц, так и в относительных величинах в виде долей и процентов в итоге. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот вариационного ряда называют его объему. Сумма частот равна единице, если они выражены в долях единицы, и 100%, если выраженные в процентах. В математической статистике для определения некоторых характеристик (например, медианы) рассчитывают накопленные частоты - сумма частот (частостей) вариантов от минимального значения до данного значения. Накопленные частоты определяются путем последовательного добавления к частот (частостей) первой группы частот последующих групп ряда распределения (см. табл. 3.10).

Вариационные ряды распределения подразделяются на дискретные (перервні) и интервальные (непрерывные).

Дискретные - это такие вариационные ряды распределения, в которых варианты принимают значения только целых чисел. Примером дискретного ряда распределения может быть распределение хозяйств района по количеству свеклоуборочных комбайнов (табл. 3.9).

Таблица 3.9. Распределение хозяйств района по количеству свеклоуборочных комбайнов

Количество комбайнов в хозяйстве, шт.

Количество хозяйств

В % к итогу

2

3

11,5

3

4

15,4

4

5

19,2

5

6

23,1

6

5

19,2

7

3

11,6

Вместе

26

100,0

Интервальными называют ряды распределения, в которых варианты даны в виде интервалов. Пример интервального ряда распределения приведен в табл. 3.10, где приводится распределение 100 хозяйств по надою молока на корову.

В приведенном примере вариантами значение надоя на корову, а частотами - численность хозяйств.

При построении рядов распределения возникают вопросы относительно числа групп, величины интервала, его пределы. Методология построения рядов распределения Основывается на изложенной выше методологии построения статистических группировок.

Если вариационный ряд распределения имеет группы с неравными интервалами, то частоты в отдельных интервалах непосредственно несопоставимы, так как зависят от ширины интервала. Для того чтобы частоты можно было сравнивать, вычисляют плотность распределения и относительную плотность распределения. Первая характеристика определяется отношением частоты до величины интервала, вторая - отношением частоты до величины интервала.

Таблица 3.10. Интервальный вариационный ряд распределения 100 хозяйств по надою молока на корову

Номер группы

Границы интервалов

Количество

Удельный вес

Накопленные частоты

по надою молока на корову, ц

хозяйств (частота)

в % к итогу

в долях (частота)

I

26 - 28

8

8,0

0,080

8

II

28 - 30

16

16,0

0,160

24(8+16)

III

30 - 32

17

17,0

0,170

41(24+17)

IV

32 - 34

25

25,0

0,250

66(41+25)

V

34 - 36

18

18,0

0,180

84(66+18)

VI

36 - 38

11

11,0

0,110

95(84+11)

VII

38 - 40

5

5,0

0,050

100(95+5)

Вместе

X

100

100,0

1,000

-

Для наглядности и облегчения анализа рядов распределения их изображают графически в виде: огіви, полигона, гистограммы и кумуляти.

Графическое изображение вариационного ряда распределения называют кривой распределения.

Статистическая совокупность, представленная в виде ранжированного ряда, графически изображается в виде огіви. Огіва строится так: на вот абсцисс наносят номера элементов совокупности по ранжиру, а на оси ординат откладываются значения признака (вариант). Огіва наглядно показывает изменение изучаемого признака.

Последовательность построения огіви покажем на таком примере ранжированного ряда урожайности хмеля в 18 хозяйствах района (ц/ га):

Огіва распределения хозяйств по урожайности хмеля

Рис. 3.1. Огіва распределения хозяйств по урожайности хмеля

В виде полигона (многоугольника распределения) обычно изображают дискретные вариационные ряды распределения. При этом на оси абсцисс откладываются значения вариант, а на оси ординат - частота или частость. По данным табл. 3.9 построим полигон распределения хозяйств района по численности свеклоуборочных комбайнов (рис. 3.2).

Полигон распределения хозяйств района по численности свеклоуборочных комбайнов

Рис. 3.2. Полигон распределения хозяйств района по численности свеклоуборочных комбайнов

Для изображения интервальных вариационных рядов распределения применяется гистограмма, которая представляет собой фигуру в виде прямоугольников, примыкающих друг к другу. Порядок построения гистограммы такой: на оси абсцисс откладывают интервалы вариантов, а на оси ординат - частоты (частости).

Над осью абсцисс строятся прямоугольники, площадь которых соответствует величинам произведений интервалов на их частоты. Ширина столбцов при равных интервалах одинакова, при неравных - неодинакова. Если середины верхних сторон прямоугольников (середины интервалов) соединить, то получим полигон распределения.

По данным табл. 3.10 построим гистограмму распределения 100 хозяйств по надою молока на корову (рис. 3.3).

При изображены интервальных рядов распределения с неравными интервалами гистограмму строят не за частотами (частостями) интервалов, а по показателям плотности распределения. При построении гистограммы по абсолютной плотностью распределения общая ее площадь равна численности совокупности. При построении графика относительной плотности площадь гистограммы равна единице.

При решении некоторых задач удобнее пользоваться накопленными частотами. При этом значения численностей отдельных вариант заменяется накопленными частотами, которые получают подведением итогов частоты данной варианты с предварительным частотами.

Гистограмма распределения хозяйств по надою молока на корову

Рис. 3.3. Гистограмма распределения хозяйств по надою молока на корову

Вариационный ряд с накопленными частотами на графике изображается в виде кривой, которая получила название кумуляти распределения.

Для построения кумуляти сначала подсчитывают накопленные частоты, последовательно суммируя их (см. графу 6 табл. 3.10). Если распределение имеет дискретный (прерывный) характер, то на графике на оси абсцисс откладывают значения вариант, а на оси ординат - накопленные частоты (частости). Если распределение имеет непрерывный характер и даны в виде интервального ряда распределения, то строят точки абсциссы которых есть правые (верхние) границы интервалов, а ординаты - соответствующие им накопленные частоты (частости).

По данным табл. 3.10 построим кумулятивную кривую распределения 100 хозяйств по надоям молока на корову (рис. 3.4).

Кумулята связана с огівою таким образом: если лист бумаги, на котором изображена кумулята повернуть на 900 и посмотреть на него с противоположной стороны на свет, то можно увидеть огіву.

Кумулята распределения 100 хозяйств по надою молока на корову

Рис. 3.4. Кумулята распределения 100 хозяйств по надою молока на корову

Построив полигон или гистограмму, можно получить первое представление о форме распределения, под которой понимают форму его графика в границы (в математическом смысле), то есть форму кривой распределения.

Различают прежде всего одновершинні (одномодальні) и багатовершинні (багатомодальні) распределения. К одновершинних относят кривые, которые имеют один максимум частот. Одновершинний распределение может быть гостровершинним и плосковершинним. Для багатовершинних распределений характерно наличие нескольких максимумов и минимумов частот, что переміжаються между собой. Багатовершинність распределения, как правило, является признаком неоднородности исследуемой совокупности, указывает на наличие дифференциации (расслоения) совокупности, а чаще всего является следствием смешения качественно отличных совокупностей. В этом случае исследуемую совокупность необходимо расчленить на отдельные однородные совокупности и изучать их отдельно.

Среди многообразия форм одновершинних распределений, наиболее часто встречающихся на практике, можно выделить следующие характерные распределения: симметричные, помірноасиметричні, крайньоасиметричні (И подобные), вогнутые (и подобные) и др.

Симметричным называют такое распределение, в котором частоты вариант по мере удаления от некоего центра рассеяния уменьшаются, оставаясь равными между собой по обе стороны к концам распределения. Кривые таких распределений симметричные относительно ординаты, установленной в точке, которая соответствует математическому сподіванню.

Симметричное распределение может быть гостровершинним и плосковершинним. Для гостровершинних распределений единицы совокупности сосредотачиваются возле центральной варианты, для плосковершинних - наоборот роззосереджуються.

Кривые распределения, построенные на основе фактических данных, конечно редко бывают идеально симметричными, хотя эта форма распределения присуща многим явлениям. Эмпирические распределения, как правило, асимметричны (скошенными). Такие помірноасиметричні распределения на практике встречаются чаще. Помірноасиметричними (скошенными) называют такие распределения, в которых частоты по одну сторону от центра рассеяния уменьшаются заметно быстрее, чем по второй, вследствие чего ординаты равноудаленных от центра значений признаки неодинаковы.

При этом, если более длинная ветвь кривой приходится на большие значения признака, лежащие на правой стороне графика, то такую асимметрию называют правосторонней или положительной. В противном случае асимметрия считается левосторонней или отрицательной.

Асимметричное распределение в границы становится крайньоасиметричним.

Крайньоасиметричними (И подобными) называют такие распределения, в которых наибольшая частота расположена на одном из концов распределения. Такие распределения по формуле напоминают И поэтому называются И - подобными.

Иногда встречаются распределения, которые имеют кривую угнутої формы, напоминающей латинскую букву ы, такие распределения называют и - подібними. ы - подобные распределения характерны тем, что минимальная частота находится обычно вблизи центра рассеивания, а по мере удаления от нее к концам распределения частоты растут. Такие распределения на практике встречаются редко.

Встречаются й - подобные распределения.

Все изложенные выше формы статистических распределений представлены в виде следующей схемы (рис. 3.5).

Изображение вариационных рядов распределения в табличной и графической формах дает возможность получить первое представление о наиболее общие характерные свойства исследуемого распределения.

Всесторонняя характеристика рядов распределения предполагает выяснение условий, в которых сформировался исследуемый распределение, выражение его основных особенностей числовыми характеристиками.

Графики форм статистических распределений

Рис. 3.5. Графики форм статистических распределений

Комплексное описание статистических распределений заключается в нахождении прежде всего важнейших обобщающих характеристик: средней величины, степени вариации признака, скошенности, островершинности распределения. Для их определения используются соответствующие количественные характеристики. О них речь будет идти в последующих главах учебника (см. разд. 4 и 5).

 
< Пред   СОДЕРЖАНИЕ   След >