Методология статистических группировок

Статистические группировки осуществляют в несколько последовательных этапов: 1) теоретический анализ исследуемого явления или процесса; 2) выбор групирующей признака (признаков); 3) определение количества групп и величины интервала; построение интервального ряда распределения единиц совокупности по исследуемой групувальной признаку (признакам); 4) определение и обоснование системы статистических показателей для выделения и характеристики типичных групп; составление макетов таблиц; 5) вычисление абсолютных, относительных и средних показателей; 6) табличное и графическое оформление результатов группировки; 7) анализ полученных результатов; формулирование выводов и предложений.

Непосредственной построении группировки должен предшествовать глубокий теоретический анализ исследуемого явления или процесса, в котором ведущая роль принадлежит выяснению тенденций и закономерностей развития явления, характера его движущих сил, специфике возникновения в ходе этого развития новых типов и форм явлений. Важная роль в теоретическом анализе отводится также изучению взаимосвязи изучаемого явления с другими явлениями, установлению влияния отдельных факторов на результативные показатели.

Принципиальное значение при построении группировок имеет выбор групирующей признака, определение числа групп и величины интервала. Выбор групирующей признаки, т.е. признаки, на основе которого выделяют разные типы, группы, подгруппы, является одним из важнейших моментов построения группировок.

Выбор групирующей признаки должен быть основан на анализе качественной природы исследуемого явления. Всесторонний теоретико - экономический анализ сущности явления должен быть направлен на то, чтобы в соответствии с целью и задачами исследования положить в основание группировки существенные признаки.

Групувальними признаками могут быть количественные, атрибутивные (качественные), результативные и факторные признаки.

Отобрав групувальну признак (признаки) и построив ранжирований ряд по этому признаку, устанавливают количество групп, на которые будет поделена совокупность, что изучается, и величину интервала.

Количество групп зависит от общей численности единиц совокупности, характера групирующей признаки и вида группировок. Вместе с тем при решении этого вопроса следует придерживаться двух важных условий построения группировок: 1) выделенные группы должны отличаться качественной однородностью; 2) количество единиц в каждой группе должно быть достаточно большим. Это требование вытекает из закона больших чисел.

Определение числа групп и интервалов в группировке прежде всего зависит от того, какой является групувальна признак - атрибутивной или количественной. Если группировка осуществляется по атрибутивной (качественной) признаку (пол, сорт, порода, профессия и т.п.), то выделяют столько групп, сколько имеется градаций признака. Аналогично выделяют группы и при группировке по дискретной количественному признаку, которая изменяется в небольших пределах (количество членов семьи, оценки студентов, количество приплода от одной матки, количество бригад в ООО и т.п.).

Если же группируют по количественному признаку (урожайность, себестоимость и т.д.), изменяется непрерывно и приобретает в определенных пределах любых мелких значений, то группы выделяют путем установления для каждой из них интервалов, указанных верхней и нижней границами величины признака для данной группы.

При установлении числа групп и границ интервалов важно установить за количественными изменениями качественные переходы, чтобы выделить типы, не смешать существенно отличные единицы наблюдения в одной группе. Эта задача решается на основе теоретического анализа исследуемого явления (процесса), сравнение групирующей признаки с ранее оцененными величинами, для которых качественные переходы известны.

Если же заранее характер изменения количественного признака и качественные переходы в нем оценить трудно, то группировка целесообразно проводить в такой последовательности.

1. Построить ранжирований ряд распределения по обоснованно выделенным признаком, в котором все единицы наблюдения располагаются в порядке возрастания или убывания групирующей признаки. Ранжирований ряд показывает интенсивность изменения величины групирующей признаки. Резкое изменение его величины при переходе от одной единицы наблюдения к другой является свидетельством качественных отличий между ними. Анализируя ранжирований ряд, особенно его графическое изображение, можно выделить качественно отличные группы.

2. Построить интервальный вариационный ряд распределения с выделением достаточно большого числа групп, который даст возможность получить представление о составе исследуемой совокупности и характер распределения. При установлении числа групп и величины интервала следует избегать как чрезмерного измельчения совокупности на группы (не окажется свойственная массовым данным закономерность в распределении), так и слишком малого числа групп (объединяются в группу качественно отличные единицы). Интервальный ряд при постепенной (плавной) изменении признака строится обычно с равными интервалами. Если групувальна признак изменяется неравномерно, то интервалы могут быть неравными.

3. Построить промежуточное аналитическая группировка и путем объединения мелких однородных групп перейти к типологического группирования. Аналитическая группировка позволяет на основе анализа его показателей дать качественную оценку выделенным в интервальном ряду группам. Если этот анализ показывает однородность нескольких (двух, трех и т.д.) последовательно расположенных в интервальном ряду групп, то есть основания для их объединения в одну типичную группу.

Для построения интервального вариационного ряда необходимо установить число групп и величину интервала.

Вопрос относительно числа групп и величины интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, особенностей изучаемого явления и др. При этом число групп и величину интервала следует установить такими, которые бы позволили более равномерно распределить единицы совокупности по группам и достичь при этом их представительства, качественной однородности.

При определении числа групп следует принимать во внимание размах вариации признака, т.е. разницу между его максимальным и минимальным значением. Чем больше этот размах, тем, как правило, больше образуется групп. Необходимо также учитывать численность изучаемой совокупности. Целесообразно, чтобы число групп не было слишком большим и малым и чтобы в каждую группу попало достаточно большое число единиц наблюдения.

Число групп приближенно можно определить по формуле Стерджесса

где N - численность совокупности.

На основе этой формулы можно установить число групп для совокупностей, имеющих различную численность:

численность совокупности (N) 25-40 40-60 60-100 100-200 200-500 более 500 число рекомендованных групп (n) 5-6 6-7 7-8 8-9 9-10 10-15

Выведенная на основе теоретических доказательств формула Стерджесса не учитывает особенностей и характера вариации и распределения исследуемого признака. Поэтому механическое ее применение может привести к неправильным выводам.

Определение числа групп по формуле Стерджесса обосновано в тех случаях, когда распределение единиц совокупности по данному признаку приближается к нормальному, применяются равные интервалы в группах и при незначительной вариации признака. В остальных случаях количество групп должно быть определено в выше изложенной последовательности (построение ранжированного ряда, интервального ряда, промежуточного аналитического группирования).

После установления числа групп определяют величину интервала. Интервалом группировки называют разницу между максимальным и минимальным значением признака в каждой группе. Однако эту величину можно определить как разницу между верхними и нижними пределами значений признака в смежных группах. В практике статистических группировок правильное установление величины интервала имеет первостепенное значение для образования качественно однородных групп.

Когда значение групирующей признаки в ранжированому ряда имеет плавный нарастающий характер, величина интервала определяется по формуле:

где хтп и хш1п - максимальное и минимальное значения признака; п - число групп.

Из формулы видно, что величина интервала находится в прямой зависимости от размаха вариации и в обратной от числа групп: чем больше размах вариации, тем больше величина интервала, чем больше число групп, тем меньше величина интервала.

Применение этой формулы правомерно для случаев, когда все значения признака имеют плавный, постепенный характер нарастания, а численность совокупности достаточно велика. Если же небольшая часть совокупности значительно удалена по размеру групирующей признаки от совокупности основного массива, то вместо хтаз всей совокупности необходимо взять хтп основного массива совокупности, а резко отличные единицы выделить в особую группу. Невыполнение этого требования может привести к тому, что подавляющая часть единиц совокупности сконцентрируется в одной - двух группах, в то время, как в остальных групп войдет очень небольшое число единиц или вообще не войдет не одной единицы.

По способу построения интервалы могут быть равными и неравными, открытыми и закрытыми, специализированными. Выбор того или иного вида интервала зависит от характера распределения единиц исследуемой совокупности.

Равных называют интервалы, в которых разности между верхним и нижним пределами одинаковые. Группировки с равными интервалами применяются тогда, когда вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер. Определение величины интервала в случае группировки с применением равных интервалов осуществляется по выше приведенной формуле. Предположим, что площадь хмеля в группе хозяйств колеблется от 10 до 110 га. Необходимо построить группировку по размеру площади, образовав 5 групп с равными интервалами. Величина интервала составит:

Прибавляя к минимальному значению признака (в данном случае 10 га) найдем значение интервала, получаем верхнюю границу первой группы: 10 + 20 = 30 га. Прибавляя далее величину интервала к верхней границы первой группы, получаем верхнюю границу второй группы: 30 + 20 = 50 га и т.д. В результате получим такие группы хозяйств по размеру площади хмеля (га): 10-30; 30-50; 50-70; 70-90; 90-110.

Неровными называют интервалы, в которых разница между верхним и нижним пределами неодинаковы. Неравные интервалы исчисляются в тех случаях, когда исследуемый признак изменяется в широких пределах. Примером неравных интервалов может быть группировка хозяйств по численности крупного рогатого скота (голов): 1-99; 100-299; 300-599; 600-999; 1000-3000 свыше 3000.

Открытым называют интервалы, в которых заранее неизвестны максимальное и минимальное значение. Поэтому при группировке первый и последний интервал остаются открытыми. Например, группировка хозяйств по урожайности овса (ц/ га): 15; 15 - 20; 20 - 25; 25 - 30; более 30.

Закрытым называют интервалы, в которых максимальное и минимальное значения известны. Например, группировка работников по стажу работы (лет): 05; 5-10; 10-15; 15-20; 20-25; 25-30; 30-35; 35-40.

В групуваннях, имеющих целью отразить качественное своеобразие групп, применяются специализированные интервалы. В этом случае в каждой группе есть свой особый смысл и граница интервала устанавливается там, где происходит переход от одного качества к второй. Количество групп устанавливается в соответствии с теорией вопроса. Например, при характеристике откормочных хозяйств по численности поголовья выделяют мелкие, средние и крупные хозяйства; по уровню рентабельности - убыточные, низкорентабельные, средне-рентабельные, высокорентабельные.

При группировке данных по количественному признаку важное значение имеет правильное обозначение нижней и верхней границ каждой группы. Это связано с последующим отнесением отдельных единиц наблюдения в соответствующую группу. Так, если в приведенных выше групп хозяйств по площади хмеля (10-30; 30-50; 50-70; 70-90; 90-110 га) не дать специальных указаний, то возникают трудности при построении и анализе данного группировки. Куда, например, отнести хозяйства с площадью, равной 30 га, в первую или во вторую группу? Для устранения подобной неопределенности нужны дополнительные указания о том, считать верхние пределы групп "включительно" (при построении группировок обычно пользуются этим правилом), то тогда хозяйства с площадью хмеля до 30 га, 50 га и т.д. должны быть отнесены соответственно к первой, второй и т.д. группы. Если же считать верхние пределы "исключительно", то хозяйства с указанными площадями должны быть отнесенными ко второй, третьей и т.д. группы.

Тот же результат достигается и с помощью открытых интервалов в первой и последней группах. Чтобы показать, что хозяйства с площадью хмеля, равной верхней границе интервала, включаются в данную группу, последнюю группу следует обозначить "более 90 га". Наоборот, чтобы показать, что верхние границы интервалов не входят в данную группу, последнюю группу нужно обозначить "90 га и больше".

Часто для предоставления группировкой большей определенности верхнюю границу предыдущей и нижнюю границу следующей группы обозначают по - разному. Если групувальна признак может принимать только целые значения, то нижняя граница следующей группы отличается от верхней границы предыдущей группы на одну целую единицу. Например, группировка тех же хозяйств по площади хмеля может быть выполнено за такими интервалами (га): 10 - 30; 31 - 50; 51 - 70; 71 - 90; 91 -110. Аналогично строятся интервалы с десятыми и сотыми частями единиц. Например, интервалы хозяйств по себестоимости 1 ц зерна могут иметь вид (грн.): до 34,00; 34,01 - 35,00; 35,01 - 36,00 и т.д.

 
< Пред   СОДЕРЖАНИЕ   След >