Анализ одного признака

Первичные данные должны быть определенным образом упорядочены. Для этого применяют различные статистические методы - группировка, вычисления обобщающих параметров и коэффициентов, корреляционный, регрессионный, кластерный, факторный анализ. Однако независимо от того, какой метод анализа применяется, первым и абсолютно необходимым шагом обработки данных является предварительное упорядочение информации, преимущественно с помощью статистического группировки и построения статистических таблиц.

Структура ответов на вопросы анкеты приводится в таблице, где для каждого из возможных значений признака записано, сколько раз оно встречается в совокупности собранных данных. Такую таблицу называют таблицей одномерного распределения, одномерным таблицей, или вариационным рядом. Пакет ОСА позволяет за считанные секунды построить один или несколько (даже несколько десятков или несколько сотен) одномерных распределений. Результаты вычислений могут быть выведены на экран компьютера (для непосредственного анализа на экране), на печатающее устройство или в файл на диске.

Для признака "Удовлетворенность условиями труда" одномерная таблица выглядит следующим образом:

Удовлетворенность условиями труда *

Значение Частота % Ко всем % К значениям
Вполне доволен 45 12,61 12,93
Более доволен, чем недоволен 88 24,65 25,29
Больше не доволен, чем доволен 105 29,41 30,17
Полностью не удовлетворен 110 30,81 31,61
Без ответа 9 2,52 -

* Было опрошено 357 человек, ответили на вопрос "Довольны ли Вы условиями труда на Вашем предприятии" 348 человек (97,48%).

Количество опрошенных в исследуемой совокупности - 357. Для 348 опрошенных (что составляет 97,48% от общего объема совокупности) известно значение признака "Удовлетворенность условиями труда". Для других (в нашем случае их 9) значение этого признака неизвестно (например, информация собиралась методом опроса, и некоторые работники предприятия не захотели ответить на поставленный вопрос). Анализируя таблицу, мы видим, например, что довольных условиями труда - 45, а это составляет 12,61% от общего объема совокупности и 12,93% количества рабочих, ответивших на поставленный вопрос. Мы видим также, что подавляющее большинство опрошенных работников (29,41% + 30,81% - 60,22%) полностью или частично не удовлетворены условиями труда.

Для признаков, заданных в метрических шкалах, пакет позволяет все значения признака разбить на определенные интервалы, а уже потом строить одномерную таблицу.

Для того чтобы облегчить анализ большого количества таблиц и иметь возможность сравнить несколько таблиц, вычисляют обобщающие характеристики рядов распределения. Одна из таких характеристик (ее используют очень часто) - меры центральной тенденции. Для количественного признака вычисляют среднее арифметическое значение этого признака для всех объектов совокупности. Для номинальных признаков обобщающей характеристикой ряда является мода - значение, наиболее часто встречается в одномерной таблицы. Так, в приведенной выше таблице модальным для признака "Удовлетворенность условиями труда" имеет значение "полностью не удовлетворен" (именно таких ответов на поставленный вопрос был всего). Для признаков, измеряемых в порядковых шкалах, часто вычисляют такую меру центральной тенденции, как медиана - средний ряд упорядоченного ряда значений. Медиана имеет простую и одновременно полезное свойство - по крайней мере половина всех исследуемых объектов имеет значение признака, не больше, чем медиана, и одновременно по крайней мере половина объектов - значение, не менее, чем медиана.

Следует заметить, если упорядочить шкалы по уровню измерения (самый высокий уровень - это метрические шкалы, затем - порядковые шкалы, далее - номинальные шкалы), то можно сформулировать следующее общее правило: если определенный показатель определен для шкалы определенного уровня измерения, то его можно вычислять и для шкал более высокого уровня, но, конечно, нельзя вычислять для шкал низшего уровня.

Итак, применив это правило для рассмотренных нами мер центральной тенденции, можно легко убедиться, что моду можно вычислять не только для номинальных шкал, но и для порядковых и метрических шкал, но медиану нельзя вычислять для признаков, измеренных в номинальной шкале.

Для того чтобы оценить весь ряд распределения, вычисляют статистические показатели вариации признаков, или меры вариации. Для метрических признаков это - дисперсия, среднее квадратическое отклонение и коэффициент вариации. Для качественных признаков разработаны специальные индексы качественной вариации. Чем больше значение соответствующего показателя вариации, тем более рассеяны вокруг среднего значения реальные значения признака, а следовательно, тем осторожнее при построении содержательных выводов следует оперировать со средним значением.

Меры вариации позволяют оценить, насколько совокупность однородна по определенному признаку. Если она неоднородна, может потребоваться разбить эту совокупность на несколько однородных по этому признаку частей и анализировать каждую из них в отдельности. Допустим, мы изучаем удовлетворенность условиями труда. С логических рассуждений или по результатам предыдущих исследований нам известно, что заработная плата рабочего влияет на удовлетворенность его условиями труда. Пусть коэффициент вариации заработной платы для всей совокупности рабочих равен 0,7. Тогда всю совокупность рабочих следует разбить на две примерно равные по уровню заработной платы группы (например, так, чтобы в каждой группе коэффициент вариации заработной платы не превышал 0,4) и проводить анализ удовлетворенности условиями труда для каждой группы отдельно.

 
< Пред   СОДЕРЖАНИЕ   След >