Обработка и анализ первичной социологической информации

Обработка собранных данных - важный этап эмпирического исследования. От того, как решен вопрос обработки информации, в значительной степени зависят сроки, стоимость и вообще успех исследования. Ответ на него должен быть найден к тиражированию анкеты, поскольку от программного обеспечения, которое будет использоваться для обработки материала, зависит кодирования анкеты.

К началу сбора информации желательно определиться, какие методы анализа данных будут применяться (построение таблиц определенного вида, факторный анализ и т.п.), а также какие конкретно признаки анализироваться с помощью того или иного метода. Понятно, что такой план может быть только приблизительным, поскольку анализ данных - итерационный процесс, развитие которого происходит в диалоге (непосредственном или заочном) с компьютером. План нужен для того, чтобы подобрать необходимое программное обеспечение, а также как начальный этап анализа.

Собранную информацию обрабатывают вручную или с помощью И компьютера. Ручные методы обработки информации применяются (и теперь довольно редко и в основном в случае, если социолог не имеет возможности работать на компьютере, а надо обработать небольшой по объему (С-50 единиц) массив анкет с незначительной (от 10 до 20) количеством вопросов . Это могут быть, например, данные пилотажного исследования или данные экспертного опроса. При проведении вычислений при ручной обработки данных широко используют калькуляторы.

Для обработки больших массивов, содержащих данные о тысяч Ц объектов, которые описываются несколькими сотнями признаков, следует применять вычислительную технику, имеет достаточный объем памяти и ^ высокую скорость вычислений.

Основные этапы обработки эмпирических данных

В процессе обработки данных социологических исследований можно выделить следующие содержательные этапы:

1) кодирования информации;

2) введение информации в компьютер;

3) проверка введенных данных и корректировки ошибок;

4) проведение вычислений и анализ результатов.

Если предполагается обработка данных на компьютере, следует вместе со специалистом по информатике метод кодирования собранной информации (нумерация вопросов и вариантов ответов в анкете для опроса, нумерация пунктов и вариантов значений в кодирующих листке контент-анализа и др.) Согласовать с возможностями соответствующего программного обеспечения. Есть общепризнанных стандартов на кодирование информации. Например, есть пакеты программ, требующих нумеровать все варианты ответов в анкете последовательными натуральными числами (1, 2, 3 ...), а есть другие, которые настаивают на нумерации вариантов ответов отдельно в пределах каждого вопроса. Таких примеров можно привести очень много. Поэтому выбран без учета возможностей и особенностей программного обеспечения метод кодирования может привести к необходимости после завершения сбора информации проводить большую ручную работу с перекодирования информации перед ввода ее в компьютер. В ряде ситуаций для одной части значении выбирают коды к началу сбора информации, для второй - коды выбирают только после того, как всю информацию собрано (к примеру, открытые вопросы в анкетах для опроса). Эту работу также следует планировать с учетом методов будущей обработки и возможностей программного обеспечения.

После того как информация собрана и закодирована, переходят где ввода данных в компьютер. Эта трудоемкая работа требует много времени. Вводят данные, как правило, не социологи, а операторы. Они должны быстро и без ошибок перенести закодированную информацию с одного носителя (например бумага) на другой (магнитный диск) и не принимать никаких решений по этой информации (например, решать, вводить анкету, не целиком заполнена). Поэтому даже в случае, когда все коды избранные в начале этапа сбора информации, перед тем как передать собранную информацию к вводу, следует внимательно просмотреть все анкеты.

В процессе ввода операторы могут допускать ошибки. Кроме того, ошибки могут быть и в самых анкетах. Так, в ответе на вопрос анкеты "Где вы сейчас работаете?" респондент указал, что он безработный, а на вопрос "Кем вы сейчас работаете?" (на другой странице анкеты) дал ответ - "слесарем". Поэтому или в процессе ввода (что более желательно), или сразу после окончания введения следует проконтролировать введенную информацию и либо скорректировать ошибки (если это ошибки ввода), или отбросить те анкеты, содержащие недостоверные данные. Для этой работы желательно иметь специальные программы, которые на основе требований социологов отбирают те анкеты, этих требований не удовлетворяют. Требования касаются возможных значений кодов для определенных признаков. Например, "Коды признаки 23 должны быть только 1, 2, 3" или "Если признак 23 имеет значение 3, то признаки 24 и 26 имеют иметь значение или 2, или С".

Только после завершения контроля начинается собственно анализ данных - построение таблиц, вычисления статистических показателей, проверка статистических гипотез, построение новых (дополнительных) признаков и др.

Результаты вычислений на компьютере подаются в большинстве случаев в виде напечатанных на бумаге таблиц. Полезным для содержательного анализа данных является представление результатов в виде различного типа графиков (гистограмм, диаграмм, полигонов и т.д.). Графики позволяют наглядно представить связи и зависимости между признаками, делают анализ эффективным.

 
< Пред   СОДЕРЖАНИЕ   След >