Графическое изображение данных

Очень полезным для содержательного анализа является изображение данных в графической форме. Графики и диаграммы в некоторых случаях воспринимаются читателем легче, чем столбцы статистических таблиц. Удобно использовать графическое изображение данных и во время публичных выступлений - на телевидении, конференциях.

Наиболее распространенными формами графического изображения одномерных распределений является гистограмма (или столбиковая диаграмма), полигон распределения и секторная диаграмма.

Гистограмма - это последовательность колонок, размещенных вертикально (вертикальная гистограмма) или горизонтально (горизонтальная гистограмма). Каждый столбик имеет высоту (или длину), пропорциональную количеству (или части, или процентов) объектов, имеющих соответствующее значение признака. Так, на рис. 1 изображен горизонтальную гистограмму распределения ответов на вопрос об удовлетворенности

Признак 5. Удовлетворенность собственным положением. Вопрос: Довольны ли Вы своим положением?

Количество объектов 431. Есть значений 430 (99,7%).

Рис. 1. Горизонтальная гистограмма изображения ответов

собственным положением. Для каждого столбика гистограммы указано соответствующую частоту и процент. Итак, конфигурация колонок гистограммы дает представление о тенденции, а числа необходимы для более детального анализа. Как правило, при построении гистограмм используют равные промежутки, а следовательно, столбики имеют одинаковую ширину. Масштаб изображения лучше выбирать так, чтобы отношение высоты наибольшего колонки к ширине гистограммы было примерно 3: 5. Достаточно часто гистограмму изображают не в виде отдельных колонок, а как сплошной контур.

В процессе анализа достаточно часто возникает необходимость разбить метрические признаки на неравные интервалы. Именно на неравные интервалы разбивают, как правило, такие признаки, как прибыль, возраст и др. Это связано с тем, что диапазон значений признака может быть весьма существенным, а также с необходимостью выделить определенным образом наполнены интервалы. При построении гистограмм на неровных интервалах высоту столбика откладывают пропорционально не до доли (процента), а к плотности распределения соответствующего признака. В построенной таким образом гистограмме является не высота, а площадь каждого из столбиков пропорциональна количеству (или доли или процента) объектов, имеющих соответствующее значение признака. Так, на рис. 2 изображена вертикальную гистограмму возрастного состава опрошенных респондентов. Сравнивать "наполненность" возрастных групп следует путем сравнение не высоты столбиков, а их площади * Конечно, всегда следует помнить: при построении гистограммы предполагается, что внутри одного разрядного интервала плотность распределения является постоянной величиной (не изменяется).

Признак 177. Возраст (сгруппирован).

Количество объектов 431. Есть значений 399 (92,7%).

Рис. 2. Вертикальная гистограмма возрастного состава опрошенных респондентов

Если центры верхних горизонтальных линий столбиков гистограммы соединить отрезками прямой, то получится фигура, которую называют "полигон распределения". На рис. С изображено полигон распределения респондентов по возрасту (аналогичный гистограмме на рис. 2). Полигон дает представление о форме статистического распределения признака.

Для иллюстрации достаточно часто применяют такую форму представления данных, как секторная диаграмма. На рис. 4 изображена секторную диаграмму распределения респондентов по возрасту (аналогичная гистограмме на рис. 2). Выборка представлена в виде круга. Каждой возрастной группе (а их 4) соответствует выделенный определенным цветом сектор круга, при этом площадь каждого сектора пропорциональна количеству респондентов (или части, или процента) в соответствующей возрастной группе.

Признак 177. Возраст (сгруппирован).

Количество объектов 431. Есть значений 399 (92,7%).

Рис. 3. Полигон распределения респондентов по возрасту

Признак 177. Возраст (сгруппирован).

Количество объектов 431. Есть значений 399 (92,7%).

Сравнивать несколько распределений удобно, если разместить полигоны этих распределений, построенных в одинаковом масштабе на одном рисунке. При этом каждый из полигонов изображается или другим цветом, или другой линией (штрихованной, волнистой и т.д.). Такое сочетание на одном рисунке нескольких графиков позволяет эффективно и быстро сравнивать между собой распределения, имеет целью выделения участков, которые совпадают, тенденций изменения признаков.

Кроме помощи в анализе данных, графики чрезвычайно эффективны ввиду представления результатов исследований. ? графики рабочие и иллюстративные. Первые, как правило, достаточно насыщенные числами, вторые - более яркие и "внешне привлекательны". Почти все компьютерные пакеты программ анализа данных производят определенные рабочие графики. Для подготовки иллюстративных графиков есть специализированные пакеты программ - "пакеты иллюстративной графики". Эти программные комплексы не предназначены для исчисления и анализа данных, но позволяют вычисленные средствами других пакетов показатели изобразить в различных графических формах, включая трехмерные конфигурации с затенением. При этом надписи можно делать разными шрифтами (горизонтально, вертикально, вдоль любой линии, используя различные цвета). Графики можно дополнять рисунками или "привязывать" их по географическому карты. Результаты такого построения могут быть выведены на высококачественные печатающие устройства, в файл для дальнейшего использования в издательских системах, на прозрачную пленку в виде цветных слайдов или просто демонстрироваться в определенной последовательности на экране компьютера во время доклада.

 
< Пред   СОДЕРЖАНИЕ   След >