Неопределенные распределения
Неопределенные распределения применяют к эмпирическим данным, свойства которых измерены с интервальными или относительными шкалами и принимают только определенные, как правило, дискретные в узком диапазоне значения. Процедуры расчета несгруппированных распределений проще за расчеты распределений сгруппированных.
Пример 2.2. Рассчитать дифференциальные и интегральные распределения вы-
7 Дж. Гласс и Дж. Стенде называют их делениями "сгруппированных" и "несгруппированных" частот [17]; Г.Ф. Лакин - делениями "неинтервальних и интервальных" вариант [43]; А.Т. Опря разделяет деления на "дискретные" и "интервальные" ряды [48].
на них студентами задач по данным табл. 2.1 (объем выборки п = 10). Последовательность решения:
o характер эмпирических данных соответствует условиям для расчета незгрупова ных распределений, поскольку диапазон вариант х и переменной X содержит всего 6 дискретных значений вариант {0, 1, 2, 3, 4, 5};
o значение вариант колеблются от 0 выполненных задач (минимальное) до 5 выполненных задач (максимальное), количество вариант к = 6;
o дифференциальные абсолютные частоты м и (см. табл. 2.2) таковы:
- Для х 1 = 0 частота м 1 = 0 (нет ни одного объекта с этим значением переменной)
- Для х 2 = 1 частота м 2 = 1 (один объект с этим значением переменной)
- Для х 3 = 2 частота м 3 = 1 (один объект с этим значением переменной)
- Для х 4 = 3 частота м 4 = 2 (два объекта с этим значением переменной) и т.д. Сумма всех абсолютных частот должна равняться объему выборки:
к к
£ м и = п, то есть X М и = м 1 + м 2 + ... + м к = 0 + 1 + 1 + 2 + 5 + 1 = 10.
i = 1 i = 1
Таблица 2.2
Распределения количества выполненных задач
o дифференциальные относительные частоты / = м и / п (см. табл. 2.2) таковы:
- Для х 1 = 0 частота м 1 = м 1 / п = 0/10 = 0,00 (или 0%);
- Для х 2 = 1 частота м 2 = м 2 / п = 1/10 = 0,10 (или 10%);
- Для х с = 2 частота т с = т с / п = 1/10 = 0,10 (или 10%);
- Для х 4 = 3 частота т 4 = т 4 / п = 2/10 = 0,20 (или 20%) и т.д.
Сумма всех относительных частот должен быть равен единице (или 100%):
к к
£ / и т и / п = 0,00 + 0,10 + 0,10 + 0,20 + 0,50 + 0,10 = 1,00.
¿= 1 ¿= 1
и
o интегральные абсолютные частоты ^ т и (см. табл. 2.2):
; = 1
1
- Для х 1 = 0 частота £ т и = т 1 = 0;
; = 1
2
- Для х 2 = 1 частота £ т и = т 1 + т 2 = 0 + 1 = 1;
; = 1
с
- Для х с = 2 частота X те = т1 + т г + тс = 0 + 1 + 1 = 2;
и = 1 апреля
- Для х 4 = 3 частота Xти = т + т2 + тс + т4 = 0 + 1 + 1 + 2 = 4 и Т. Д.
¿= 1
Последняя интегральная абсолютная частота равна объема выборки: В т и = т 1 + т 2 + т 3 + т 4 + т 5 + т 6 = 0 + 1 + 1 + 2 + 5 + 1 = 10.
и
o интегральные относительные частоты Г и = ^ / и (см. табл. 2.2) таковы:
¿= 1
- Для х 1 = 0 частота ^ 1 = ^ / i = / 1 = 0;
2
- Для х2 = 1 частота Р 2 = £ / i = / 1 + / 2 = 0 + 0,10 = 0,10;
- Для хз = 2 частота ^ = £ / = / 1 + / 2 + / с = 0 + 0,10 + 0,10 = 0,20;
- Для х4 = с частота ^ = £ / = / + / 2 + / + / = 0 + 0,10 + 0,10 + 0,20 = 0,40 и т.д.
i = 1
Последняя интегральная относительная частота равна единице (или 100%), поскольку сумма всех дифференциальных относительных частот составляет 1,00 или 100%:
^ = Э / = / 1 + / 2 + oo ■ + / 6 = 0 + 0, ю + oo ■ + 0, ю = 1, 00 = 1 ° 0%.
¡= 1
Для визуализации результатов используют графики, например, относительных дифференциальных и интегральных распределений рис. 2.3.
Распределения относительных частот (дифференциальные и интегральные) имеют преимущество перед распределениям абсолютных частот, поскольку их относительные значения приведены к 100% и не зависят от объема конкретной выборки.
Статистические распределения могут быть представлены в виде аналитической эмпирической функции. Так, например 2.2 функции дифференциального и интегрального распределения показано на рис. 2.4 и 2.5.
Важно осознать такие основные свойства функций / и 7 ^:
- Дифференциальная функция / (X = х и) показывает значение частоты / для переменной X, равна значению х - (то есть X = х и)
- Интегральная функция F (X <х и) показывает значение частоты F для переменной X, не превышает значения х - (X <х и тобтоX или меньше или равна х,)
- Обе эмпирические функции являются дискретными и связаны между собой соотношением F j = ^ f и;
1 = 1
- F t (X <x t) принято называть функцией распределения, aj (X = х и) - функцией плотностью распределения.
Пример 2.3. Рассчитать статистические распределения по выборочным эмпирическими данными таблицы рис. 2.4. Последовательность решения:
o в ячейках В6 и В7 определить минимальное и максимальное значение варианты х - с помощью функций MS Excel = МИН (Л2: Е5) и = MAKC (A2: E5)
o характер данных соответствует условиям расчета несгруппированных распределений, поскольку диапазон переменной содержит всего 7 дискретных значений {0, 1, 2, 3, 4, 5, 6};
o внести в ячейки Л12: А18 значение вариант х - от 0 до 6 (рис. 2.4);
o выделить диапазон В12: В18, нажать клавишу F2 и с помощью "Мастера функций" внести в эти ячейки функцию MS Excel = ЧАСТОТА ();
o задать аргументы функции = ЧАСТОТА () в диалоговом окне (рис. 2.5);
o нажать вместе клавиши ЕТЯЬ + 8ИИРТ + ЕКТЕЯ и получить в ячейках В12: В18 значение абсолютных дифференциальных частот (рис. 2.6);
o для расчета дифференциальных относительных, интегральных абсолютных и относительных частот внести в ячейки С12: Е19 соответствующие формулы (рис. 2.7);
o получить результаты табличных расчетов распределения частот (рис. 2.8);
o построить графики распределения (рис. 2.9). Отметим, что интегральное распределение является дискретным и имеет форму "ступенек", хотя распространены компьютерные средства, например, MS Excel, "рисуют" его ломаной линией.
Свойства распределений позволяют сделать важные выводы. Так, площадь под графиком дифференциального распределения имеет смысл частоты. Так, относительные дифференциальные частоты количества выполненных задач в диапазоне вариант х - от 0 до 3 включительно, составляющих суммарное значение 0,25 = 0,05 + 0,05 + 0,15 (см. Заштрихованную часть гистограммы на рис. 2.10) соответствуют интегральной частоте 7 ^ = 0,25. Это значит, что объекты со свойствами х - <3 составляют 25% от общего объема выборки.
Относительные дифференциальные частоты в диапазоне вариант х - от 3 до 4, что
составляют суммарное значение 0,55 = 0,15 + 0,40 (см. заштрихованную часть гистограммы на рис. 2.11), соответствуют разницы интегральных относительных частот F 5 = 0,65 и F 3 = 0,10, то есть 0,65 - 0,10 = 0,55. Это значит, что объекты со свойствами 3 <х - <4 составляют 55% от общего объема выборки.
Так что в итоге систематизации и обработки первичных выборочных данных формируется важный показатель выборки - эмпирические распределения частот: дифференциальные и интегральные, каждый из которых может быть либо абсолютным, или относительным. Сумма всех абсолютных частот равен объему выборки, сумма всех относительных частот равна 1 или 100% . Интегральные (накопленные) распределения формируются как слагаемые всех предыдущих дифференциальных частот или абсолютных или относительных. Они дают значение суммарной частоты для варианта, не превышает значения х, -.
В психолого-педагогических исследованиях преимущественно рассчитываются распределения относительных частот, поскольку именно относительные частоты представляют собой (это будет доказано ниже) и определяются как статистические вероятности.