ПРЕДМЕТ математической статистики

Основные задачи и методы математической статистики

Математическая статистика - это современная отрасль математической науки, которая занимается статистическим описанием результатов экспериментов и наблюдений, а также построением математических моделей, содержащих понятия вероятности. Теоретической базой математической статистики служит теория вероятностей.

В структуре математической статистики традиционно выделяют два основных раздела: описательная статистика и статистические выводы (рис. 1.1).

Рис. 1.1. Основные разделы математической статистики

Описательная статистика используется для:

o обобщение показателей одной переменной (статистика случайной выборки);

o выявление взаимосвязей между двумя и более переменными (корреляционно-регрессионный анализ).

Описательная статистика дает возможность получить новую информацию, быстрее понять и всесторонне оценить ее, то есть выполняет научную функцию описания объектов исследования, чем и оправдывает свое название. Методы описательной статистики призваны превратить совокупность отдельных эмпирических данных на систему наглядных для восприятия форм и чисел: распределения частот; показатели тенденций, вариативности, связи. Этими методами рассчитываются статистики случайной выборки, которые служат основанием для осуществления статистических выводов.

Статистические выводы дают возможность:

o оценить точность, надежность и эффективность выборочных статистик, найти ошибки, которые возникают в процессе статистических исследований (статистическое оценивание)

o обобщить параметры генеральной совокупности, полученные на основании выборочных статистик (проверка статистических гипотез).

Главная цель научных исследований - это получение нового знания о больших класса явлений, лиц или событий, которые принято называть генеральной совокупности.

Генеральная совокупность - это полная совокупность объектов исследования, выборка - ее часть, которая сформирована определенным научно обоснованным способом 2.

Термин "генеральная совокупность" используется тогда, когда речь идет о большой, но конечную совокупность исследуемых объектов. Например, о совокупности абитуриентов Украины в 2009 году или совокупность детей дошкольного возраста города Ровно. Генеральные совокупности могут достигать значительных объемов, быть конечным и бесконечным. На практике, как правило, имеют дело с конечным совокупностями. И если отношение объема генеральной совокупности к объему выборки составляет более 100, то, по словам Гласса и Стэнли методы оценки для конечных и бесконечных совокупностей дают в сущности одинаковые результаты [17, С. 218]. Генеральной совокупностью можно называть и полную совокупность значений какого-то признака. Принадлежность выборки к генеральной совокупности является главным основанием для оценки характеристик генеральной совокупности по характеристикам выборки.

Основная идея математической статистики базируется на убеждении о том, что полное изучение всех объектов генеральной совокупности в большинстве научных задач или практически невозможно, или экономически нецелесообразно, поскольку требует много времени и значительных материальных затрат. Поэтому в математической статистике применяется выборочный подход, принцип которого показано на схеме рис. 1.2.

Например, по технологии формирования различают выборки рандомизированы (простые и систематические), стратифицированные, кластерные (см. Раздел 4).

Рис. 1.2. Схема применения методов математической статистики Согласно выборочным подходом использования математико-статистических методов может проводиться в такой последовательности (см. Рис. 1.2):

o с генеральной совокупности, свойства которой подлежат исследованию, определенными методами формируют выборку - типичную но ограниченное количество объектов, к которым применяют исследовательские методы;

o в результате методов наблюдений, экспериментальных действий и измерений над объектами выборки получают эмпирические данные;

o обработка эмпирических данных с помощью методов описательной статистики дает показатели выборки, которые называются статистиками - как и название дисциплины, кстати;

o применяя методы статистических выводов к статистик, получают параметры, которые характеризуют свойства генеральной совокупности.

Пример 1.1. С целью оценки стабильности уровня знаний (переменная X) проведено тестирование рандомизированной выборки 3 студентов объемом n. Тесты содержали по m заданий, каждое из которых оценивалось по системе баллов: "выполнено" "- 1," не выполнено "- 0. остались средние текущие достижения студентов X

3 рандомизированных выборка (от англ. Random - случайный) - это репрезентативная выборка, которая сформирована по стратегии случайных испытаний.

на уровне прошлых лет / ч? Последовательность решения:

o выяснить содержательную гипотезу типа: "если текущие результаты тестирования не будут отличаться от прошлых, то можно считать уровень знаний студентов неизменным, а учебный процесс - стабильным";

o сформулировать адекватную статистическую гипотезу, например, нуль-гипотезу Н 0 о том, что "текущий средний балл X статистически не отличается от среднего показателя прошлых лет / ч", то есть Н 0: X = / г, против соответствующей альтернативной гипотезы X Ф ^ ;

o построить эмпирические распределения исследуемой переменной X;

o рассчитать выборочные статистики, например, среднее, дисперсию и т.д .;

o определить (при необходимости) корреляционные связи, например, между переменной X и другими показателями, построить линии регрессии;

o проверить соответствие эмпирического распределения нормальному закону;

o оценить значение точечных показателей и доверительный интервал параметров, например, среднего;

o определить критерий для проверки статистических гипотез;

o выполнить проверку статистических гипотез на основе выбранных критериев;

o сформулировать решение о статистической нуль-гипотезы на определенном уровне значимости;

o перейти от решения о принятии или отклонении статистической нуль-гипотезы интерпретации выводов относительно гипотезы содержательной;

o сформулировать содержательные выводы.

Итак, если обобщить вышеперечисленные процедуры, применение статистических методов состоит из трех основных блоков:

- Переход от объекта реальности к абстрактной математико-статистической схемы, то есть построение вероятностной модели явления, процесса, свойства;

- Проведение расчетных действий собственно математическими средствами в рамках вероятностной модели по результатам измерений, наблюдений, эксперимента и формулировки статистических выводов;

- Интерпретация статистических выводов о реальной ситуации и принятия соответствующего решения.

Статистические методы обработки и интерпретации данных опираются на теорию вероятностей. Теория вероятностей является основой методов математической статистики. Без использования фундаментальных понятий и законов теории вероятностей невозможно обобщения выводов математической статистики, а значит и обоснованного их использования для научных и практических целей.

Так, задачей описательной статистики является превращение совокупности выборочных данных на систему показателей - статистик - распределений частот, мер центральной тенденции и изменчивости, коэффициентов связи и тому подобное. Однако, статистики являются характеристиками, по сути, конкретной выборки. Конечно, можно рассчитывать выборочные распределения, выборочные средние, дисперсии и т. Д., Но подобный "анализ данных" имеет ограниченную научно-познавательную ценность. "Механическое" перенос каких-либо выводов, сделанных на основе таких показателей, на другие совокупности не является корректным.

Для того, чтобы иметь возможность переноса выборочных показателей или другие, или на более распространены совокупности, необходимо иметь математически обоснованные положения о соответствии и способности выборочных характеристик характеристиками этих распространенных так называемых генеральных совокупностей. Такие положения базируются на теоретических подходах и схемах, связанных с вероятностными моделях реальности, например, на аксиоматическом подходе, в законе больших чисел и т.д. Только с их помощью можно переносить свойства, которые установлены по результатам анализа ограниченной эмпирической информации, или на другие или на распространенные совокупности. Таким образом, построение, законы функционирования, использование вероятностных моделей, является предметом математической области под названием "теория вероятностей", становится сутью статистических методов.

Таким образом, в математической статистике используются два параллельных строки показателей: первая строка, что имеет отношение к практике (это выборочные показатели) и второй, основанный на теории (это показатели вероятностной модели). Например, эмпирическим частотам, которые определены на выборке, соответствуют понятия теоретической вероятности; выборочном среднем (практика) соответствует математическое ожидание (теория) и т.д. Причем, в исследованиях выборочные характеристики, как правило, являются первичными. Они рассчитываются на основе наблюдений, измерений, экспериментов, после чего проходят статистическое оценивание способности и эффективности, проверку статистических гипотез в соответствии с целями исследований и в конце принимаются с определенной вероятностью как показатели свойств исследуемых совокупностей.

Вопрос. Задача.

1. Охарактеризуйте основные разделы математической статистики.

2. В чем заключается основная идея математической статистики?

3. Охарактеризуйте соотношение генеральной и выборочной совокупностей.

4. Объясните схему применения методов математической статистики.

5. Укажите перечень основных задач математической статистики.

6. Из каких основных блоков состоит применения статистических методов? Охарактеризуйте их.

7. Раскройте связь математической статистики с теорией вероятностей.

 
< Пред   СОДЕРЖАНИЕ   След >