Теоретические распределения случайных величин
Содержание классических законов больших чисел состоит в том, что выборочное среднее арифметическое независимых одинаково распределенных случайных величин приближается (сходится) к математическому ожиданию этих величин. Иными словами, выборочные средние сходятся к теоретическому среднего.
Биномиальное распределение
Большинство задач теории вероятностей предполагают известными изначально вероятности элементарных случайных событий (например, все вероятности составляют по 0,5). Опираясь на знание этих вероятностей, рассчитывают вероятностные характеристики сложных событий.
Например, каждый экзамен одного студента (каждое событие Г) состоит из шести элементарных событий а>, - (результатов выполнения заданий), то есть 1 = {й 1, ю 2, ю п), где п = 6 Каждая элементарная событие а> - имеет только два последствия: прямой (желаемый) - "выполнено" (или "1") и противоположный (нежелательный) - "не выполнено" (или "0"). Рассмотрим вариант так называемого "равнодушного" студента, который пытается сдать экзамен, отвечая наугад на задание. Тогда можно принять, что элементарные события будут иметь одинаковые вероятности: /? (1) = /> (0) = 1/2 = 0,5. Для упрощения математического изложения вероятность желаемой элементарного события обозначим как г, то есть р (1) = р. Тогда:
р (1) = р = 0,5;
р (0) = 1- / Х1) = = 1 - 0,5 = 0,5.
Количество желаемых элементарных событий (выполненных заданий) т может колебаться от 0 (ни выполненного задания) до 6 (все задания экзамена выполнено). Рассчитаем вероятности того, что в сложной события / п элементарных событий а> и можно получить т "желаемых" последствий с вероятностью р и, разумеется, п-т "нежелательных" последствий с вероятностью
Общая вероятность одной такой сложной события / равна произведению вероятностей независимых элементарных событий и вычисляется как: p m ■ (1 - p) "- m.
Однако количество вариантов сложных событий / с n элементов по m определяется количеством комбинаций: C 'm = -.
n m! (n - m)!
Поэтому окончательно общую вероятность наблюдения сложной события / можно рассчитать по формуле Бернулли:
P (m) = C m op m o (1 -p) n - m. (3.56)
Эта формула определяет теоретическое распределение вероятностей сложных событий - так называемый биномиальное распределение. На рис. 3.30 приведены его расчеты для параметров n = 6, p = 0,5; на рис. 3.31 - графики дифференциальной и интегральной функций распределения вероятностей. Необходимо иметь в виду, что биномиальное распределение - это распределение дискретной переменной.
Для расчетов биномиального распределения удобно использовать функцию = BHHOMPACn (m; n; p; I), входящей в состав MS Excel. Функция возвращает дискретные значения распределения, где m - количество успехов; n - общее количество испытаний; p - вероятность успеха; И - параметр, который определяет тип распределения (1 - интегральная функция 0 - дифференциальная функция распределения).
Распределения можно рассчитать и для других априорных вероятностей желаемых элементарных событий. Предположим, что для "слабого" студента вероятность г. желаемой события составляет, например, 30% или 0,3. На рис. 3.32 приведены соответствующие расчеты для п = 6, р = 0,3; на рис. 3.33 - графики дифференциальной и интегральной функций распределения.
Для "добросовестного" студента вероятность г. элементарной желаемой события составит более 50%, например, 70% или 0,7. На рис. 3.34 и 3.35 приведены расчеты для п = 6, р = 0,7, а также соответствующие графики распределения.
Разницу между биномиальными делениями для различных значений вероятностей элементарных желаемых событий можно наблюдать на соответствующих графиках. Предлагаем самостоятельно прокомментировать рис. 3.31, 3.33 3.35.
Основные показатели центральной тенденции и вариативности для биномиального распределения определяются следующим образом:
o среднее арифметическое X = п o г;
o дисперсия s в = п ■ г. ■ (1 - р)
o стандартное отклонение s I = л [^ й.
На рис. 3.36 в табличной форме показана зависимость этих показателей распределения от вероятности р элементарной желаемой события.
Рис. 3.36. Зависимость МЦТ и ММ от вероятности события г.
Как видно из таблицы рис. 3.36, для "равнодушного" студента (р = 0,5) среднее значение составляет 3 желаемых события, для "слабого" (г. = 0,3) - в среднем 1,8 желаемых событий; для "добросовестного" студента (р = 0,7) - в среднем 4,2 желаемых событий из 6 возможных.
На примере биномиального распределения можно продемонстрировать общую методику использования теоретических функций распределения в решении реальных практических задач.
Пример 3.19. В таблице рис. 3.37 рассчитано распределение по эмпирическим данным (экзамены студентов по тестам) и теоретический биномиальное распределение с вероятностями успеха р (1) = 0,50 и неуспеха р (0) = 1-р (1) = 1-0,50 = 0,50 .
Рис. 3.37. Эмпирический и теоретический распределения
Как видно из рис. 3.37, график эмпирического распределения "реальной ситуации" существенно отличается от теоретического так называемого варианта "50/50". Это дает основания надеяться на то, что реальные результаты экзаменов обусловлены большей вероятностью "успехов" элементарных событий, то есть р (1)> /> (0).
Математически реальную способность студентов к успешному выполнению задач (обусловливающие компетентность, мотивация, интеллект или другие факторы) можно зафиксировать по неизвестной (пока) вероятность р *. Найти вероятность р * можно даже простым подбором (увеличивая или уменьшая) значение показателя вероятности р так, чтобы приблизить ("подтянуть") график теоретического распределения графику эмпирического распределения. Понятно, что такое приближение "ручным" путем не является эффективным.
Задача: определить ймовирнистьр *.
Решение:
Оптимального значения вероятности р * можно достичь с внедрением компьютерных интерактивных возможностей MS Excel в такой последовательности:
o с помощью мыши активизировать и приблизить вниз точку графика теоретического распределения со значением, например, 0,31 до точки эмпирического распределения со значением 0,16 (см. рис. 3.38).
o в результате этого появится диалоговое окно "Подбор параметра", в котором установить значения параметров, как показано на рис. 3.39;
Рис. 3.38. Приближение теоретического распределения к эмпирическому o после команды ОК получить сообщение о результате отбора параметра - "Решение найдено" (рис. 3.40);
o в результате в ячейке Е12 появится новое перечисленное значение вероятности р, которое равно 0,72, а в электронной таблице - соответствующие перечисленные значения теоретической функции. Изменится также и форма графика этой функции, который приблизится к графику эмпирического распределения (рис. 3.41).
Рис. 3.41. Приближение теоретического распределения к эмпирическому
Ответ: вероятность «успеха» составляет примерно 72% (р = 0,72) и более чем вдвое превышает вероятность противоположным последствиям (1- г) = 0,28. В содержательном плане это может означать, что, во-первых, результаты тестирования с большей вероятностью можно принимать за следствие способности студентов к успешному выполнению задач, во-вторых, - процедура экзамена имеет определенный уровень диагностических свойств по знаний студентов.