Характеристики случайных величин
Случайную величину X можно полноценно характеризовать функцией распределения событий стр> и, (функция определена на пространстве элементарных событий £ 2). Функция распределения в виде гистограммы (для дискретной переменной) или функции плотности (для непрерывной переменной) дает исчерпывающую информацию по закону распределения случайной величины. Однако наблюдаются всегда только значение этой функции, которые являются реализацией случайной величины в конкретной ситуации. Сама же функция распределения только теоретическим обобщением, которое служит основой для построения вероятностных моделей изучения реальности.
Результаты испытаний, как правило, моделируются независимыми случайными величинами. Часто считают, что наблюдение, экзамены, опыты проводятся по схеме независимых испытаний. Итак, независимость случайных величин - одно из базовых понятий теории вероятностей, лежит в основе практически всех вероятностно-статистических методов. Поэтому следует иметь в виду некоторые важные свойства независимых случайных величин:
o случайные величины X и Y, определенные на том же пространстве элементарных событий, называются независимыми, если для любых чисел а и Ь события {Х = а} и {В = Ь} независимы;
o если случайные величины X и Y независимы, а и Ь - некоторые числа, то случайные величины Х + а и В + Ь также независимы;
o если случайные величины X и Y независимы, Ал (Х) и g (У) - случайные величины, полученные с X и В с помощью некоторых функций / и g, то Л (Х и <? (В - и также независимые случайные величины . Например, если X и Y независимы, то X 2 и 3-В +4 независимые, а также ln (X) и 1п (У) независимы.
В практике Исследование генеральной совокупности вполне достаточным является получение нескольких многочисленных характеристик, оценивают центр группировки значений случайной величины, степень их рассеяния, степень взаимосвязи различных компонентов многомерной признаки. В свою очередь, зная только характер статистических законов, распределение может быть успешно восстановлена по своим многочисленным характеристикам, например, по средним значениям, дисперсией. Поэтому целесообразно рассмотреть основные характеристики случайной величины X, позволяющие численно оценить так называемые показатели "центральной тенденции" (математическое ожидание M [X], моду Mo [X] и медиану Md [X), а также "вариативности" (дисперсия D [ X], стандартное отклонение 5D [X]).
Математическое ожидание
Одной из важных характеристик распределения случайной величины X является ее математическое ожидание M [X] (иногда его называют среднее значение случайной величины).
Определение. математическое ожидание случайной величины является число
M [X] = Х X (a) o P (a), (3.21)
weq
где Х (ю) - значение случайной величины X, полученное в событии й; Р (ю) -вероятность случайного события й; Q - пространство элементарных событий Юе £ 1
Пример 3.13. Вычислить математическое ожидание числа, выпадает на верхней грани игрового кубика.
Решение:
Пространство Q состоит из 6 элементарных событий (ю 1, ю 2, ю 6}. Каждой элементарной события соответствует значение случайной величины. Для игрового кубика это число от 1 до 6 на его гранях: X (ro 1) = 1, X (ro 2) = 2, ... X (co 6) = 6 Все события имеют равные вероятности произойти Р (ю {) = Р (ю 2) = ... Р (ю 6) = 1/6.
Отсюда математическое ожидание случайной величины равно:
M [X] = X X (ю) o P (o) = 1- - + 2 o - + 3 o - + 4 o - + 5 o - + 6 o - = 21 = 3,5.
oieQ 6 6 6 6 6 6 6
Ответ: математическое сподиванняA / [X 7] = 3,5.
Математическое ожидание простой случайной величины X с множеством значений {x 1, x 2, x n} определяется как
M [X] = Их ,. o Р (Х = х ,.). (3.22)
Смысл математического ожидания стоит раскрыть на примере.
Пример 3.14. Среднее количество выполненных тестовых заданий, приходится на одного студента, может определенным образом характеризовать качество обучения. Это можно принять, если предположить, что отдельные значения случайной переменной x группируются у этого среднего показателя. В табл. рис. 3.20 приведены данные испытаний: хи - возможное количество выполненных заданий из пяти предложенных; т- ^ - соответствующее исполнения = т). Необходимо рассчитать математическое ожидание как ориентировочный показатель знаний студентов или качества обучения. Решение:
o В столбце В (рис. 3.20) для каждого значения хи рассчитать относительные частоты Ли = т / т, приняв их за статистические вероятности Р; (x = х ^. Такое предположение справедливо при большом количестве испытаний.
o В столбце Е (рис. 3. 20) рассчитать взвешенные значения хи Л
o Построить график распределения выполнения тестовых заданий (рис. 3.21).
o Рассчитать математическое ожидание:
М [X] = £ х ,. o / (х ,.) = 0o 0,02 + 1-0,04 + 2o 0,06 + 3-0,12 + 4o 0,32 + 5o 0,44 = 4,00.
Ответ: среднее значение количества выполненных задач, добытое по результатам экзаменов, близкий к математического ожидания М [Х] = 4,00 и может служить ориентировочным показателем качества обучения.
Для непрерывной случайной величины X, если функция распределения р (х) абсолютно непрерывна и неотъемлемая функция / (х) плотности распределения такова, что
р (х) = | / (х) х. (3.23)
-сс
Тогда математическим ожиданием называется число
+ стр
М [X] = х ■ Л (х) Сох. (3.24)
-сс
Пример 3.15. Рассчитать математическое ожидание непрерывной случайной величины X с равномерным распределением вероятности на отрезке [а, Ь]. Решение:
На рис. 3.22. изображен график равномерного распределения X на отрезке [а, Ь].
Математическое ожидание M [X] рассчитывается как выдающийся интеграл на отрезке от-же до + со, а именно
М [X] = | х o Л (х) Вост.
-сс
Плотность равномерного распределения Л (х) на отрезке [о, + со] можно определить на трех отдельных участках значений аргумента х:
Ответ: в общем виде математическое ожидание М [X] = Ь ~ 2 ~~. Д ля
конкретных значений отрезке [а, Ь], например, а = 2 и Ь = 4, математическое дне -4 + 2
ния М [X] = -2- = 3. На рис. 3.23. изображен график равномерного распределения
случайной величины X на отрезке [2, 4] и отмечено положение MX = 3.
Эмпирическим (т.е. построенным по выборочным данным х 1, х 2, "., Х п) аналогом математического ожидания является среднее арифметическое
_ 1 "
X = - 1 х,. "1 = 1
Объяснение такого перехода от теоретических характеристик к эмпирическим (например, от математического ожидания M [X]) до среднего X) базируется на интерпретации выборки как уменьшенной модели генеральной совокупности, где возможными значениями являются выборочные значения, а вероятностями - относительные частоты их появления в выборке.
Распределения случайной величины X могут быть охарактеризованы еще двумя мерами положение центра: модой Mo [X] и медианой Md [X].
Определение. Модой Mo [X] случайной величины X называют такое ее значение, при котором плотность вероятности достигает максимума 13.
Для дискретной величины модой является наиболее вероятное значение случайной величины. Например, из рис. 3.21 можно установить, что максимальную вероятность 0,44 важно 5. Итак, это значение и является модой Mo [X] = 5,00.
Если максимум плотности распределения наблюдается только для одного значения переменной X (рис. 3.21), распределение называется унимодальном (одно- дальним), если для нескольких не соседних значений - полимодальный. Мода является естественной характеристикой центра группировки в случае унимодальных распределений. Полимодальные распределения свидетельствуют о существенной неоднородности совокупностей. их изучение целесообразно для задач классификации объектов исследования.
Для непрерывной величины моду Mo [X], как максимум плотности (рис. 3.24),
Предлагаем сравнить это определение с определением выборочной моды мо.
можно определить с помощью первой и второй производной функции в условиях монотонности функции плотности на определенном промежутке [а, Ь].
Эмпирическим аналогом Мо [Х] случайной величины Х является выборочная мода Мо - как вариант, который чаще всего встречается в выборке.
Определение. Медианой случайной величины X называют такое ее значение МАХ], при котором выполняется условие одинаковых вероятностей принимать переменной X значения, не выше по мах] и не ниже мах, то есть
Р (Х <МаЩ) = Р (Х> МаЩ).
Согласно геометрической интерпретацией медиана МАХ - это точка на абсциссе, по которой площадь, лежит под графиком плотности, делится пополам -на две равные частью 8 один = 8 две (рис. 3.25). При определении выборочной медианы Ма эмпирические данные упорядочиваются в вариационный ряд. Значение среднего элемента этого ряда и является значением выборочной медианы (см. 2.2).
Свойства математического ожидания случайной величины:
o если Х 1, Х 2, Х п - попарно независимые случайные величины (то есть и X, независимые для и фу), то математическое ожидание суммы равна сумме математических ожиданий этих величин
М [Х 1 + Х 2 + ... + Х п] = М [Х 1] + щх 2] + ... + МХ п]; (3.25)
o математическое ожидание произведения независимых случайных величин Х 1, Х 2, Х п равна произведению математических надежды этих величин
M [X l o X2 o ... o Xn] = M [Xi] o MX 2 o ... oA / LXJ; (3.26)
o математическое ожидание константы равна самой константе
M [a] = a; (3.27)
o математическое ожидание разницы X- M [X] равна нулю
M [X-M [X]] = 0; (3.28)
o если независимые случайные величины X и Y определены на том же пространстве элементарных событий, a и b - некоторые числа, то
M [aX + bY] = aM [X] + bM [Y]. (3.29)