Моменты статистических распределений

Рассмотренные выше средние величины и показатели вариации являются частичными случаями единой системы обобщающих статистических характеристик распределения, получившая название момента статистического распределения.

Моментом распределения называют среднюю арифметическую величину из возвышенных до заданного степень отклонений отдельных вариант от некоторой постоянной величины (0, X, х0):

где А - постоянная величина, от которой определяются отклонения (за постоянную величину могут быть взяты ноль, средняя арифметическая X или условное начало отсчета х0); к - показатель степени, определяющий порядок момента.

Для изучения характеристик статистических распределений чаще всего используются моменты первых пяти порядков (к равна 0, 1, 2, 3, 4).

в Зависимости от того, что принимается за постоянную величину, от которой определяются отклонения, различают три вида моментов: начальные, центральные и условные.

Моменты распределения, при исчислении которых за исходную величину принимается ноль (А = 0), называют начальными моментами М:

Моменты распределения, при исчислении которых за исходную величину принимаются отклонение от средней арифметической (А = X), называют центральными моментами (/г):

Моменты распределения, при исчислении которых за исходную величину принимаются отклонения от произвольно взятой величины (х0), то есть от так называемого условного начала отсчета, называют условными моментами (т):

Начальные моменты второго, третьего и четвертого порядков так же как и условные моменты самостоятельного значения не имеют, а используются для упрощенного вычисления центральных моментов.

Анализируя формулы моментов, можно заметить, что начальный момент первого порядка М1 = ^х-^- представляет собой среднюю арифметическую (х) и используется как показатель центра распределения. Центральный момент первого порядка всегда равен нулю (нулевое свойство средней арифметической

у (х _ х)2 й

£ (х( - х) = 0). Центральный момент второго порядка /г2 = '-равен дисперсии. Центральный момент третьего порядка ц3 равна нулю в симметричном распределении и используется для определения показателя асимметрии (скошенности). Центральный момент четвертого порядка применяется при исчислении показателя эксцесса (островершинности).

В связи с тем, что теоретическая форма распределения чаще всего неизвестна, вызывает интерес изучение некоторых свойств кривой, построенной по данным эмпирического распределения. В частности, большое значение имеет измерение степени отклонения данного распределения от симметричного и характеристика особенности построения вершины кривой распределения (степени островершинности). С этой целью рассчитываются показатели асимметрии (скошенности) и островершинности (эксцесса).

Поскольку моменты зависят от принятой системы единиц, в статистической практике оказывается более целесообразным брать не абсолютные значения моментов, а их отношение к стандартного отклонения (среднего квадратичного отклонения а) в соответствующем степени.

По мере асимметрии (скошенности) принято рассматривать стандартное отклонение кт = то есть коэффициент скошенности (асимметрии), который представляет собой

отношение центрального момента третьего порядка к среднего квадратичного отклонения в третьей степени.

Различают также нормированные моменты, под которыми понимают отношение момента к-го порядка до среднего квадратичного отклонения в к-й степени. Соответственно этому коэффициент скошенности можно рассматривать как третий нормированный центральный момент распределения.

О наличии асимметрии в исследуемом распределении можно судить и по несовпадением показателей центра распределения (х и Мо): чем больше между ними разница, тем больше асимметрия ряда распределения. Для симметричных распределений частоты любых двух вариант, расположенных по обе стороны от центра распределения, равны между собой. Рассчитаны для таких распределений средняя, мода и медиана также уровне.

Одним из наиболее простых показателей асимметрии (скошенности), основанные на соотношениях средней арифметической и моды, является показатель, предложенный английским статистиком К. Пирсоном:

Учитывая то, что в умеренно асимметричном распределении расстояние между показателями центра распределения характеризуется такой равенством|д - їа | = |о - ее |: 3, формула К. Пирсона может быть записана таким образом:

Его величина может быть положительной или отрицательной. В первом случае речь идет о правостороннюю асимметрию, во втором - о левосторонней.

При наличии положительной (правосторонней) скошенности (правая ветвь кривой длиннее) между показателями центра распределения существует такое соотношение Мо <Е < х, соответственно при наличии отрицательной (левосторонней) скошенности (левая ветвь кривой длиннее) наблюдается обратное соотношение: Мо > Ме > х.

Используют и другие формулы для расчета коэффициента асимметрии. Так, например, шведский математик Линдберг предложил оценивать асимметрию по формуле:

где П - процент единиц совокупности, у которых значение исследуемого признака превышает среднее значение по совокупности;

50 - процент вариант, которые превышают среднюю арифметическую ряда нормального распределения.

В практических расчетах по определению асимметрии преимущество предоставляется третьем нормированном центральном момента:

В симметричном ряду распределения к = 0, при правосторонней скошенности к > 0, при левосторонней к < 0. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной; если она меньше 0,25, то незначительной.

Применение этого показателя дает возможность не только определить асимметрию, но и ответить на вопрос о наличие или отсутствие асимметрии в распределении признака в генеральной совокупности. Оценка существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема совокупности и рассчитывается по формуле:

где п - число единиц совокупности.

Если отношение |кю|:ст>3, асимметрия и распределение признака в генеральной совокупности не является симметричным. Если отношение кт: а < 3, асимметрия несущественна, ее наличие может быть объяснима влиянием различных случайных обстоятельств.

Для характеристики степени островершинности (эксцесса) используется четвертый нормированный центральный момент, т.е. отношение Лт4.

В нормальном распределении существует такое соотношение между центральным моментом четвертого порядка и центральным моментом второго порядка (дисперсией): ц4 = 3ст4 , то есть для нормального распределения четвертый нормированный момент равен 3 ('"в 4 = 3).

Поэтому данное соотношение можно использовать как меру островершинности. Если показатель островершинности (эксцесса) представить в виде

Эх = --^ - 3,то в нормальном распределении Ео = 0, при гостровершинному или к - сг датному эксцессе Ео> 0 и при плосковершинному или отрицательном эксцессе Ео< 0.

Для определения степени эксцесса (гостровершиності) можно использовать предложенную Линдбергом такую формулу:

где П - доля (процент) числа признаков, которые находятся в интервале, равном половине среднего квадратического отклонения по ту или другую сторону от средней арифметической;

38,29 - процент количества вариант, которые находятся в интервале, равном половине средне квадратичного отклонения, в общем количестве вариант ряда нормального распределения.

Наиболее точным является показатель основан на использовании центрального момента четвертого порядка:

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

где п число наблюдений.

Если отношение Ахи : аА! > 3, то отклонение от нормального распределения можно считать существенным и наоборот.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое распределение к нормальному распределению.

Вычислим для исследуемого ряда распределения 100 хозяйств по надою молока на корову коэффициенты скошенности и эксцесса, предварительно определив центральные моменты через условные (табл. 5.5).

Таблица 5.5. Данные для расчета условных моментов

Данные для расчета условных моментов

За условное начало отсчета примем среднее значение интервала с надоем равным 3,3 т (х0 = 3,3 т) и который имеет наибольшую частоту. Величина интервала к = 0,2 т.

Используя данные табл. 5.5, определим значения моментов относительно начала отсчета, выраженные в долях интервала:

Определим значения условных моментов, выраженных в исходной системе единиц измерения, внося при этом поправку на величину интервала в соответствующем степени, исходя из соотношения тпк = тп'к ■ ук, где к - порядок момента (показатель степени); к - величина интервала;

Рассчитаем центральные моменты через условные, используя формулы, взаимосвязи между моментами:

Определим коэффициент скошенности (асимметрии):

Отсюда следует, что данный ряд распределения хозяйств по надою молока на корову близкий к симметричному, но имеет небольшую положительную скошенность. Рассчитаем коэффициент островершинности (эксцесса):

то Есть исследуемый ряд распределения характеризуется существенной плосковершинністю построения вершины кривой распределения.

Определив комплекс средних величин и показателей вариации, мы получили систему статистических характеристик, которые дают возможность всесторонне описать исследуемый ряд распределения и сделать общие выводы.

Выпишем основные статистические характеристики ряда распределения 100 хозяйств по надою молока на корову, ц:

средняя арифметическая х = 32,64;

мода Мо = 33,07;

медиана Е = 32,72;

размах вариации = 14,0;

среднее линейное отклонение = 2,6;

дисперсия ст2 = 10,27;

среднее квадратическое отклонение = 3,2;

коэффициент скошенности к" = 0,046;

коэффициент островершинности Эх = -0,714.

Анализ приведенных статистических характеристик позволяет сделать общий вывод относительно формы распределения 100 хозяйств по надою молока на корову: исследуемый ряд является почти симметричным, незначительно другой стороны, положительно скошенным и плосковершинним; распределение по форме близок к нормальному. Однако доказательства этого положения требует специальной статистической оценки близости исследуемого ряда распределения нормальному на основе соответствующих критериев. Полученные характеристики ряда распределения являются лишь предварительными оценками соответствующих характеристик генеральной совокупности и поэтому нужна оценка их надежности. Эти вопросы рассматриваются в последующих главах учебника.

 
< Пред   СОДЕРЖАНИЕ   След >