Показатели вариации в статистике кратко

Обновлено: 04.07.2024

Аннотация: В процессе статистического анализа может сложиться ситуация, когда значения средних величин совпадают, а совокупности, на основе которых они рассчитаны, состоят из единиц, значения признака у которых достаточно резко различаются между собой. Возьмем, например, данные о количестве договоров, заключенных в двух филиалах страховой компании. Предположим, что в каждом из филиалов работает по два агента. В первом филиале один агент заключил 5 договоров, а второй - 25; во втором филиале каждый агент заключил по 15 договоров. Как видим, среднее число договоров, заключенных одним агентом в каждом филиале совпадает (15 договоров), в то же время очевидно, что первая и вторая совокупности качественно неоднородны, т.д. вариация значений признака внутри них различна. Данная глава посвящена рассмотрению показателей, с помощью которых можно оценить и измерить вариацию признака.

7.1. Абсолютные и относительные показатели вариации

Рассмотрим две совокупности сотрудников рекламных агентств.

Распределение сотрудников первого агентства по уровню месячной заработной платы представлено в табл. 7.1.

Распределение сотрудников второго агентства по уровню месячной заработной платы представлено в табл. 7.2.

Рассчитаем средний уровень заработной платы:

Как видим, средние в двух совокупностях практически совпадают между собой (с разницей в 1 руб.). Однако если вы вдруг случайно встретите сотрудников этих агентств и поинтересуетесь уровнем оплаты их труда, то вас заверят, что платят у них вовсе не одинаково! Почему?! Оказывается, что разброс значений вокруг средней в этих совокупностях абсолютно разный. Значит, такой характеристики, как средняя, вовсе не достаточно, чтобы делать выводы о совокупности. Для этого используют показатели вариации.

Вариацией называется изменчивость значений признака у единиц статистической совокупности. Для измерения величины вариации используются абсолютные и относительные показатели вариации.

К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия , среднее квадратическое отклонение.

Размах вариации (R) вычисляется как разность между максимальным и минимальным значениями признака

$ R=x_<max>-x_$
( 7.1)

Среднее линейное отклонение (d) представляет собой среднюю арифметическую величину из абсолютных значений отклонений отдельных значений признака от их средней. Если данные не сгруппированы, то рассчитывается невзвешенное среднее линейное отклонение

\overline<d>_=\frac )> n
( 7.2)

Для сгруппированных данных, представленных в виде вариационного ряда, используется взвешенное среднее линейное отклонение, где весами выступают частоты соответствующих вариант:

\overline<d>_=\frac )f_i>
( 7.3)

 \sigma^<2></p>
<p>Дисперсией (
) называется средняя арифметическая величина, полученная из квадратов отклонений значений признака от их средней

\sigma_<прост.>^2=\frac )^2> n
( 7.4)
\sigma_<взвеш.>^2=\frac )^2 f_i>
( 7.5)

Квадратный корень из дисперсии называется средним квадратическим отклонением (его называют также стандартным отклонением):

\sigma_<прост.>=\sqrt)^2> n>
( 7.6)
\sigma_<взвеш.>=\sqrt)^2 f_i> >
( 7.7)

Абсолютные показатели вариации, за исключением дисперсии, имеют те же единицы измерения, что и исследуемый показатель вариационного ряда. Поэтому, если экономическая интерпретация , например, среднего линейного отклонения, проста и понятна физически, то в случае с дисперсией она затруднена. Однако дисперсия рассчитывается в статистическом анализе гораздо чаще, чем другие показатели вариации. Связано это с тем, что дисперсия широко используется в таких видах статистического анализа, как корреляционный, регрессионный, дисперсионный, при оценках результатов выборочного наблюдения. Кроме того, именно с помощью дисперсии можно оценить влияние случайных и систематических факторов на формирование значений случайной величины.

Для сравнения вариации одного и того же показателя в разных совокупностях (например, заработной платы двух рекламных агентств) или вариации разных показателей в одной совокупности (например, вариации заработной платы и возраста в одном рекламном агентстве) используют относительные показатели вариации. К ним относят:

V_R=\frac R <\overline <x>> \cdot 100%
( 7.8)
V_<\overline <d>>=\frac <\overline <d>> <\overline <x>> \cdot 100%
( 7.9)
V_<\sigma>=\frac \sigma <\overline <x>> \cdot 100%
( 7.9)

V_<\sigma></p>
<p>Принято считать, что если значение
&> 33%, то совокупность неоднородна, и для дальнейшего статистического анализа следует либо исключить крайние значения признака, либо разбить совокупность на однородные группы (требование однородности данных присутствует практически во всех видах статистического анализа).

Рассчитаем показатели вариации для приведенных в табл. 7.1 и 7.2 вариационных рядов (табл. 7.3 и 7.4).

По первому агентству получим следующие данные.

R = xmax - xmin = 18 000 - 4000 = 14 000 (руб.).

Среднее линейное отклонение (так как ряд сгруппирован и частоты не равны между собой) рассчитываем как взвешенную величину:

1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Определение: Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Он характеризует пределы изменения признака.

Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: ,

где – число членов ряда.

Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.




– СЛО для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

Дисперсия альтернативного признака:

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

4. Виды дисперсии.

Определение: Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ();

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();

3) Если все варианты умножить на число , дисперсия увеличится в раз ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

– Средняя из внутригрупповых дисперсий

Общая - измеряет вариацию во всей совокупности

Средняя из внутригрупповых дисперсий исчисляется ,

где – частота появления внутригрупповой дисперсии одной величины (одного размера).

– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.

Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Правило сложения дисперсий.

Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).

Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.

Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:

– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).

; – влияние других факторов равно 0.

– влияние признака равно 0.

Тема 5

Основные вопросы: 1. Понятие вариации.

2. Показатели вариации.

3. Относительные показатели вариации.

4. Виды дисперсии.

1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Определение: Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Он характеризует пределы изменения признака.

Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: ,

где – число членов ряда.

Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

– СЛО для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

Дисперсия альтернативного признака:

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

4. Виды дисперсии.

Определение: Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ();

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();

3) Если все варианты умножить на число , дисперсия увеличится в раз ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

– Средняя из внутригрупповых дисперсий

Общая - измеряет вариацию во всей совокупности

Средняя из внутригрупповых дисперсий исчисляется ,

где – частота появления внутригрупповой дисперсии одной величины (одного размера).

– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.

Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Правило сложения дисперсий.

Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).

Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.

Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:

– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).


Вариация — это различия индивидуальных значений признака у единиц изучаемой совокупности. Исследование вариации имеет большое практическое значение и является необходимым звеном в экономическом анализе. Необходимость изучения вариации связана с тем, что средняя, являясь равнодействующей, выполняет свою основную задачу с разной степенью точности: чем меньше различия индивидуальных значений признака, подлежащих осреднению, тем однороднее совокупность, а, следовательно, точнее и надежнее средняя, и наоборот. Следовательно по степени вариации можно судить о границах вариации признака, однородности совокупности по данному признаку, типичности средней, взаимосвязи факторов, определяющих вариацию.

Изменение вариации признака в совокупности осуществляется с помощью абсолютных и относительных показателей.

Абсолютные показатели вариации включают:

  • размах вариации
  • среднее линейное отклонение
  • дисперсию
  • среднее квадратическое отклонение

Размах вариации (R)

Размах вариации — это разность между максимальным и минимальным значениями признака

Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности.

Пример. Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.
Решение: размах вариации = 9 — 2 = 7 лет.

Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .

При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат

Среднее линейное и квадратическое отклонение

Среднее линейное отклонение — это средняя арифметическая из абсолютных отклонений отдельных значений признака от средней.

Среднее линейное отклонение простое:


Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.

В нашем примере: лет;


Среднее линейное отклонение взвешенное применяется для сгруппированных данных:


Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).

Среднее квадратическое отклонение

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:

Среднее квадратическое отклонение простое:



Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:


Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Дисперсия

Дисперсия - представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины.


В нашем примере:


Более удобно вычислять дисперсию по формуле:


которая получается из основной путем несложных преобразований. В этом случае средний квадрат отклонений равен средней из квадратов значений признака минус квадрат средней.

Для несгрупиированных данных:


Для сгруппированных данных:


Вариация альтернативного признака заключается в наличии или отсутствии изучаемого свойства у единиц совокупности. Количественно вариация альтернативного признака выражается двумя значениями: наличие у единицы изучаемого свойства обозначается единицей (1), а его отсутствие — нулем (0). Долю единиц, обладающих изучаемым признаком, обозначают буквой , а долю единиц, не обладающих этим признаком — через . Учитывая, что p + q = 1 (отсюда q = 1 — p), а среднее значение альтернативного признака равно


,

средний квадрат отклонений


Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих данным свойством (), на долю единиц, данным свойством не обладающих ().

Максимальное значение средний квадрат отклонения (дисперсия) принимает в случае равенства долей, т.е. когда т.е. . Нижняя граница этого показателя равна нулю, что соответствует ситуации, при которой в совокупности отсутствует вариация. Среднее квадратическое отклонение альтернативного признака:


Так, если в изготовленной партии 3% изделий оказались нестандартными, то дисперсия доли нестандартных изделий , а среднее квадратическое отклонение или 17,1%.


Среднее квадратическое отклонение равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической.

Относительные показатели вариации

Относительные показатели вариации включают:

  • Коэффициент осцилляции
  • Относительное линейное отклонение (линейный коэффициент варианции)
  • Коэффициент вариации (относительное отклонение)

Сравнение вариации нескольких совокупностей по одному и тому же признаку, а тем более по различным признакам с помощью абсолютных показателей не представляется возможным. В этих случаях для сравнительной оценки степени различия строят относительные показатели вариации. Они вычисляются как отношения абсолютных показателей вариации к средней:

Коэффициент осцилляции
Относительное линейное отклонение
Коэффициент вариации

Рассчитываются и другие относительные характеристики. Например, для оценки вариации в случае асимметрического распределения вычисляют отношение среднего линейного отклонения к медиан

так как благодаря свойству медианы сумма абсолютных отклонений признака от ее величины всегда меньше, чем от любой другой.

В качестве относительной меры рассеивания, оценивающей вариацию центральной части совокупности, вычисляют относительное квартильное отклонение , где — средний квартиль полусуммы разности третьего (или верхнего) квартиля () и первого (или нижнего) квартиля ().

На практике чаще всего вычисляют коэффициент вариации. Нижней границей этого показателя является нуль, верхнего предела он не имеет, однако известно, что с увеличением вариации признака увеличивается и его значение. Коэффициент вариации является в известном смысле критерием однородности совокупности (в случае нормального распределения).

Рассчитаем коэффициент вариации на основе среднего квадратического отклонения для следующего примера. Расход сырья на единицу продукции составил (кг): по одной технологии при , а по другой — при. Непосредственное сравнение величины средних квадратических отклонений могло бы привести к неверному представлению о том, что вариация расхода сырья по первой технологии интенсивнее, чем по второй (. Относительная мера вариации ( позволяет сделать противоположный вывод


Пример расчета показателей вариации

На этапе отбора кандидатов для участия в осуществлении сложного проекта фирма объявлила конкурс профессионалов. Распределение претендентов по опыту работы показало средующие результаты:


Вычислим средний производственный опыт работы, лет


Рассчитаем дисперсию по продолжительности опыта работы


Такой же результат получается, если использовать для расчета другую формулу расчета дисперсии


Вычислим среднее квадратическое отклонение, лет:


Определим коэффициент вариации, %:


Правило сложения дисперсий

Для оценки влияния факторов, определяющих вариацию, используют прием группировки: совокупность разбивают на группы, выбрав в качестве группировочного признака один из определяющих факторов. Тогда наряду с общей дисперсией, рассчитанной по всей совокупности, вычисляют внутигрупповую дисперсию (или среднюю из групповых) и межгрупповую дисперсию (или дисперсию групповых средних).

Общая дисперсия характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий.

Межгрупповая дисперсия измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:


  • — групповые средние,
  • — численность единиц i-й группы

Внутригрупповая дисперсия оценивает вариацию признака, сложившуюся по влиянием других, неучитываемых в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий.


Все три дисперсии () связаны между собой следующим равенством, которое известно как правило сложения дисперсий:

на этом соотношении строятся показатели, оценивающие влияние признака группировки на образование общей вариации. К ним относятся эмпирический коэффициент детерминации () и эмпирическое корреляционное отношение ()

Эмпирический коэффициент детерминации () характеризует долю межгрупоовой дисперсии в общей дисперсии:

и показывает насколько вариация признака в совокупности обусловлена фактором группировки.

Эмпирическое корреляционное отношение (!!\eta = \sqrt< \frac >

оценивает тесноту связи между изучаемым и группировочным признаками. Предельными значениями являются нуль и единица. Чем ближе к единице, тем теснее связь.

Пример. Стоимость 1 кв.м общей площади (усл.ед) на рынке жилья по десяти 17-м домам улучшенной планировки составляла:


При этом известно, что первые пять домов были построены вблизи делового центра, а остальные — на значительном расстоянии от него.


Для рассчета общей дисперсии вычислим среднюю стоимость 1 кв.м. общей площади: Общую дисперсию определим по формуле:

Вычислим среднюю стоимость 1 кв.м. и дисперсию по этому показателю для каждой группы домов, отличающихся месторасположением относительно центра города:

а) для домов, построенных вблизи центра:

б) для домов, построенных далеко от центра:

Вариация стоимости 1 кв.м. общей площади, вызванная изменением местоположения домов, определяется величиной межгрупповой дисперсии:

Вариация стоимости 1 кв.м. общей площади, обусловленная изменением остальных неучитываемых нами показателей, измеряется величиной внутригрупповой дисперсии

Найденные дисперссии в сумме дают величину общей дисперсии

Эмпирический коэффициент детерминации:

показывает, что дисперсия стоимости 1.кв.м. общей площади на рынке жилья на 81,8% объясняется различиями в расположении новостроек по отношению к деловому центру и на 18,2% — другими факторами.

Эмприческое корреляционное отношение свидетельствует о существенном влиянии на стоимость жилья месторасположения домов.


Правило сложения дисперсий для доли признака записывается так:

а три вида дисперсий доли для сгруппированных данных определяется по следующим формулам:


общая дисперсия:


Формулы межгрупповой и внутригрупповой дисперсий:


Характеристики формы распределения

Для получения представления о форме распределения используются показатели среднего уровня (средняя арифметическая, мода, медиана), показатели вариации, ассиметрии и эксцесса.

В симметричных распределениях средняя арифметическая, мода и медиана совпадают (. Если это равенство нарушается — распределение ассиметрично.

Простейшим показателем ассиметрии является разность , которая в случае правосторонней ассиметрии положительна, а при левосторонней — отрицательна.


Для сравнения ассиметрии нескольких рядов вычисляется относительный показатель

В качестве обобщающих характеристик вариации используются центральные моменты распределения -го порядка , соответствующие степени, в которую возводятся отклонения отдельных значений признака от средней арифметической:

Для несгруппированных данных:


Для сгруппированных данных:


Момент первого порядка согласно свойству средней арифметической равен нулю .

Момент второго порядка является дисперсией .

Моменты третьего и четвертого порядков используются для построения показателей, оценивающих особенности формы эмпирических распределений.

С помощью момента третьего порядка измеряют степень скошенности или ассиметричности распределения.

В симметричных распределениях , как все центральные моменты нечетного порядка.Неравенство нулю центрального момента третьего порядка указывает на асимметричность распределения. При этом, если , то асимметрия правосторонняя и относительно максимальной ординаты вытянута правая ветвь; если , то асимметрия левосторонняя (на графике это соответствует вытянутости левой ветви).

Для характеристики островершинности или плосковершинности распределения вычисляют отношение момента четвертого порядка () к среднеквадратическому отклонению в четвертой степени (). Для нормального распределения , поэтому эксцесс находят по формуле:

Для нормального распределения обращается в нуль. Для островершинных распределений , для плосковершинных .


Кроме показателей, рассмотренных выше, обобщающей характеристикой вариации в однородной совокупности служит определенный порядок в изменении частот распределения в соответствии с изменениями величины изучаемого признака, называемый закономерностью распределения.

Характер (тип) закономерности распределения может быть выявлен путем построения вариационного ряда на основании большого объема наблюдений, а также такого выбора числа групп и величины интегралов, при котором наиболее отчетливо могла бы проявиться закономерность.

Анализ вариационных рядов предполагает выявление характера распределения (как результата действия механизма вариации), установление функции распределения, проверку соответствия эмпирического распределения теоретическому.

Эмпирическое распределение, полученное на основе данных наблюдения, графически изображается эмпирической кривой распределения с помощью полигона.

На практике встречаются различные типы распределений, среди которых можно выделить симметричные и асимметричные, одновершинные и многовершинные.

Установить тип распределения, означает выразить механизм формирования закономерности в аналитической форме. Многим явлениям и их признакам свойственны характерные формы распределения, которые аппроксимируются соответствующими кривыми. При всем многообразии форм распределения наибольшее распространение в качестве теоретических получили нормальное распределение, распределение Пауссона, биноминальное распределение и др.

Особое место в изучении вариации принадлежит нормальному закону, благодаря его математическим свойствам. Для нормального закона выполняется правило трех сигм, по которому вариация индивидуальных значений признака находится в пределах от величины средней. При этом в границах находится около 70% всех единиц, а в пределах — 95%.

Оценка соответствия эмпирического и теоретического распределений производится с помощью критериев согласия, среди которых широко известны критерии Пирсона, Романовского, Ястремского, Колмогорова.

Вариация - это количественная мера изменения определённых данных, которая помогает исследовать её случайные изменения. Для их анализа применяют различные статистические методы.

О них будет более подробно рассказано в этой статье.

Онлайн-калькулятор показателей вариации

Показатели вариации в статистике

Статистика широко применяется в самых различных областях. Она доказала свою пользу не только в естественных науках, но и в изучении различных социологических явлений, изменений цен, а также в других ситуациях.

Эта наука имеет дело со случайными величинами, изменение которых требует для своего описания использования специальных характеристик. Наиболее известной из них является средняя. Однако, хотя она и включает в себя некоторый объём информации, тем не менее не даёт возможности найти информацию о разбросе случайных данных, а также дать понятие о динамике изменения и наиболее вероятных тенденциях в дальнейшем.


Математический аппарат для изучения вариационных процессов использует характеристики, способы расчёта которых можно разделить на три группы.

В их число входят:

  1. Показатели размаха.
  2. Цифры, дающие понятие о величине отклонения.
  3. Относительные показатели, которые относятся к вариации.

Показатели размаха изменений говорят о том, какова разница между максимальными отклонениями исследуемых чисел:

  • вариационный размах;
  • децильный размах;
  • квартильный размах.

Данные, относящиеся ко второй категории, можно считать так:

  • среднее линейное отклонение;
  • среднее квадратическое;
  • дисперсия.

Для расчёта относительных показателей применяется:

  • относительный квартильный размах;
  • линейный коэффициент;
  • коэффициент вариации.

Далее будет рассказано о наиболее часто применяемых математических характеристиках рассматриваемого понятия.

При проведении статистических вычислениях удобно пользоваться электронными таблицами Excel.

Абсолютные показатели вариации

Когда говорят об абсолютных показателях вариации, имеют в виду следующие методы для проведения статистического анализа:

  1. Размах вариации.
  2. Среднее линейное отклонение.
  3. Среднее квадратичное отклонение.
  4. Дисперсия.

Размах вариации

При рассмотрении изменения исследуемых данных, одной из важных характеристик является размах вариации.


Он равен разности между максимальной и минимальной границами. Посмотрим, как это характеристика исчисляется.

Формула выглядит так:

РВар = ЗнМакс — ЗнМин,

  • РВар — представляет собой искомую характеристику;
  • ЗнМакс — это максимальная цифра за рассматриваемый период;
  • ЗнМин — величина, равная минимальному значению за этот же период.

Пример.

Эта формула может быть применена, например, в следующей ситуации. Предположим, рассматривается рост отобранных случайным образом людей. В этой совокупности десять человек и рост их равен: 165, 172, 179, 190, 182, 171, 191, 183, 177 и 178 сантиметров. Эти цифры составляют совокупность значений случайных данных.

Как можно увидеть в рассматриваемом случае, минимальный рост в этой группе людей составляет 165 см, а максимальный — 191 см. Разница между ними составляет 191 — 165 = 26 см. Таким образом, рассматриваемое значение для определённой таким образом совокупности данных показывает 26 см.

Отклонение вариации

Здесь рассматривается отклонение изучаемой случайной величины. Для того, чтобы его вычислить, необходимо сначала определить её среднее значение.

Чтобы посчитать, необходимо просуммировать все значения случайных данных и затем разделить на их количество. Получившаяся величина представляет собой нужный результат.

В некоторых формулах используются значения весов, придаваемых каждому значению. Кратко говоря, они назначаются в соответствии с целями проведения статистического исследования. Веса обычно подбираются таким образом, чтобы их сумма была равна единице.

Среднее линейное простое

Оценка величины отклонения рассчитывается так:

  1. Сначала нужно определить для каждого случайного значения разницу со средним и взять от неё абсолютную величину.
  2. Затем все эти цифры суммируют и делят полученный результат на количество значений величины, которая изменяется.

Формула выглядит таким образом:

СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|) / n,

  • СЛП — искомая величина;
  • x(i) – i-е значение случайной величины;
  • x0 – среднее значение;
  • n – количество имеющихся цифр.

Вертикальные чёрточки используются для того, чтобы показать, что здесь вычисляется абсолютная разность.

Среднее линейное взвешенное

Для этого потребуется формула:

СЛВ = (|x(1) – x0|*f(1) + |x(2) – x0|*f(2) + … + |x(n) – x(0)|*f(n)) / n,

  • СЛВ — искомая величина;
  • f(i) — вес, который придаётся каждому из значений случайной величины.

Остальные обозначения рассмотрены ранее.

Среднее квадратическое отклонение

В этом случае результат определяется по другому правилу, чем в прежних случаях:

СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2) / n),

  • СКО представляет собой квадратическое отклонение;
  • x**2 представляет собой возведение в квадрат;
  • SQRT() - это операция взятия квадратного корня.

Дисперсия (простая, взвешенная)

Простая дисперсия равна СКО, возведённому в квадрат.

Взвешенная называется так потому, что каждое слагаемое умножается на свой вес.

Здесь применяется формула:

ДВ = (f(1)*(x(1) – x0)**2 + f(2)*(x(2) – x0)**2 + … + f(n)*(x(n) – x(0))**2) / n*(f(1) + f(2) + … + f(n)),

где: ДВ представляет собой дисперсию взвешенную.

Вариация альтернативного признака

Это понятие характеризует те ситуации, когда часть предметов выборки обладает определённым свойством, а другая — нет:

СРЕД = ((1-p) + (0-p)) / (p+q) = p;

ВАР = (q*(1-p)**2+ q*(0-p)**2) / (p+q) = pq.

Здесь СРЕД обозначает среднее, а p и q представляют собой положительные числа, в сумме дающие единицу.

ВАР обозначает искомую величину.

Относительные показатели вариации

В данном случае рассматриваются отношение отклонения и среднего конкретной выборки. Для различных характеристик используются различные способы определения среднего отклонения.


Чем меньше полученный коэффициент, тем более сгруппированы данные. Этот коэффициент не имеет единиц измерения.

Коэффициент осцилляции

Эта величина равна частному от деления размаха вариации на среднее случайной величины.

Коэффициент вариации

Такой коэффициент можно рассчитать путём деления линейного отклонения на такой же знаменатель, как в предыдущем случае.

Относительное линейное отклонение

В данном случае искомое значение рассчитывается как результат деления среднего квадратического на этот же знаменатель.

Примеры расчетов

Здесь будет приведены примеры расчётов. Рассматривается ситуация, когда пять человек устраиваются на новую работу. В данной специальности они проработали различное количество лет: 2, 3, 4, 7 и 9 лет.

X(0) = (2 + 3 + 4 + 7 + 9) / 5 = 25 / 5 = 5.

СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|)/n = (|2 - 5| + |3 - 5| + |4 - 5| + |7 - 5| + |9 – 5|) / 5 = (3 + 2 + 1 + 2 + 4) / 5 = 12 / 5 = 2,4 года.

СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2)/n) = SQRT(((2 – 5)**2 + (3 – 5)**2 + (4 – 5)**2 + (7 – 5)**2 + (9 – 5)**2) / 5) = SQRT((3**2 + 2**2 + 1**2 + 2**2 + 4**2)/5) = SQRT ((9 + 4 + 1 + 4 + 16) / 5) = SQRT(34 / 5) = SQRT(6,80) = 2,61 года (приблизительное значение).

Последнее значение равно СКО, возведённому в квадрат.

В большинстве случаев расчет представляет собой гораздо более сложную задачу, чем показано в приведённом примере. Для облегчения процесса вычислений можно использовать онлайн калькулятор.

Заключение

Изучение случайных процессов играет важную роль в науке, экономике и общественной жизни. Для того, чтобы получить максимальное количество информации при их изучении, нужно активно использовать статистические методы, в том числе те, которые связаны с вариацией.

Читайте также: