Дисперсия это кратко в эконометрике

Обновлено: 02.07.2024

Дисперсия - это мера разброса значений случайной величины $X$ относительно ее математического ожидания $M(X)$ (см. как найти математическое ожидание случайной величины). Дисперсия показывает, насколько в среднем значения сосредоточены, сгруппированы около $M(X)$: если дисперсия маленькая - значения сравнительно близки друг к другу, если большая - далеки друг от друга (см. примеры нахождения дисперсии ниже).

Если случайная величина описывает физические объекты с некоторой размерностью (метры, секунды, килограммы и т.п.), то дисперсия будет выражаться в квадратных единицах (метры в квадрате, секунды в квадрате и т.п.). Ясно, что это не совсем удобно для анализа, поэтому часто вычисляют также корень из дисперсии - среднеквадратическое отклонение $\sigma(X)=\sqrt$, которое имеет ту же размерность, что и исходная величина и также описывает разброс.

Еще одно формальное определение дисперсии звучит так: "Дисперсия - это второй центральный момент случайной величины" (напомним, что первый начальный момент - это как раз математическое ожидание).

Формула дисперсии случайной величины

Дисперсия случайной величины Х вычисляется по следующей формуле: $$ D(X)=M(X-M(X))^2, $$ которую также часто записывают в более удобном для расчетов виде: $$ D(X)=M(X^2)-(M(X))^2. $$

Эта универсальная формула для дисперсии может быть расписана более подробно для двух случаев.
Если мы имеем дело с дискретной случайной величиной (которая задана перечнем значений $x_i$ и соответствующих вероятностей $p_i$), то формула принимает вид: $$ D(X)=\sum_^-\left(\sum_^ \right)^2. $$ Если же речь идет о непрерывной случайной величине (заданной плотностью вероятностей $f(x)$ в общем случае), формула дисперсии Х выглядит следующим образом: $$ D(X)=\int_<-\infty>^ <+\infty>f(x) \cdot x^2 dx - \left( \int_<-\infty>^ <+\infty>f(x) \cdot x dx \right)^2. $$

Пример нахождения дисперсии

Рассмотрим простые примеры, показывающие как найти дисперсию по формулам, введеным выше.

Пример 1. Вычислить и сравнить дисперсию двух законов распределения: $$ x_i \quad 1 \quad 2 \\ p_i \quad 0.5 \quad 0.5 $$ и $$ y_i \quad -10 \quad 10 \\ p_i \quad 0.5 \quad 0.5 $$

Для убедительности и наглядности расчетов мы взяли простые распределения с двумя значениями и одинаковыми вероятностями. Но в первом случае значения случайной величины расположены рядом (1 и 2), а во втором - дальше друг от друга (-10 и 10). А теперь посмотрим, насколько различаются дисперсии: $$ D(X)=\sum_^-\left(\sum_^ \right)^2 =\\ = 1^2\cdot 0.5 + 2^2 \cdot 0.5 - (1\cdot 0.5 + 2\cdot 0.5)^2=2.5-1.5^2=0.25. $$ $$ D(Y)=\sum_^-\left(\sum_^ \right)^2 =\\ = (-10)^2\cdot 0.5 + 10^2 \cdot 0.5 - (-10\cdot 0.5 + 10\cdot 0.5)^2=100-0^2=100. $$ Итак, значения случайных величин различались на 1 и 20 единиц, тогда как дисперсия показывает меру разброса в 0.25 и 100. Если перейти к среднеквадратическому отклонению, получим $\sigma(X)=0.5$, $\sigma(Y)=10$, то есть вполне ожидаемые величины: в первом случае значения отстоят в обе стороны на 0.5 от среднего 1.5, а во втором - на 10 единиц от среднего 0.

Ясно, что для более сложных распределений, где число значений больше и вероятности не одинаковы, картина будет более сложной, прямой зависимости от значений уже не будет (но будет как раз оценка разброса).

Пример 2. Найти дисперсию случайной величины Х, заданной дискретным рядом распределения: $$ x_i \quad -1 \quad 2 \quad 5 \quad 10 \quad 20 \\ p_i \quad 0.1 \quad 0.2 \quad 0.3 \quad 0.3 \quad 0.1 $$

Снова используем формулу для дисперсии дискретной случайной величины: $$ D(X)=M(X^2)-(M(X))^2. $$ В случае, когда значений много, удобно разбить вычисления по шагам. Сначала найдем математическое ожидание: $$ M(X)=\sum_^ =-1\cdot 0.1 + 2 \cdot 0.2 +5\cdot 0.3 +10\cdot 0.3+20\cdot 0.1=6.8. $$ Потом математическое ожидание квадрата случайной величины: $$ M(X^2)=\sum_^ = (-1)^2\cdot 0.1 + 2^2 \cdot 0.2 +5^2\cdot 0.3 +10^2\cdot 0.3+20^2\cdot 0.1=78.4. $$ А потом подставим все в формулу для дисперсии: $$ D(X)=M(X^2)-(M(X))^2=78.4-6.8^2=32.16. $$ Дисперсия равна 32.16 квадратных единиц.

Пример 3. Найти дисперсию по заданному непрерывному закону распределения случайной величины Х, заданному плотностью $f(x)=x/18$ при $x \in(0,6)$ и $f(x)=0$ в остальных точках.

Вычисление дисперсии онлайн

Как найти дисперсию онлайн для дискретной случайной величины? Используйте калькулятор ниже.

  • Введите число значений случайной величины К.
  • Появится форма ввода для значений $x_i$ и соответствующих вероятностей $p_i$ (десятичные дроби вводятся с разделителем точкой, например: -10.3 или 0.5). Введите нужные значения (проверьте, что сумма вероятностей равна 1, то есть закон распределения корректный).
  • Нажмите на кнопку "Вычислить".
  • Калькулятор покажет вычисленное математическое ожидание $M(X)$ и затем искомое значение дисперсии $D(X)$.

Видео. Полезные ссылки

Видеоролики: что такое дисперсия и как найти дисперсию

Если вам нужно более подробное объяснение того, что такое дисперсия, как она вычисляется и какими свойствами обладает, рекомендую два видео (для дискретной и непрерывной случайной величины соответственно).

Полезные ссылки

Что еще может пригодиться? Например, для изучения основ теории вероятностей - онлайн учебник по ТВ. Для закрепления материала - еще примеры решений задач по теории вероятностей.

А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике или заказать в МатБюро:

Наряду с изучением вариации признака по всей по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.
Выделяют дисперсию общую, межгрупповую и внутригрупповую.
Общая дисперсия σ 2 измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию, .

Отсюда и международное обозначение дисперсии, как меры вариации: Var(x) . Другие обозначения: D(x), σ 2 , S 2

Межгрупповая дисперсия (δ) характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:
.

Внутригрупповая дисперсия (σ) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она вычисляется по формуле:
.

Средняя из внутригрупповых дисперсий: .

Существует закон, связывающий 3 вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсии: σ= σ² i+δ²i .
Данное соотношение называют правилом сложения дисперсий.

В анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации (η 2 ): .
Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения (η):
.
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1.
Покажем его практическое использование на следующем примере (табл. 1).

Исходные данные для вычисления средней из внутригрупповых и межгрупповой дисперсии представлены в табл. 2.
Таблица 2
Расчет и δ 2 по двум группам рабочих.


Группы рабочих
Численность рабочих, чел. Средняя, дет./смен. Дисперсия
Прошедшие техническое обучение 5 95 42,0
Не прошедшие техническое обучение 5 81 231,2
Все рабочие 10 88 185,6
Рассчитаем показатели. Средняя из внутригрупповых дисперсий:

Общая дисперсия: σ²= σ² ii² = 136.6+49.0=185.6
Таким образом, эмпирическое корреляционное соотношение: .

Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков. Такое изучение вариации достигается посредством вычисления следующих видов дисперсий:

Внутригрупповая дисперсия доли определяется по формуле:
σ²pi=pi(1-pi) (1)

Средняя из внутригрупповых дисперсий рассчитывается так:
(2)

Формула межгрупповой дисперсии имеет вид:
, (3)
где ni – численность единиц в отдельных группах.

Доля изучаемого признака во всей совокупности, которая определяется по формуле:
(4)

Три вида дисперсии связаны между собой следующим образом:
σ²p= σ² pipi²

Это соотношение дисперсий называется теоремой сложения дисперсий доли признака.

Пример №2 . Имеются следующие данные об удельном весе основных рабочих в трех цехах фирмы (табл. 2).
Таблица 2 - Удельный вес основных рабочих фирмы

Цех Удельный вес основных рабочих, в %, pi Численность всех рабочих, человек, ni
1 80 100
2 75 200
3 90 150
Итого 450
1) Определим долю основных рабочих в целом по фирме:


2) Общая дисперсия доли основных рабочих по всей фирме в целом будет равна σ 2 p=0.81·(1-0.81)=0.154.
3) Внутрицеховые дисперсии рассчитаем, применив формулу (1): σ²p1=0.8·0.2=0.16; σ²p2=0.75·0.25=0.19; σ²p3=0.9·0.1=0.09.
4) Средняя из внутригрупповых дисперсий будет равна (формула 5.2):

Проверка вычислений показывает: 0,154 = 0,15 + 0,004.

Дисперсионный анализ

Свойства дисперсии

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):
,
,

среднее квадратическое отклонение (σ):
(простое среднеквадратическое отклонение),
(взвешенное среднеквадратическое отклонение).
Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности. Оно выражается в тех же единицах, что и признак.

Расчет дисперсии может быть упрощен. В случае равных интервалов в вариационном ряду распределения используется способ отсчета от условного нуля (способ моментов). Для его понимания необходимо знать следующие свойства дисперсии:

Свойство 1 . Дисперсия постоянной величины равна нулю.

Свойство 2 . Уменьшение всех значений признака на одну и ту же величину A не меняет величины дисперсии σ²(X-A)=σ²X. Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-либо постоянного числа.

Свойство 3 . Уменьшение всех значений признака в K раз уменьшает дисперсию в K 2 раз, а среднее квадратическое отклонение в K раз . Значит, все значения признака можно разделить на какое-то постоянное число, например, на величину интервала ряда, исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число: σXX/K·K.

Свойство 4 . Если вычислить средний квадрат отклонений от любой величины A , в той или иной степени отличающейся от средней арифметической ( x ), то он всегда будет больше среднего квадрата отклонений, вычисленного от средней арифметической σ²A>σ²X . Средний квадрат отклонений при этом будет больше на величину ( x –A) 2 :

Значит, дисперсия от средней величины всегда меньше дисперсий, вычисленных от любых других величин, т.е. она имеет свойство минимальности.
см. также свойства дисперсии для дискретной случайной величины

Рассмотрим расчет дисперсии и среднего квадратического отклонения по данным таблицы.
Таблица - Вычисление σ 2 и σ по несгруппированным данным.

Хозяйство Валовой сбор, ц, x xi– x (xi– x ) 2
А 1 2 3
1 600 100 10 000
2 520 20 400
3 400 -100 10 000
4 600 100 10 000
5 500 0 0
6 380 -120 14 400
ИТОГО 3000 0 44 800

1) Определим среднюю величину по исходным данным (гр.1) по формуле средней арифметической простой:
.

2) Находим отклонения xi от и записываем их в гр. 2. Возводим отклонения во вторую степень, отводим для них гр. 3. Их сумма – 44 800.

3) Разделив ее на число единиц совокупности, получаем дисперсию:
.

4) Извлекая корень из второй степени получаем среднее квадратичное отклонение равное 86,4099 .
Степень вариации в данной совокупности не велика, т.к. средняя величина равна 500 ц. Это говорит об однородности рассматриваемой нами совокупности.

Рассмотрим вычисление дисперсии и среднеквадратического отклонения по сгруппированным данным табл. 5.3.
Таблица 5.3 - Расчет σ 2 и σ в двух вариационных рядах с разным распределением частот.

НПО “Платан” НПО “Исток”
тариф, разряд xi число работников, fi xi– x (xi– x ) 2 (xi– x ) 2 fi тариф, разряд xi число работников, fi xi– x (xi– x ) 2 (xi– x ) 2 fi
12 1 -3 9 9 12 30 -3 9 270
13 5 -2 4 20 13 20 -2 4 80
14 30 -1 1 30 14 10 -1 1 10
15 60 0 0 0 15 50 0 0 0
16 30 1 1 30 16 10 1 1 10
17 5 2 4 20 17 20 2 4 80
18 1 3 9 9 18 30 3 9 270
Итого 132 118 170 720

На математических свойствах дисперсии основываются способы, которые позволяют упростить ее вычисление. Например, расчет дисперсии по способу моментов или способу отсчета от условного нуля применяется в вариационных рядах с равными интервалами. Расчет производится по формуле:
,
где K – ширина интервала;
A – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
– момент второго порядка.

Что такое дисперсия в статистике

Статистика, в частности, оперирует рядами данных, характеризующих какой-либо признак, явление. Интересует их изменение.

Вариация представляет собой отличие величин одинакового показателя у разных предметов. Ее изучение позволит понять причины отклонений от нормы, анализировать их и в какой-то мере прогнозировать. Также станет возможным выявить факторы, влияющие на значения, отсеяв случайные.

Характеристики равномерного распределения представлены на картинке:

Характеристики равномерного распределения

При значительном объеме статистики, средняя величина очевидно близка к нормальной. Об этом говорят и законы распределения. Отклонения от нее будут являться объективной характеристикой.

Только вот отрицательные значения этих разбросов будут сбивать с толку при расчетах, погашая положительные. А оставлять лишь модули – для математика не корректно. Напрашивается возвести в четную степень, а именно – во вторую.

Решение оказалось не только удобным. Оно открыло бо́льшие возможности в изучении отклонений. А важны именно они, поскольку сама по себе средняя мало что дает.

Что такое дисперсия в статистике

Формула дисперсии

Никакого наглядного смысла величина не несет. Другое дело, среднее квадратическое отклонение – корень квадратный из дисперсии.


Виды дисперсии дискретной случайной величины

Для анализа данных цифр в таком виде недостаточно. Гораздо больше можно выжать из последовательности, если разбить ее на группы по определенному признаку.

Общая дисперсия

Простая дисперсия, без разделения на группы:

Или в несколько преобразованном виде:

Взвешенная дисперсия, для вариационного ряда:

где xi – значение из ряда;

fi – частота, количество повторений;

n – число вариантов.

Черта сверху указывает на среднюю величину.

Межгрупповая дисперсия

Как найти данную дисперсию? По формуле:

где k – количество групп;

nj – элементов в группе с индексом j.

Внутригрупповая дисперсия

Например, рассматривается количество выпущенных деталей за месяц каждым фрезеровщиком цеха.

В качестве критерия отбора в группу выбираем возраст оборудования. Он-то и не будет влиять на производительность внутри подборки: там станки у всех практически одинаковые.

Если вычислить среднюю величину от всех групповых,

то получим характеристику случайного разброса. Иными словами, составляющую вариации, зависящую от чего угодно, кроме фактора отбора.

Взаимосвязь

В соответствии с правилом сложения, общая D[X] включает средние выражения остаточной и факторной. И это логично, поскольку учитывает и случайное изменение в группе, и систематическое в факторной.


Свойства дисперсии

Свойства дисперсии

Если последовательность состоит из одинаковых чисел, то D[X] будет нулевой.

Уменьшение всех значений на постоянную величину на дисперсию не влияет. Иначе говоря, рассчитать σ 2 можно по отклонениям от фиксированного числа.

Уменьшение всех цифр в k раз приведет к падению D[X] в k 2 раз. Можно, например, иметь в виду значения в метрах, а результат вычислить в футах. Достаточно учесть один раз то, на что следует умножить.

Средний квадрат отклонений от постоянной величины X отличается в большую сторону от того же с использованием среднего значения. Разница составит (Xcр – X) 2 .

Показатели вариаций

Кроме размаха (разницы максимального и минимального значений), среднего линейного и дисперсии, изменения описываются коэффициентом вариации:

Оценить масштаб разброса проще по относительной величине. Тем более, что измеряются в одних единицах.

Пример расчета дисперсии

Компания объявила конкурсный отбор для приема сотрудников. В качестве критерия принят стаж работы по специальности. Приведем исходные данные и расчеты.

111

112

114

По альтернативной формуле:

115

116

117


Заключение

Статистика оперирует значительными объемами данных. Вариация, как одно из основных понятий – не исключение. И дисперсия в качестве основной характеристики.

Для упрощения расчетов существует масса онлайн калькуляторов. Имеется упомянутый инструмент в MS Excel.


Дисперсия –это показатель вариации, выражающий средний квадрат отклонений вариантов от средней величины. В зависимости от образующих вариацию факторов различают общую, межгрупповую и внутригрупповую дисперсию.

1.Общая дисперсия - образуется под вилянием совокупного действия всех факторов на изучаемое явление. Общая дисперсия определяется по формулам:

2.Межгрупповая дисперсия - характеризует влияние на колеблемость изучаемого признака лишь группировочного признака.Она представляет собой средний квадрат отклонения групповых средних от общей средней :

- число единиц в группах;

3.Внутригрупповая дисперсия - характеризует в группах статистической совокупности влияние на колеблемость изучаемого признака прочих факторов, кроме группировочного. Это вариация, которая осталась в группах после расчленения статистической совокупности на однородные группы.

Частные или внутригрупповые дисперсии – это дисперсии, вычисленные для каждой группы совокупности. Служат они для характеристики рассеяния признака в каждой группе:

где - суммирование по каждой группе.

Обобщающей характеристикой внутри-групповой дисперсии является средняя внутригрупповая дисперсия :

Между общей, межгрупповой и средней внутригрупповой дисперсией имеется зависимость, которая выражается формулой:

4.Эмпирический коэффициент детерминации :

5. Корреляционное отношение

Показывает тесноту связи между группировочным и результативным признаком.

6. Дисперсия альтернативного признака

Среди варьирующих признаков, которые изучает статистика, имеются признаки, вариация которых проявляется в том, что у одних единиц совокупности они встречаются, а у других нет.

Признаки, которыми обладают одни единицы и не обладают другие, называются альтернативными.

Колеблемость альтернативного признака измеряется дисперсией

где p – доля вариантов, обладающих данным признаком;

g - доля вариантов, не обладающих данным признаком.

где - доля изучаемого признака во всей совокупности, определяемая по формуле:

где - групповые доли;

- число единиц в группах.

Среднее квадратическое отклонение альтернативного признака вычисляется по формуле:

Дисперсия –это показатель вариации, выражающий средний квадрат отклонений вариантов от средней величины. В зависимости от образующих вариацию факторов различают общую, межгрупповую и внутригрупповую дисперсию.

1.Общая дисперсия - образуется под вилянием совокупного действия всех факторов на изучаемое явление. Общая дисперсия определяется по формулам:

2.Межгрупповая дисперсия - характеризует влияние на колеблемость изучаемого признака лишь группировочного признака.Она представляет собой средний квадрат отклонения групповых средних от общей средней :

- число единиц в группах;

3.Внутригрупповая дисперсия - характеризует в группах статистической совокупности влияние на колеблемость изучаемого признака прочих факторов, кроме группировочного. Это вариация, которая осталась в группах после расчленения статистической совокупности на однородные группы.

Частные или внутригрупповые дисперсии – это дисперсии, вычисленные для каждой группы совокупности. Служат они для характеристики рассеяния признака в каждой группе:

где - суммирование по каждой группе.

Обобщающей характеристикой внутри-групповой дисперсии является средняя внутригрупповая дисперсия :

Между общей, межгрупповой и средней внутригрупповой дисперсией имеется зависимость, которая выражается формулой:

4.Эмпирический коэффициент детерминации :

5. Корреляционное отношение

Показывает тесноту связи между группировочным и результативным признаком.

6. Дисперсия альтернативного признака

Среди варьирующих признаков, которые изучает статистика, имеются признаки, вариация которых проявляется в том, что у одних единиц совокупности они встречаются, а у других нет.




Признаки, которыми обладают одни единицы и не обладают другие, называются альтернативными.

Колеблемость альтернативного признака измеряется дисперсией

где p – доля вариантов, обладающих данным признаком;

g - доля вариантов, не обладающих данным признаком.

где - доля изучаемого признака во всей совокупности, определяемая по формуле:

где - групповые доли;

- число единиц в группах.

Среднее квадратическое отклонение альтернативного признака вычисляется по формуле:

Читайте также: