Дисперсия альтернативного признака реферат

Обновлено: 06.07.2024

Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Примером таких признаков являются наличие бракованной продукции, ученая степень преподавателя вуза, учеба по определенной специальности и т. д.

Предположим, что вся статистическая совокупность имеет nединиц. Из нихmединиц обладают выделенным признаком, тогда оставшиесяnmединиц не обладают этим признаком.

Долю единиц, обладающих признаком, обозначим: , тогда пусть– доля единиц, не обладающих данным признаком.

Единицам х,обладающим данным признаком, присвоим значениех= 1, а не обладающим –х= 0.

Среднее значение альтернативного признака:


=р.

То есть среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.

Дисперсия альтернативного признака:


σ 2 =


То есть дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.


Пример:5% изготовленных изделий – брак, тогда 95% изделий годных. Дисперсия доли брака равна: σ 2 = 0,050,95 = 0,0475, а среднее квадратическое отклонение доли брака составляет σ =или 22%.

Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при р=q= 0,5.

3. Дисперсионный анализ

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий:общей, межгрупповой и внутригрупповой.


Общая дисперсия σ 2 общизмеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей по совокупности средней и может быть вычислена по формуле простой или взвешенной дисперсии.

Межгрупповая дисперсия σ 2 межгр характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:


σ 2 межгр= ,

где f — численность единиц в группе.


Внутригрупповая (частная) дисперсия σ 2 i отражает случайную вариацию, т. е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы (групповой средней) и может быть исчислена по формуле простой или взвешенной дисперсии:


σ 2 i= (простая формула);


σ 2 i= (взвешенная).

На основании внутригрупповой дисперсии по каждой группе (σ 2 i) можно определить общую среднюю из внутригрупповых дисперсий:

= .

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:


σ 2 общ= σ 2 межгр+ .

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью — неизвестную, а также судить о силе влияния группировочного признака.

Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак.

В статистическом анализе широко используется эмпирический коэффициент детерминации (η 2 ) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:


η 2 = .

Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обусловливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации η 2 равен нулю, а при функциональной связи — единице. Если, например η 2 = 0,666, это значит, что на 66,6% вариация исследуемого показателя обусловлена различиями в значениях признака-фактора, положенного в основание группировки, и на 33,4% — влиянием прочих факторов.

Эмпирическое корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации:


η = .

Оно показывает тесноту связи между группировочным и результативным признаками.

Эмпирическое корреляционное отношение η, как и η 2 , может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение η = 0, т. е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение η = 1. В этом случае межгрупповая дисперсия равна общей дисперсии (σ 2 межгр = σ 2 ), т. е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Читайте также: