Дисперсия альтернативного признака реферат
Обновлено: 06.07.2024
Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Примером таких признаков являются наличие бракованной продукции, ученая степень преподавателя вуза, учеба по определенной специальности и т. д.
Предположим, что вся статистическая совокупность имеет nединиц. Из нихmединиц обладают выделенным признаком, тогда оставшиесяn–mединиц не обладают этим признаком.
Долю единиц, обладающих признаком, обозначим: , тогда пусть– доля единиц, не обладающих данным признаком.
Единицам х,обладающим данным признаком, присвоим значениех= 1, а не обладающим –х= 0.
Среднее значение альтернативного признака:
=р.
То есть среднее значение альтернативного признака равно доле единиц, обладающих данным признаком.
Дисперсия альтернативного признака:
σ 2 =
То есть дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, не обладающих данным признаком.
Пример:5% изготовленных изделий – брак, тогда 95% изделий годных. Дисперсия доли брака равна: σ 2 = 0,050,95 = 0,0475, а среднее квадратическое отклонение доли брака составляет σ =или 22%.
Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при р=q= 0,5.
3. Дисперсионный анализ
Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсий:общей, межгрупповой и внутригрупповой.
Общая дисперсия σ 2 общизмеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей по совокупности средней и может быть вычислена по формуле простой или взвешенной дисперсии.
Межгрупповая дисперсия σ 2 межгр характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:
σ 2 межгр= ,
где f — численность единиц в группе.
Внутригрупповая (частная) дисперсия σ 2 i отражает случайную вариацию, т. е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы х от средней арифметической этой группы (групповой средней) и может быть исчислена по формуле простой или взвешенной дисперсии:
σ 2 i= (простая формула);
σ 2 i= (взвешенная).
На основании внутригрупповой дисперсии по каждой группе (σ 2 i) можно определить общую среднюю из внутригрупповых дисперсий:
= .
Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:
σ 2 общ= σ 2 межгр+ .
Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью — неизвестную, а также судить о силе влияния группировочного признака.
Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак.
В статистическом анализе широко используется эмпирический коэффициент детерминации (η 2 ) — показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:
η 2 = .
Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обусловливается вариацией прочих факторов). При отсутствии связи эмпирический коэффициент детерминации η 2 равен нулю, а при функциональной связи — единице. Если, например η 2 = 0,666, это значит, что на 66,6% вариация исследуемого показателя обусловлена различиями в значениях признака-фактора, положенного в основание группировки, и на 33,4% — влиянием прочих факторов.
Эмпирическое корреляционное отношение — это корень квадратный из эмпирического коэффициента детерминации:
η = .
Оно показывает тесноту связи между группировочным и результативным признаками.
Эмпирическое корреляционное отношение η, как и η 2 , может принимать значения от 0 до 1.
Если связь отсутствует, то корреляционное отношение η = 0, т. е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации.
Если связь функциональная, то корреляционное отношение η = 1. В этом случае межгрупповая дисперсия равна общей дисперсии (σ 2 межгр = σ 2 ), т. е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.
Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.
Читайте также: