Вариация альтернативного признака кратко

Обновлено: 30.06.2024

Альтернативный признак – качественный признак, имеющий две взаимоисключающие разновидности (например, работники предприятия подразделяются на мужчин и женщин; продукция – на годную и бракованную и т.д.).

Альтернативный признак принимает всего два значения:

1 – наличие признака; 0 – отсутствие признака.

где р – доли единиц, обладающих признаком;

q – доли единиц, не обладающих признаком.

Среднее значение альтернативного признака

Дисперсия альтернативного признака

Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, на долю единиц, не обладающим данным признаком.

Предельное значение вариации альтернативного признака равно 0,25; оно получается при p = q = 0,5.

Пример. Если, например, 2% всех деталей бракованные (р = 0,02), то 98% − годные (q = 0,98), тогда дисперсия доли брака .

Среднее квадратическое отклонение доли брака составит:

Правило сложения дисперсий

Правило сложения дисперсий гласит, что общая дисперсия ( ) может быть разложена на две составные части: 1) межгрупповую ( ) и 2) среднюю из внутригрупповых ( )

Общая дисперсия измеряет вариацию результативного признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений результативного признака от его средней величины и может быть вычислена как простая дисперсия или взвешенная.

Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней :

где - среднее значение признака i-й группы; f – численность единиц в группе.

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений результативного признака внутри группы у от средней арифметической этой группы (групповой средней) и может быть исчислена как простая дисперсия или как взвешенная дисперсия по формулам, соответственно:

На основании внутригрупповой дисперсии по каждой группе можно определить общую среднюю из внутригрупповых дисперсий:

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную, а также судить о силе влияния группировочного признака.

В статистическом анализе широко используется эмпирический коэффициент детерминации ( ) – показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

Эмпирический коэффициент детерминации показывает долю вариации результативного признака у под влиянием факторного признака х. При отсутствии связи коэффициент детерминации равен нулю, а при функциональной связи – единице.

Эмпирическое корреляционное отношение – это корень квадратный из эмпирического коэффициента детерминации:

оно показывает тесноту связи между группировочным и результативным признаками.

Эмпирическое корреляционное отношение, как и коэффициент детерминации, может принимать значения от 0 до 1.

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Для качественной оценки тесноты связи на основе показателей эмпирического корреляционного отношения можно воспользоваться шкалой Чэддока:

η 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Сила связи Слабая Умеренная Заметная Тесная Весьма тесная

Пример. (Гусаров)

Пусть при изучении влияния квалификации (тарифного разряда) рабочих на уровень производительности труда в цехе были получены данные, представленные в табл.

Распределение рабочих по среднечасовой выработке изделий

№ п/п Рабочие IV разряда № п/п Рабочие V разряда
Выработка рабочего, шт. (yi) Выработка рабочего, шт. (yi)
-3 -1
-1 -1
-1
Σ - Σ -

Для результативного признака исчислить:

1) групповые дисперсии;

2) среднюю из внутригрупповых дисперсий;

3) межгрупповую дисперсию;

4) общую дисперсию;

5) проверить правильность сложения дисперсий.

В этом примере данные группируются по квалификации (тарифному разряду) рабочих, являющейся факторным признаком х.

Результативный признак y варьирует как под влиянием систематического фактора х – квалификации (межгрупповая вариация), так и других неучтенных случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью дисперсий: общей, межгрупповой и внутригрупповых.

1. Для расчета групповых дисперсий исчислим средние выработки по каждой группе и общую среднюю выработку, шт.:

по первой группе ;

по второй группе ;

по двум группам .

Данные для расчета дисперсий по группам представлены в табл. Подставив необходимые значения в формулу, получим внутригрупповые дисперсии:

по первой группе ;

по второй группе .

Внутригрупповые дисперсии показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудование, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме различий в квалификационном разряде (внутри группы все рабочие имеют одну квалификацию).

2.Рассчитаем среднюю из внутригрупповых дисперсий по формуле:

Средняя из внутригрупповых дисперсий отражает вариацию выработки, обусловленную всеми факторами, кроме квалификации рабочих, но в среднем по всей совокупности.

3.Исчислим межгрупповую дисперсию по формуле:

Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квалификационному разряду.

4. Исчислим общую дисперсию по формуле:

Общая дисперсия отражает суммарное влияние всех возможных факторов на общую вариацию среднечасовой выработки изделий всеми рабочими цехами.

5.Суммирование средней из внутригрупповых дисперсий и межгрупповой дает общую дисперсию:

Очевидно, чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака (классификационного разряда) на изучаемый признак (количество изготовляемых изделий).

Экономическая сущность инвестиций - Экономическая сущность инвестиций – долгосрочные вложения экономических ресурсов сроком более 1 года для получения прибыли путем.
Тема: Федеральный закон от 26.07.2006 N 135-ФЗ - На основании изучения ФЗ № 135, дайте максимально короткое определение следующих понятий с указанием статей и пунктов закона.
Сущность, функции и виды управления в телекоммуникациях - Цели достигаются с помощью различных принципов, функций и методов социально-экономического менеджмента.
Схема построения базисных индексов - Индекс (лат. INDEX – указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления.
Тема 11. Международное космическое право - Правовой режим космического пространства и небесных тел. Принципы деятельности государств по исследованию.

Среди множества варьирующих признаков существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Например, ученая степень у преподавателя вуза. Вариация альтернативного признака качественно проявляется в значении нуля у единиц, которые этим признаком не обладают или в значении единицы у тех, которые данный признак имеют.
Пусть n – число единиц совокупности; m – число единиц совокупности, обладающих данным признаком; p – доля единиц, обладающих данным признаком (p=m/n); q - доля единиц, не обладающих данным признаком, причем p+q =1.
Альтернативный признак принимает всего два значения – 0 и 1 с весами соответственно q и p. Вычислим среднее значение альтернативного признака по формуле средней арифметической:
.
Дисперсия альтернативного признака определяется по формуле:

где R – среднеквадратическое отклонение альтернативного признака.
Вычислим дисперсию альтернативного признака по следующим данным: налоговой инспекций одного из районов города проверено 86 коммерческих киосков и в 37 обнаружены финансовые нарушения. Тогда


Следовательно, дисперсия и среднее квадратическое отклонение доли коммерческих киосков, имеющих финансовые нарушения, во всей совокупности обследованных киосков равны:


Обобщенной характеристикой различий внутри ряда может служить энтропия распределения. Применительно к статистике энтропия – это мера неопределенности данных наблюдения, которая может иметь различные результаты.

Показатель энтропии (Hx):
,
где pi – вероятность события xi.

Расчет энтропии распределения можно показать на примере выпуска продукции различных сортов на одном из предприятий точного машиностроения (табл. 5.4).
Таблица 5.4 - Вероятности различных сортов продукции

Сорт 1-й 2-й 3-й Брак Итого
Вероятность, pi 0,90 0,04 0,05 0,01 1,00

Энтропия данного распределения равна:
H(x)=-(0,9·log20,9+0,04·log20,04 + 0,05·log20,05 + 0,01·log20,01) = 0,6051 бита

Альтернативными являются признаки, которыми обладают одни единицы изучаемой совокупности и не обладают другие (например, таким признаком может быть наличие детей). Наличие изучаемого признака обозначается 1, а его отсутствие - 0.

Обозначим число единиц совокупности, обладающих изучаемым признаком, , а долю этих единиц во всей совокупности . Число единиц, не обладающих признаком, обозначим , а их долю во всей совокупности . .

Альтернативный признак принимает два значения – 0 и 1 с весами соответственно и . Среднее значение альтернативного признака

Дисперсия альтернативного признака определяется по формуле

Лекция 6. Изучение динамики общественных явлений

Ряды динамики. Классификация динамических рядов

Ряд динамики, хронологический ряд, динамический ряд, временной ряд – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Всякий ряд динамики включает, следовательно, два обязательных элемента: во-первых, время и, во-вторых, конкретное значение показателя, или уровень ряда. Ряды динамики различаются по следующим признакам.

1. По времени – моментные и интервальные ряды. Интервальный ряд динамики – последовательность, в которой уровень явления относится к результату, накопленному или вновь произведенному за определенный интервал времени. Таковы, например, ряды показателей объема продукции по месяцам года, количества отработанных человеко-дней по отдельным периодам и т.д. Если же уровень ряда показывает фактическое наличие изучаемого явления в конкретный момент времени, то совокупность уровней образует моментный ряд динамики. Примерами моментных рядов могут быть последовательности показателей численности населения на начало года, величины запаса какого-либо материала на начало периода и т.д. Важное аналитическое отличие моментных рядов от интервальных состоит в том, что сумма уровней интервального ряда дает вполне реальный показатель – общий выпуск продукции за год, общие затраты рабочего времени, общий объем продаж акций и т.д., сумма же уровней моментного ряда, хотя иногда и подсчитывается, но реального содержания, как правило, не имеет.

2. По форме представления уровней – ряды абсолютных, относительных и средних величин (табл. 6.1 – 6.3).

3. По расстоянию между датами или интервалам времени выделяют полные и неполные хронологические ряды.

Полные ряды динамики имеют место, когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Это равноотстоящие ряды динамики (см. табл. 6.1 и 6.2). Неполные – когда принцип равных интервалов не соблюдается (см. табл. 6.3).

Объем продаж долларов США на ММВБ, млн. долл.

Дата 10.01.94 11.01.94 12.01.94 13.01.94
Объем продаж 126,750 124,300 148,800 141,400

Индекс инфляции в 1993 г. (на конец периода, в % к декабрю 1992 г.)

Период Январь Февраль Март Апрель Май Июнь
Индекс инфляции 126 162 190 221 264 310

Потребление основных продуктов питания на одного члена семьи, кг/год

Продукты 1980 1985 1990 1991 1992 1993
Мясо и мясопродукты 80,0 78,4 74,1 68,3 58,7 63,2
Молоко и молочные продукты 411,2 389,6 378,9 345,4 280,4 285,6
Хлебные продукты 101,2 91,6 85,7 91,8 98,0 105,81

Чтобы о развитии явления можно было получить представление при помощи числовых уровней, при составлении ряда динамики должны приводиться в сопоставительный вид.

Статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии расчета. Сопоставимость по территории означает, что данные по странам и регионам, границы которых изменились, должны быть пересчитаны в старых пределах. Сопоставимость по кругу охватываемых объектов означает сравнение совокупностей с равным числом элементов. Территориальная и объемная сопоставимость обеспечивается смыканием рядов динамики, при этом либо абсолютные уровни заменяются относительными, либо делается пересчет в условные абсолютные уровни. Не возникает особых сложностей при обеспечении сопоставимости данных по единицам измерения; стоимостная сравнимость достигается системой сопоставимых цен.

Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями.

Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными (наличие бракованной продукции, работа по полученной специальности и т.д., пол и др.).

Вариация альтернативного признака качественно проявляется в значении нуля у единиц, которые этим признаков не обладают, и единицы у тех, которые данный признак имеют. Таким образом, альтернативный признак принимает всего два значения:

ü р =1 – доли единиц, обладающих данным признаком;

ü q=0 – доли единиц, не обладающих данным признаком.

Следовательно, p + q = 1.

Среднее значение альтернативного признака определяется по формуле средней арифметической: .

Дисперсия альтернативного признака определяется по формуле:

Предельное значение дисперсии альтернативного признака равно 0,25; оно получается при p= q = 0,5.

Показатели вариации альтернативных признаков широко используются в статистике, например, при проектировании выборочного наблюдения, обработке данных социологических обследований, статистическом контроле качества продукции и др.

Читайте также: