Статистическое изучение вариации реферат

Обновлено: 05.07.2024

Содержание

ПОНЯТИЕ ВАРИАЦИИ И ЗАДАЧИ ЕЕ ИЗУЧЕНИЯ……………………………………. 2
ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ В СТАТИСТИЧЕСКОМ ИССЛЕДОВАНИИ………………………………………………3-5
ОПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА ВАРИАЦИИ………………………………………..6-7
СПИСОК ЛИТЕРАТУРЫ………………………………………………………………………..8

Работа содержит 1 файл

Статистика.docx

Омский Государственный Институт Сервиса

Реферат по дисциплине:

Общая теория статистики

Применение показателей вариации в статистическом исследовании

Выполнила: студентка группы тов111

Проверила: Глущенко М.Е

ПОНЯТИЕ ВАРИАЦИИ И ЗАДАЧИ ЕЕ ИЗУЧЕНИЯ……………………………………. 2

ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ В СТАТИСТИЧЕСКОМ ИССЛЕДОВАНИИ……………………………………………… 3-5

ОПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА ВАРИАЦИИ………………………………………..6-7

Понятие вариации и задачи ее изучения.

Наличию вариации обязана своим появлением статистика. Большинство статистических закономерностей проявляется через вариацию. Изучая вариацию значений признака в сочетании с его частотными характеристиками, мы обнаруживаем закономерности распределения.

Рассматривая вариацию одного признака параллельно с изменением другого, мы обнаруживаем взаимосвязи между этими признаками или их отсутствие.

Вариации в статистике проявляются двояко, либо через изменения значений признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности.

Одна из задач показателя вариации - выявление взаимосвязи между общественными явлениями и процессами, т.е. определение степени влияния отдельных факторов на изучаемую совокупность.

Теоретические аспекты применения показателей вариации в статистическом исследовании.

Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:

• среднее линейное отклонение;

• среднее квадратическое отклонение;

Размах колебаний (размах вариации)

где xmах , xmin - соответственно максимальное и минимальное значения признака. Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.

Среднее линейное отклонение и среднее квадратическое отклонение (σ) показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. Среднее линейное отклонение определяется по формулам:

а) для несгруппированных данных (первичного ряда)

б) для п вариационного ряда

Среднее квадратическое отклонение (σ) и дисперсия (σ 2 ) определяются так:

а) для несгруппированных данных

б) для п вариационного ряда

Формула для расчета дисперсии может быть преобразована:

т. е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,

Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.

Квартильное отклонение (dk) применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:

где Q1 и Q1 - соответственно третья и первая квартили распределения.

Квартиль - значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин будет три: первая квартиль (Q1), вторая квартиль (Q2), третья квартиль (Q3). Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.

Сначала определяют положение или место квартили:

Затем по накопленным частотам в дискретном ряду определяют численное значение.

В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле

где ХQ - нижняя граница интервала, в котором находится квартиль;

S(Q-1) - накопленная частота интервала, предшествующего тому, в котором находится квартиль;

fQ - частота интервала, в котором находится квартиль.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах.

Формулы расчета относительных показателей вариации следующие:

Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).

Таким образом, абсолютные и относительные показатели вариации помогают в своей совокупности изучить тот или иной процесс или явление и служат для его характеристики с разных сторон. И абсолютные, и относительные показатели вариации широко используются в изучении социально- экономических процессов, пронизывающих всю нашу жизнь.

Определение коэффициента вариации.

Пример 1. При определении коэффициента вариации по статистическому ряду распределения числа рабочих по разрядам будем использовать следующие формулы:

Среднее линейное отклонение рассчитывается по формуле:

Дисперсия определяется по формуле:

Среднее квадратическое отклонение и коэффициент вариации:

Результаты расчетов представлены в таблице.

Таблица 1 – Распределение числа рабочих по тарифным разрядам и вспомогательные расчеты

1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Определение: Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Он характеризует пределы изменения признака.

Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: ,

где – число членов ряда.

Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

– СЛО для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

Дисперсия альтернативного признака:

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

4. Виды дисперсии.

Определение: Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ();

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();

3) Если все варианты умножить на число , дисперсия увеличится в раз ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

– Средняя из внутригрупповых дисперсий

Общая - измеряет вариацию во всей совокупности

Средняя из внутригрупповых дисперсий исчисляется ,

где – частота появления внутригрупповой дисперсии одной величины (одного размера).

– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.

Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Правило сложения дисперсий.

Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).

Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.

Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:

– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).

1. теоретические аспекты применения
показателей вариации в статистическом
исследовании

Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:

• среднее линейное отклонение;

• среднее квадратическое отклонение;

Размах колебаний (размах вариации)


где x mах , x min - соответственно максимальное и минимальное значения признака. Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.


Среднее линейное отклонение и среднее квадратическое отклонение (σ) показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. Среднее линейное отклонение определяется по формулам:

а) для несгруппированных данных (первичного ряда)


б) для п вариационного ряда


Среднее квадратическое отклонение (σ) и дисперсия (σ 2 ) определяются так:

а) для несгруппированных данных


б) для п вариационного ряда


Формула для расчета дисперсии может быть преобразована:


т. е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,


Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.

Квартильное отклонение (d k ) применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:


где Q 1 и Q 1 - соответственно третья и первая квартили распределения.

Квартиль - значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин будет три: первая квартиль (Q 1 ), вторая квартиль (Q 2 ), третья квартиль (Q 3 ). Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.

Сначала определяют положение или место квартили:


Затем по накопленным частотам в дискретном ряду определяют численное значение.

В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле


где Х Q - нижняя граница интервала, в котором находится квартиль;

S (Q-1) - накопленная частота интервала, предшествующего тому, в котором находится квартиль;

f Q - частота интервала, в котором находится квартиль.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах.

Формулы расчета относительных показателей вариации следующие:


Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).

2. определение коэффициента вариации

Пример 1. При определении коэффициента вариации по статистическому ряду распределения числа рабочих по разрядам будем использовать следующие формулы:

Среднее линейное отклонение рассчитывается по формуле:

Дисперсия определяется по формуле:

Среднее квадратическое отклонение и коэффициент вариации:

Результаты расчетов представлены в таблице.

Таблица 1 – Распределение числа рабочих по тарифным разрядам и вспомогательные расчеты

Читайте также: