Статистическое изучение вариации реферат
Обновлено: 05.07.2024
Содержание
ПОНЯТИЕ ВАРИАЦИИ И ЗАДАЧИ ЕЕ ИЗУЧЕНИЯ……………………………………. 2
ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ В СТАТИСТИЧЕСКОМ ИССЛЕДОВАНИИ………………………………………………3-5
ОПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА ВАРИАЦИИ………………………………………..6-7
СПИСОК ЛИТЕРАТУРЫ………………………………………………………………………..8
Работа содержит 1 файл
Статистика.docx
Омский Государственный Институт Сервиса
Реферат по дисциплине:
Общая теория статистики
Применение показателей вариации в статистическом исследовании
Выполнила: студентка группы тов111
Проверила: Глущенко М.Е
ПОНЯТИЕ ВАРИАЦИИ И ЗАДАЧИ ЕЕ ИЗУЧЕНИЯ……………………………………. 2
ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ПРИМЕНЕНИЯ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ В СТАТИСТИЧЕСКОМ ИССЛЕДОВАНИИ……………………………………………… 3-5
ОПРЕДЕЛЕНИЕ КОЭФФИЦИЕНТА ВАРИАЦИИ………………………………………..6-7
Понятие вариации и задачи ее изучения.
Наличию вариации обязана своим появлением статистика. Большинство статистических закономерностей проявляется через вариацию. Изучая вариацию значений признака в сочетании с его частотными характеристиками, мы обнаруживаем закономерности распределения.
Рассматривая вариацию одного признака параллельно с изменением другого, мы обнаруживаем взаимосвязи между этими признаками или их отсутствие.
Вариации в статистике проявляются двояко, либо через изменения значений признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности, либо через наличие или отсутствие изучаемого признака у отдельных единиц совокупности.
Одна из задач показателя вариации - выявление взаимосвязи между общественными явлениями и процессами, т.е. определение степени влияния отдельных факторов на изучаемую совокупность.
Теоретические аспекты применения показателей вариации в статистическом исследовании.
Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:
• среднее линейное отклонение;
• среднее квадратическое отклонение;
Размах колебаний (размах вариации)
где xmах , xmin - соответственно максимальное и минимальное значения признака. Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.
Среднее линейное отклонение и среднее квадратическое отклонение (σ) показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. Среднее линейное отклонение определяется по формулам:
а) для несгруппированных данных (первичного ряда)
б) для п вариационного ряда
Среднее квадратическое отклонение (σ) и дисперсия (σ 2 ) определяются так:
а) для несгруппированных данных
б) для п вариационного ряда
Формула для расчета дисперсии может быть преобразована:
т. е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,
Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.
Квартильное отклонение (dk) применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:
где Q1 и Q1 - соответственно третья и первая квартили распределения.
Квартиль - значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин будет три: первая квартиль (Q1), вторая квартиль (Q2), третья квартиль (Q3). Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.
Сначала определяют положение или место квартили:
Затем по накопленным частотам в дискретном ряду определяют численное значение.
В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле
где ХQ - нижняя граница интервала, в котором находится квартиль;
S(Q-1) - накопленная частота интервала, предшествующего тому, в котором находится квартиль;
fQ - частота интервала, в котором находится квартиль.
При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах.
Формулы расчета относительных показателей вариации следующие:
Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).
Таким образом, абсолютные и относительные показатели вариации помогают в своей совокупности изучить тот или иной процесс или явление и служат для его характеристики с разных сторон. И абсолютные, и относительные показатели вариации широко используются в изучении социально- экономических процессов, пронизывающих всю нашу жизнь.
Определение коэффициента вариации.
Пример 1. При определении коэффициента вариации по статистическому ряду распределения числа рабочих по разрядам будем использовать следующие формулы:
Среднее линейное отклонение рассчитывается по формуле:
Дисперсия определяется по формуле:
Среднее квадратическое отклонение и коэффициент вариации:
Результаты расчетов представлены в таблице.
Таблица 1 – Распределение числа рабочих по тарифным разрядам и вспомогательные расчеты
1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.
Определение: Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.
Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.
Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.
Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.
Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.
2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.
1) Размах вариации – разность между максимальным и минимальным значением признака:
Он характеризует пределы изменения признака.
Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.
Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.
Простейший показатель такого типа СЛО.
2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).
– СЛО для несгруппированных данных: ,
где – число членов ряда.
Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.
– СЛО для сгруппированных данных: ,
где – сумма частот вариационного ряда.
В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.
Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.
3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).
В общем виде взвешенная дисперсия исчисляется по формуле:
или простая дисперсия:
Дисперсия альтернативного признака:
4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:
– для несгруппированных данных;
– для сгруппированных данных (для вариационного ряда).
3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.
Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).
КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.
это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.
4. Виды дисперсии.
Определение: Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.
Свойства дисперсии:
1) Дисперсия постоянной величины равна нулю ();
2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();
3) Если все варианты умножить на число , дисперсия увеличится в раз ;
4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().
Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.
Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.
Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:
– Средняя из внутригрупповых дисперсий
Общая - измеряет вариацию во всей совокупности
Средняя из внутригрупповых дисперсий исчисляется ,
где – частота появления внутригрупповой дисперсии одной величины (одного размера).
– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.
Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :
Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.
Правило сложения дисперсий.
Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.
Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).
Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.
Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:
– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).
1. теоретические аспекты применения
показателей вариации в статистическом
исследовании
Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:
• среднее линейное отклонение;
• среднее квадратическое отклонение;
Размах колебаний (размах вариации)
где x mах , x min - соответственно максимальное и минимальное значения признака. Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.
Среднее линейное отклонение и среднее квадратическое отклонение (σ) показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. Среднее линейное отклонение определяется по формулам:
а) для несгруппированных данных (первичного ряда)
б) для п вариационного ряда
Среднее квадратическое отклонение (σ) и дисперсия (σ 2 ) определяются так:
а) для несгруппированных данных
б) для п вариационного ряда
Формула для расчета дисперсии может быть преобразована:
т. е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,
Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.
Квартильное отклонение (d k ) применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:
где Q 1 и Q 1 - соответственно третья и первая квартили распределения.
Квартиль - значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин будет три: первая квартиль (Q 1 ), вторая квартиль (Q 2 ), третья квартиль (Q 3 ). Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.
Сначала определяют положение или место квартили:
Затем по накопленным частотам в дискретном ряду определяют численное значение.
В интервальном ряду распределения сначала указывают интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле
где Х Q - нижняя граница интервала, в котором находится квартиль;
S (Q-1) - накопленная частота интервала, предшествующего тому, в котором находится квартиль;
f Q - частота интервала, в котором находится квартиль.
При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах.
Формулы расчета относительных показателей вариации следующие:
Наиболее часто применяется коэффициент вариации. Его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).
2. определение коэффициента вариации
Пример 1. При определении коэффициента вариации по статистическому ряду распределения числа рабочих по разрядам будем использовать следующие формулы:
Среднее линейное отклонение рассчитывается по формуле:
Дисперсия определяется по формуле:
Среднее квадратическое отклонение и коэффициент вариации:
Результаты расчетов представлены в таблице.
Таблица 1 – Распределение числа рабочих по тарифным разрядам и вспомогательные расчеты
Читайте также: