Применение показателей вариации в статистическом исследовании реферат

Обновлено: 05.07.2024

Сущность понятия "вариация". Относительные показатели вариации. Размах вариации как важный показатель колеблемости признака. Коэффициент вариации случайной величины. Среднеквадратическое отклонение как показатель рассеивания значений случайной величины.

1. Сущность и значение показателей вариации: размаха вариации, среднеквадратического отклонения, коэффициента вариации

Для измерения вариации признака используют как абсолютные, так и относительные показатели.

К абсолютным показателям вариации относят: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию.

К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение и др.

Размах вариации - самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:

Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Как видим, размах вычисляется очень просто, и в этом его главное и единственное достоинство, но информативность этого показателя невелика.

Можно привести очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. Размах вариации используется иногда в практических исследованиях при малых (не более 10) объемах выборки, Например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели. Стандартное отклонение выражается в тех же единицах измерения, что и характеризуемый им признак. Если требуется сравнить между собой степень варьирования признаков, выраженных в разных единицах измерения, возникают определенные неудобства. Какой из признаков варьирует сильнее?

Очевидно, что только на основании сравнения стандартных отклонений на этот вопрос ответить нельзя. Требуется сопоставить стандартные отклонения со средними арифметическими этих признаков. Поэтому вводится относительный показатель Коэффициент вариации:

Коэффициент вариации случайной величины - мера относительного разброса случайной величины; показывает, какую долю среднего значения этой величины составляет ее средний разброс. В отличие от среднего квадратического или стандартного отклонения измеряет не абсолютную, а относительную меру разброса значений признака в статистической совокупности. Исчисляется в процентах. Вычисляется только для количественных данных.

Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, т.е. полученной из одной генеральной совокупности.

Практически коэффициент вариации применяется в основном для сравнения выборок из однотипных генеральных совокупностей. Коэффициент вариации можно использовать как относительную меру рассеяния только в тех случаях, когда значения признака измерены в шкале с абсолютным нулем.

Среднеквадратическое отклонение - в статистике в наибольшей мерераспространенный показатель рассеивания значений случайной величины относительно её математического ожидания. Измеряется в единицах измерения самой случайной величины. Равен корню квадратному из дисперсии случайной величины.

Стандартное отклонение используют при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Среднеквадратическое отклонение равно:

2. На основании данных по хлебозаводу рассчитать недостающие в таблице показатели

1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Определение: Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Он характеризует пределы изменения признака.

Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: ,

где – число членов ряда.

Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

– СЛО для сгруппированных данных: ,

где – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

или простая дисперсия:

Дисперсия альтернативного признака:

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

– для несгруппированных данных;

– для сгруппированных данных (для вариационного ряда).

3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

4. Виды дисперсии.

Определение: Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ();

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ();

3) Если все варианты умножить на число , дисперсия увеличится в раз ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ().

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

– Средняя из внутригрупповых дисперсий

Общая - измеряет вариацию во всей совокупности

Средняя из внутригрупповых дисперсий исчисляется ,

где – частота появления внутригрупповой дисперсии одной величины (одного размера).

– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.

Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Правило сложения дисперсий.

Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).

Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.

Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:

– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).

Тема 9 Показатели вариации

Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.

Основными показателями, характеризующими вариацию, являются:

1) Размах вариации

9.1 Размах вариации

2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:

среднее линейное отклонение для несгруп данных

Среднее линейное отклонение для вариационного ряда

где – абсолютные значения отклонений отдельных вариантов xi от средней арифметической ; fi – частота.

3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:

Дисперсия

4. Среднее квадратическое отклонение – корень квадратный из дисперсии:

Среднее квадратическое отклонение для несгруппированных данных

 среднее квадратическое отклонение для вариационного ряда

. В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (руб., тыс., млн и т.д.). .

5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:

коэффициент вариации

Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:

Таблица 9.1 ‑ Данные о продаже основных марок холодильников:

Рассчитаем размах вариации.

R= 1200-460=740$

Пример вычисления размаха вариации

Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.

Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.

Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.

Между индиви­дуальными отклонениями от средней и колеблемостью признака существует прямая зави­симость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.

Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной

По приведенным выше данным определим средневзвешенную цену холодильника:

Пример расчета сред арифм взвешенная

Далее рассчитаем дисперсию:

Пример расчета дисперсии

. Следует отметить, что дисперсия еще не дает представления об однородности со­вокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рас­считан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, на­сколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак. .

Рассчитаем среднее квадратическое отклонение

Пример расчета сред квадрат отклон

Вывод: Таким образом, цена каждой марки холодильника отклоняется от средней цены в среднем на 271,1 $

Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости ка­кого-либо одного признака или для определения однородности совокупности рассчиты­вают относительные показатели.

Эти показатели вычисляются как отношение размаха вариации, среднего линейно­го отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.

Определим значение показателя вариации по вышеприведенным данным таблицы

Пример расчета показателя вариации

Совокупность считается однородной, если V не превышает 33%.

Если V 25% – вариация сильная.

Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).

!! Следует отметить, что коэффициент вариации может быть более 100%, что, в част­ности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.

Изучая вариацию интересующего нас признака в пределах исследуемой совокупно­сти и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.

При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подвер­женным влиянию).

Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации резуль­тативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индиви­дуальных значений признака, используют правило сложения дисперсий.

Общая дисперсия представляет собой сумму средней из виутригрупповой и меж­групповой и дисперсий:

Общая дисперсия

пояснение к общей диспер

Общая дисперсия характеризует вариацию признака по всей совокупности как ре­зультат влияния всех факторов, определяющих индивидуальные различия единиц сово­купности.

формула 9.9

к формуле 9.9

Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.

межгрупповая дисперсия

Пояснение межгрупповая дисперсия

Средняя из внутригрупповых дисперсий отражает ту часть вариации результа­тивного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рас­считывается отдельно по каждой j-ой группе.

Внутригрупповая дисперсия

Пояснение внутригрупповая дисперсия

Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:

Средняя из внутригрупповых дисперсий

Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:

Взаимосвязь между тремя видами дисперсий

Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении об­щей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчле­нения общей совокупности.

Теснота связи между факторным и результативным признаками оценивается на ос­нове эмпирического корреляционного отношения:

Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.

Пример. На следующем условном примере исследуем зависимость объема выполненных ра­бот от формы собственности проектно-изыскательских организаций.

Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности

Объем выполненных работ

1) Определим средний объем работ для предприятий двух форм собственности.

пример 1

2) Определим средний объем работ для каждой формы собственности.

Пример 2

3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.

пример 3

4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.

Таблица 9.3. – Вспомогательная таблица

Пример. Средняя из внутригрупповых дисперсий

Пример расчета средней из внутригрупповых дисперсий

Пример. Межгрупповая дисперсия

ПРимер расчета межгрупповой дисперсии

На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:

Проверка закона сложения дисперсий: 54,0+189,8=243,8

Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фак­тора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.

Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:

Пример расчета эмперич корреляц отнош

Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика

Контрольные задания

Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.

2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.

Целью методических указаний является оказание помощи студентам в изучении методов статистических расчетов путем обеспечения материалами для закрепления теоретических знаний и получения навыков решения практических заданий. Излагаются основные понятия, формулы, примеры и решения типовых задач, контрольные вопросы и тесты по изучаемым темам и библиографический список. Указания предназначены для студентов экономических специальностей всех форм обучения.

Допущено учебно-методическим центром СевНТУ в качестве методических указаний.

1. Показатели вариации. …. ….. 5

1.1. Основные формулы. 5

1.2. Решение типовых задач. 7

1.3. Контрольные задачи. 10

1.4. Контрольные вопросы. 12

2. Выборочное наблюдение. 16

2.1. Основные формулы. 16

2.2. Решение типовых задач. 18

2.3. Контрольные задачи. 20

2.4. Контрольные вопросы. 22

3. Ряды динамики. 25

3.1. Основные формулы. 25

3.2. Решение типовых задач. 28

3.3. Контрольные задачи. 31

3.4. Контрольные вопросы. 34

Библиографический список. 38

Готовясь к практическим занятиям, студент должен прочесть рекомендованную литературу и конспект лекций, самостоятельно проверить, как он усвоил вопросы той темы, по которой будет решать задачи.

Решение задач необходимо сопровождать соответствующими формулами, подробными расчетами, пояснением сущности исследуемых показателей и краткими выводами. При этом особое внимание следует уделять экономическому содержанию показателей.

В соответствии с учебной программой студентам всех форм обучения необходимо иметь навык в решении определенных задач, согласно требованиям и выполнить по данному разделу домашнюю контрольную работу. По окончании курса предусмотрен зачет.

Данные методические указания значительно упростят процесс изучения материала, т.к. в нем систематизированы темы раздела, основные формулы по темам, которыми необходимо пользоваться. Для повышения эффективности самостоятельной работы приведены подробные выкладки всех расчетных формул с ответами по каждой типовой задаче, а так же представлены примеры решения распространенных задач для самостоятельного решения. В конце каждой темы приведены контрольные вопросы и тесты, ответы на которые обеспечат положительный результат при сдаче зачета.

Перед выполнением контрольной работы или решением задач на практических занятиях требуется внимательное изучение настоящих методических указаний.

1. ПОКАЗАТЕЛИ ВАРИАЦИИ

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Различают вариацию случайную и систематическую. К показателям вариации относят: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение – являются абсолютным измерением вариации и коэффициент вариации – относительный показатель вариации.

1.1. Основные формулы


Размах вариации ():


(1.1)


Среднее линейное отклонение ():


(1.2)

б) для сгруппированных данных:


(1.3)

Дисперсия (s 2 ):

а) простая дисперсия для несгруппированных данных:


(1.4)

б) взвешенная дисперсия для вариационного ряда:


(1.5)

Упрощенные методы расчета дисперсии:

1. Метод электронно-вычислительного способа расчета :


(1.6)


(1.7)

где m2 – момент второго порядка, определяемый по формуле:


(1.8)

где m1 – момент первого порядка, определяемый по формуле (4.10).


Дисперсия альтернативного признака ():


(1.9)

где p – доля единиц, обладающих альтернативным признаком;

q – доля единиц, не обладающих альтернативным признаком(q = 1 - p).

Среднее квадратическое отклонение (s ):


(1.10)

Правило сложения дисперсий:


(1.11)

где s 2 – общая дисперсия;


- средняя из внутригрупповых дисперсий;

d 2 – дисперсия групповых средних (межгрупповая) дисперсия.

Средняя из внутригрупповых дисперсий:


(1.12)


где - групповые дисперсии.


(1.13)


где - групповые средние;


- общая средняя.


(1.14)


Коэффициент вариации ():


(1.15)


Коэффициент детерминации ( ):


(1.16)


Эмпирическое корреляционное отношение ():


(1.17)

1.2. Решение типовых задач

Имеются данные о сменной выработке рабочих бригады, представленные интервальным рядом распределения (исходные данные ­ в столбцах 1-2):

Читайте также: