Реферат на тему вариационные ряды

Обновлено: 04.07.2024

Средние величины рассчитываются на основе вариационных рядов.

Вариационный ряд — это однородная в качественном отношении статистическая совокупность, отдельные единицы которой характеризуют количественные различия изучаемого признака или явления.

Цифровое значение, каждого отдельного признака или явления, входящего в вариационный ряд, называется вариантой и обозначается буквой V. Числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, носят названия частот и обозначаются буквой — р. Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n.

Варианты, расположенные в порядке возрастания или убывания количественной характеристики признака, составляют ранжированный вариационный ряд.

Вариационный ряд
I Виды вари­а­ционных рядов Простой Сгруппирован­ный
II Характеристика вари­ационного ряда Варианта V Частота p Общее число наблюдений n
III Этапы составления сгруппированного ряда Опреде­ле­ние числа групп Опреде­ление интервала Определение границ и середины группы Распределение наблюдений по группам Графическое изображение
IV Практи­ческое применение Для характеристики типа распределения признака в совокупности Для вычисления среднего уровня (средней величины)

Различают два вида вариационных рядов:

— простой вариационный ряд;

— сгруппированный вариационный ряд,

Простым вариационным рядом называется такой ряд, где каждая варианта встречается лишь один раз. Вариационный ряд, где указано сколько раз встречается каждая варианта называется сгруппированным вариационным рядом.

Если исследователь имеет не более 30 наблюдений, то достаточно все значения признака расположить в нарастающем или в убывающем порядке (от минимальной варианты до максимальной или наоборот) и указать частоту каждой варианты. При большом числе наблюдений (более 30) рекомендуется варианты объединить в группы с указанием частоты встречаемости всех вариант, входящих в данную группу.

Основные требования к составлению вариационного ряда:

1. Расположить все варианты по порядку

2. Суммировать единицы, имеющие одинаковый признак, т.е. найти частоту каждой единицы

3. Определить количество групп

4. Определить интервал между группами

5. Определить начало, середину и конец группы

6. Распределить данные наблюдений по группам

7. Графические изобразить вариационный ряд

Методику построения сгруппированного вариационного ряда рассмотрим на следующем примере:

Даны данные о частоте пульса (число ударов в минуту) у 54 студентов перед экзаменом: 60, 70, 70, 68, 70, 72, 64, 66, 66, 70, 76, 76, 80, 64, 6.2, 78, 78, 76, 70, 68, 64, 62, 70, 68, 72, 70, 72, 72, 70, 70, 76, 76, 76 74, 74, 74, 80, 80, 66, 72, 76, 76, 74, 74, 74, 72, 78, 78, 76, 74, 76, 76, 80, 78.

1. Строим вариационный ряд, последовательно располагая варианты в порядке возрастания: 60, 62, 62, 64, 64, 64, 66, 66, 66, 68, 68, 68, 70, 70, 70, 70, 70, 70, 70, 70, 70, 72, 72, 72, 72, 72, 72,74, 74, 74, 74, 74, 74, 74,76, 76, 76, 76, 76, 76, 76, 76, 76, 76, 76, 78, 78, 78, 78, 78, 80, 80, 80, 80.

2. Распределение студентов в зависимости от частоты пульса перед экзаменом

частота пульса (V)
число студентов (p)

Всего студентов n =54

3. Определение количества групп.

Количество групп в вариационном ряду находим в специально разработанной таблице.

Число вариант (n) 31–45 46–101 101–200 201–500
Число групп (р) 6–7 8–10 11–12 13–17

В нашем примере число наблюдений — 54, поэтому в вариационном ряду следует иметь 8 групп.

3. Определение величины интервала (i) между группами. Интервал между группами определяют по формуле:

i= Vmax–Vmin = 80–60 = =2,5
r (число групп)

Полученный интервал 2,5 рекомендуется округлять до целого числа — 3.

5. Определяем границы и середину каждой группы: например, первая группа вариант при i = 3 будет 60-62 удара в минуту, середина 61 удар в минуту, следующая группа — 63-65 удара в минуту, середина 64 удара в минуту и т.д.

6. Разбиваем весь ряд на группы используя выбранный интервал и строго соблюдая непрерывность сгруппированного ряда

частота пульса (V) середина группы вариант число студентов
60–62
63–65
66–68
69–71
72–74
75–77
78–80
n = 54

7. Строим графическое изображение вариационного ряда (по серединам групп)

Распределение студентов по частоте пульса перед экзаменом

Полученный ряд распределения (вариационный ряд) и графическое его изображение делают статистические данные обозримыми, доступными для анализа и дальнейшего изучения.

Понятие медицинской статистики. Виды средних величин, область их применения. Вариационный ряд, методика его построения и характеристика. Вычисление средней арифметической (простой и взвешенной, по способу моментов). Использование коэффициента вариации.

Рубрика Медицина
Вид реферат
Язык русский
Дата добавления 08.09.2015
Размер файла 79,0 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Министерство здравоохранения РФ

ГБОУ ВПО Иркутский государственный медицинский университет

Кафедра общественного здоровья и здравоохранения

С курсом медицинской статистики

Реферат на тему:

Выполнила студентка 103 группы

Содержание

1. Средние величины, их виды и область применения

Для характеристики изучаемой совокупности по количественным признакам используются различные показатели, в том числе и средние величины, которые показывают средний уровень изучаемого признака.

Средние величины используются в здравоохранении:

для оценки здоровья населения (показатели физического развития, средняя длительность пребывания на больничном листе и т.д.);

для оценки деятельности лечебно-профилактических учреждений (средняя длительность работы койки в году, оборот койки и т.д.);

для планирования (число жителей на терапевтическом, педиатрическом участке, стоимость одного койко-дня и т.д.);

для оценки санитарно-гигиенических параметров (освещенность, температура, влажность воздуха и т.д.);

для определения разовых доз лекарственных веществ и т.д.

Средний уровень изучаемого явления - одно из групповых свойств статистической совокупности. Средний уровень измеряют с помощью критериев, которые носят название средних величин.

Средние величины обладают тремя свойствами:

средняя выражает общую меру изучаемого явления;

сумма отклонений всех вариант от средней равна нулю.

Наиболее широко используются три средние величины:

мода (Мо) - соответствует величине признака, который чаще встречается в статистической совокупности, т.е. варианте наиболее часто встречающейся в вариационном ряду;

медиана (Ме) - варианта, занимающая срединное положение в вариационном ряду и делящая его пополам. Для того, чтобы узнать значение медианы, необходимо определить порядковый номер варианты, занимающей срединное положение (n/2), где n - число вариант в вариационном ряду. При нечетном числе вариант используется формула n+1/2;

средняя арифметическая (простая, взвешенная).

Для определения средних величин в статистической совокупности необходима предварительная обработка и систематизация данных исследования, а именно, построение вариационного ряда.

2. Вариационный ряд, методика его построения и характеристика

Вариационный ряд - это ряд числовых измерений определенного признака, отличающихся друг от друга по величине и расположенных в определенном порядке.

Вариационный ряд может быть:

простой, несгруппированный;

сгруппированный;

прерывный или непрерывный;

правильный или неправильный;

ранжированный или неранжированный.

Обозначения, используемые в вариационном ряду:

варианта (V) - отдельное числовое выражение изучаемого признака;

частота (р) - количество вариант определенной величины;

число наблюдений (n) - общее число вариант в вариационном ряду.

Если число наблюдений не превышает 30, то варианты можно расположить по возрастанию или убыванию, т.е. построить простой вариационный ряд.

Пример: получены данные о длительности лечения в поликлинике 45 больных ангиной (в днях): 20, 18, 19, 16, 17, 16, 14, 13, 15, 14, 15, 13, 12, 13, 3, 4, 12, 11, 12, 11, 10, 12, 11, 10, 11, 8, 7, 11, 11, 10, 10, 10, 9, 8, 8, 9, 4, 5, 6, 9, 5, 9, 6, 7, 7. Строим вариационный ряд:

Таблица 1

3. Методы вычисления средней арифметической (средней арифметической простой и взвешенной, по способу моментов)

Мода (Мо) =11, т.к. данная варианта встречается в вариационном ряду наиболее часто (р=6).

Медиана (Ме) - порядковый номер варианты занимающей срединное положение = 23, это место в вариационном ряду занимает варианта равная 11. Средняя арифметическая (М) позволяет наиболее полно охарактеризовать средний уровень изучаемого признака. Для вычисления средней арифметической используется два способа: среднеарифметический способ и способ моментов.

Если частота встречаемости каждой варианты в вариационном ряду равна 1, то рассчитывают среднюю арифметическую простую, используя среднеарифметический способ: М = .

Если частота встречаемости вариант в вариационном ряду отличается от 1, то рассчитывают среднюю арифметическую взвешенную, по среднеарифметическому способу:

M = = =10,7.

По способу моментов: А - условная средняя,

М = A + =11 += 10.4 d=V-A, A=Mo=11

Если число вариант в вариационном ряду более 30, то строится сгруппированный ряд. Построение сгруппированного ряда:

1) определение Vmin и Vmax Vmin=3, Vmax=20;

2) определение количества групп (по таблице);

3) расчет интервала между группами i = 3;

4) определение начала и конца групп;

5) определение частоты вариант каждой группы (таблица 2).

Таблица 2

Методика построения сгруппированного ряда

n=45 p=480 p=30 2 p=766

Преимущество сгруппированного вариационного ряда заключается в том, что исследователь работает не с каждой вариантой, а только с вариантами, являющимися средними для каждой группы. Это позволяет в значительной степени облегчить расчеты средней.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Данную особенность статистической совокупности характеризует одно из групповых свойств генеральной совокупности - разнообразие признака. Например, возьмем группу мальчиков 12 лет и измерим их рост. После проведенных расчетов средний уровень данного признака составит 153 см. Но средняя характеризует общую меру изучаемого признака. Среди мальчиков данного возраста есть мальчики, рост которых составляет 165 см или 141 см. Чем больше мальчиков будут иметь рост отличный от 153 см, тем больше будет разнообразие этого признака в статистической совокупности.

Статистика позволяет охарактеризовать данное свойство следующим критериями:

лимит (lim),

амплитуда (Amp),

среднеквадратическое отклонение (у),

коэффициент вариации (Сv).

Лимит (lim) определяется крайними значениями вариант в вариационном ряду:

Амплитуда (Amp) - разность крайних вариант:

Данные величины учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Поэтому данными критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n 20%, то имеет место сильное разнообразие вариационного ряда; CV от 10 до 20% - среднее разнообразие; CV 0, то асимметория положительная, правосторонняя; когда Ка=0, ряд симметричен.

Список использованной литературы

1. Белицкая Е.Я. Учебное пособие по медицинской статистике. - М., - 1972. - С.13-29.

2. Догле Н.В., Юркевич А.Я. Заболеваемость с временной утратой трудоспособности. - М., - 1984.

3. Журавлева К.И. Статистика в здравоохранении. - М., 1981.

4. Колядо В.Б., Плугин С.В., Дмитриенко И.М. Медицинская статистика (Методическое пособие). - Барнаул, 1998. - 151с.

5. Лисицын Ю.П. Общественное здоровье и здравоохранение. М: "ГЭОТАР-медиа", 2007. - 512с.

6. Медик В.А., Токмачев М.С. Руководство по статистике здоровья и здравоохранения. - М.: ОАО "Издательство "Медицина", 2006. - 528с.

7. Мерков А.М., Поляков Л.Е. Санитарная статистика. - Л.: Медицина. - 1974.

8. Миняев В.А., Юрьев В.К. Общественное здоровье и здравоохранение. - М.: ИКЦ Академкнига, 2008. - 233 с.

9. Поляков И.В., Соколова Н.С. Практическое пособие по медицинской статистике. - М., 1975.

10. Применение методов статистического анализа для изучения общественного здоровья и здравоохранения: учеб. пособие для вузов / 2. ред. В.З. Кучеренко - М.: ГЭОТАР - Медиа, 2006. - 192 с.

11. Руководство к практическим занятиям по социальной гигиене и организации здравоохранения (под редакцией Ю.П. Лисицына). - М.: Медицина. - 1975 - С.25-46.

Подобные документы

Средняя величина – количественная обобщающая характеристика однородной совокупности с изменяющимся варьирующим признаком. Виды средних величин и методы их вычисления. Оценка достоверности статистических показателей. Оценка физического развития населения.

курсовая работа [23,6 K], добавлен 10.11.2013

Изучение и анализ частоты послеоперационных осложнений при аппендиците. Характер и состав осложнений в зависимости от сроков поступления и состояния при поступлении. Составление программы исследования. Выкипировка материала на специальные карты.

курсовая работа [12,4 K], добавлен 04.03.2004

Сущность и область ее применения потенциометрии как метода определения различных физико-химических величин, основанного на измерении электродвижущих сил обратимых гальванических элементов. Оценка ее преимуществ и недостатков, используемое оборудование.

презентация [363,8 K], добавлен 17.12.2015

Медицинская статистика, как область науки и практическая деятельность, направленная на сохранение и укрепление здоровья людей, предупреждение и лечение болезней. Методы сбора информации, ее обработки и анализа, имеющиеся в арсенале медицинской статистики.

презентация [1,8 M], добавлен 24.03.2016

Этапы медицинской эвакуации. Сущность первой медицинской и доврачебной помощи. Первая врачебная и квалифицированная медицинская помощь. Военно-врачебная экспертиза при ранениях в челюстно-лицевую область. Специализированная помощь и последующее лечение.

реферат [16,5 K], добавлен 28.02.2009

Методика проведения анализа газов артериальной крови, факторы риска и возможные осложнения. Спирография как наиболее простой метод исследования внешнего дыхания, его назначение и условия применения. Виды и характеристика острых нарушений дыхания.

реферат [19,7 K], добавлен 03.09.2009

Понятие, формы и уровни бесплатной медицинской помощи. Виды ее оказания на этапах медицинской эвакуации. Неотложные меры при состояниях, угрожающих жизни раненых и больных. Группы мероприятий квалифицированной хирургической и терапевтической помощи.

Глава 1. Построение и графическое изображение вариационных рядов.

1.1 Порядок построения вариационных рядов………………………………….5

1.2. Графическое изображение дискретных вариационных рядов……………6

1.3. Графическое изображение интервальных вариационных рядов………….6

Глава 2. Статистические характеристики рядов распределения.

2.1. Показатели центра распределения……………………………………….….7

2.2. Показатели колеблемости признака……………………………………….8

2.3. Показатели формы распределения……………………………..…………..9

2.4. Построение нормальной кривой по эмпирическим и теоретическим данным……………………………………………………………………………10

2.5. Проверка гипотезы о законе нормального распределения……………….11

2.6. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel………………………. …11

2.7. Статистические оценки параметров распределения…………………. …13

2.8. Статистические оценки параметров распределения……………………. 14

Глава 3. Корреляционно – регрессионный анализ.

3.1. Выбор типа аппроксимирующей функции…………………………….….16

3.2. Исследование корреляционной связи и оценка степени пригодности полученного корреляционного уравнения……………………………………..18

3.3. Вычисление показателей тесноты корреляционной связи……………….19

3.4. Проведение регрессионного анализа с помощью инструмента

Глава 4. Дисперсионный анализ.

4.1. Понятие дисперсионного анализа……………………………………….…20

4.2. Однофакторный дисперсионный анализ…………………………………..20

Введение

Расчетно-графическая работа (РГР) предполагает применение основных приемов статистики для обработки массовой социально – экономической информации.

Программное обеспечение современных персональных компьютеров позволяет автоматизировать процесс расчетов. Наиболее эффективно использовать для этой цели табличный процессор Excel.

Excel предлагает широкий диапазон средств для анализа статистических данных. Такие встроенные функции, как СРЗНАЧ, МЕДИАНА, МОДА, могут быть полезны для проведения несложного анализа. Если встроенных статистических функций недостаточно, то можно обратиться к Пакету анализа.

Пакет анализа, являющийся надстройкой, содержит коллекцию функций и инструментов, расширяющих встроенные аналитические возможности Excel. В частности, пакет анализа можно использовать для создания гистограмм, ранжирования данных, извлечения случайных или периодических выборок из выбора данных, проведения регрессионного анализа, получения основных статистических характеристик выборки, генерации случайных чисел с различным распределением и для многих других расчетов.

Глава 1. Построение и графическое изображение

вариационных рядов.

1.1 Порядок построения вариационных рядов

Данная работа выполнена на демонстрационном примере в пакете Excel.

Составление вариационных рядов рассмотрим на примере данных о бонитете почв и урожайности овощей (Таблица исходных данных). Они являются исходными данными для демонстрационного примера.

Дискретный вариационный ряд строится по зависимому признаку (обозначим его У), интервальный - по независимому (Х).

Для того чтобы составить дискретный вариационный ряд урожайности овощей, необходимо расположить наблюдавшиеся значения признака в порядке возрастания, т.е. ранжирование статистических данных, а затем подсчитать частоты (сколько раз встречается то или иное значение признака).

Для графического изображения дискретного ряда служит многоугольник (полигон). При его построении на оси абсцисс откладываются варианты, на оси ординат - частоты.

Построение интервального вариационного ряда рассматривается на примере бонитета почв различных хозяйств.

1 . Определим число групп (число интервалов) по формуле Стерджесса:

К-число групп (интервалов);

n- число единиц наблюдения.

В данном примере K=1+3.32*lg(30) = 6.

2. Рассчитываем величину интервала, т.е. разность между верхним и нижним значением признака в группе:

Величина интервала (шаг):

3. Формируем группы, т.е. устанавливаем верхние и нижние границы для каждого интервала. Нижней границей для первой группы будет xmin (или эта величина, уменьшенная не более чем на половину величины интервала). Чтобы найти верхнюю границу, нужно к нижней границе прибавить величину интервала h.

Верхняя граница первой группы будет нижней границей для второго интервала. Чтобы найти верхнюю границу, к полученному значению опять прибавляют величину интервала и т.д.

4. Подсчитываем число вариант, попавших в каждый интервал, Варианты, совпадающие с границами частичных интервалов, включаются в правый интервал. Графически интервальный ряд изображают с помощью гистограммы.

Глава 2. Статистические характеристики рядов распределения.

2.1. Показатели центра распределения .

Средней в статистике называется показатель, характеризующий типичный размер признака в совокупности.

Средняя арифметическая вычисляется по формулам:

где - среднее значение признака; - варианты; - частоты; - численность совокупности.

Характеристиками вариационных рядов наряду со степенными средними являются мода и медиана.

Мода - величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. В дискретных рядах распределения модой будет варианта с наибольшей частотой.

В интервальном ряду мода определя6ется по формуле:

где -нижняя граница интервала, содержащего моду; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота послемодального интервала.

Медианой в статистике называется варианта, расположенная в середине вариационного ряда. Если ряд дискретный имеет нечётное число, то медианой будет варианта, расположенная в середине упорядоченного ряда и её порядковый номер. Если ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух вариант в середине ряда с порядковыми номерами: и .

В интервальном ряду медиана рассчитывается по формуле:

где - нижняя граница медианного интервала; - величина медианного интервала; - сумма накопленных частот, предшествующих медианному интервалу; -частота медианного интервала.

2.2. Показатели колеблемости признака.

Для измерения колеблемости признака применяются абсолютные и относительные показатели вариации.

Размах вариации - это разность между максимальным и минимальным значениями изучаемого признака.

R = x max -x min

Среднее линейное отклонение - средняя арифметическая из модулей абсолютных отклонений вариантов от их среднего значения.

Дисперсия - это средний квадрат отклонений вариантов от их средней арифметической.

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии.

Коэффициент осцилляции – отношение размаха вариации к средней арифметической:

Относительное линейное отклонение – отношение среднего линейного отклонения к средней:

Коэффициент вариации – отношение среднего квадратического отклонения к средней:

2.3. Показатели формы распределения.

В статистике широко известны различные виды распределений - нормальное распределение, биноминальное, распределение Пуассона и др. Наиболее употребительным является нормальное распределение , выражающее закономерности взаимодействия случайных величин. Оно служит удачной моделью, с которой сравнивают анализируемое эмпирическое распределение. Если расхождения не велики, то их объясняют действием случайных факторов и считают данное распределение близким к нормальному. В противном случае делают вывод о несоответствии рассматриваемого распределения нормальному.

Чтобы определить, насколько близко эмпирическое распределение к нормальному, необходимо произвести выравнивание фактического распределения по кривой нормального распределения. С этой целью рассчитываются теоретические частоты по формуле:

где – теоретические частоты; - фактические частоты; - шаг (величина интервала); - нормированные отклонения; - дифференциальная функция Лапласа (значения даны в приложении 1).

2.5. Проверка гипотезы о законе нормального распределения.

Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Смирнова и др. Мы рассмотрим критерий Пирсона.

Критерий Пирсона определяется по формуле:

Рассчитанное значение сравнивается с табличным при соответствующем числе степени свободы и заданном уровне значимости. Если расчетное значение χ 2 меньше табличного, то делается вывод о несущественности расхождений между эмпирическим и теоретическим распределении (т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, принимается).

Рассматриваемые критерии согласия дают общую оценку степени близости эмпирического распределения к нормальному, но не дают информации о характере расхождения между ними. Для определения характера расхождения между эмпирическими и теоретическими частотами определим показатели формы распределения. Это коэффициент асимметрии и эксцесса.

Коэффициент асимметрии рассчитывается по формуле:

При симметрическом распределении КА = 0. При КА > 0 - наблюдается положительная или правосторонняя асимметрия (правая часть кривой длиннее).

Примечание. Коэффициент асимметрии находится в интервале:

-3 0 кривая распределения – плосковершинна, при Ex tкр , определяемого по таблице распределения Стьюдента, то данный параметр достоверен.

Достоверность выборочной средней :

Достоверность среднего квадратического отклонения и коэффициент вариации:

Определяется по формуле:

Если данная величина меньше 5%, то полученные средние можно использовать в последующих расчётах характеристик изучаемой совокупности.

Характер расхождения между эмпирическими и теоретическими частотами:

· Коэффициент асимметрии КА > 0 для параметра У, следовательно у него наблюдается положительная или правосторонняя асимметрия (правая часть кривой длиннее), для параметра Х КА >0, следовательно у него наблюдается отрицательная или левосторонняя ассиметрия.

· Коэффициент эксцесса Ex > 0 для Х и У, значит кривая распределения – плосковершинная.

Стандартная ошибка выборки максимально возможные расхождения между генеральными и выборочными характеристиками. 0,0343 дляпараметраХи 3,2168 – для У.

Относительная ошибка выборки для параметров Х и У меньше 5 %, значит полученные средние можно использовать для характеристики каждого из этих признаков.

Глава 3. Корреляционно – регрессионный анализ.

3.1. Выбор типа аппроксимирующей функции

В экономических исследования редко приходится иметь дело с точными и определенными функциональными связями, когда каждому значению одной величины соответствует строго определённое значение другой величины. Чаще встречаются стохастические (вероятностные) или корреляционные связи. В следующем разделе работы с помощью программы Excel проводится исследование корреляционной связи.

При изучении корреляционных связей возникает необходимость решить две основные задачи – о тесноте и о форме связи. Первая решается методом корреляции, вторая – методом регрессии и дисперсии. По форме корреляционная связь может быть линейной и нелинейной, по направлению – прямой и обратной.

Для анализа линейной корреляции между признаками Х и Y проводят n независимых парных наблюдений , исходом каждого из которых является пара чисел ( X1 ,Y1 ), ( X2 ,Y2 ),… ( Xn ,Yn ). По этим значениям определяют выборочные эмпирические коэффициенты корреляции и регрессии, рассчитывают уравнение регрессии, строят теоретическую линию регрессии и оценивают значимость полученных результатов.

В MSExcel линия уравнения регрессии называется линией тренда , которая показывает тенденцию изменения данных и служит для составления прогнозов. Для создания линии тренда на основе диаграммы используется один из пяти типов аппроксимаций или линейная фильтрация.

Линейная y = m*x+ b

где m – тангенс угла наклона,

b – точка пересечения с осью ординат

Логарифмическая y = c*ln(х) + b

где c и b – константы

Полиномиальная y = c6 x 6 +…+ c1 x+b

где c6 ,… c1 и b – константы

Степенная y = c*x b

где c и b – константы

Экспоненциальная y = c*e bx

где c и b – константы

На диаграмме можно выделить любой ряд данных и добавить к нему линию тренда. Когда линия тренда добавляется к ряду данных, она связывается с ним, и поэтому при изменении значений любых точек ряда данных линия тренда автоматически пересчитывается и обновляется на диаграмме.

Кроме того, имеется возможность выбирать точку, в которой линия тренда пересекает ось ординат, добавлять к диаграмме уравнение регрессии и величину достоверности аппроксимации. Покажем построение линии тренда на нашем демонстрационном примере на основе исходных данных: время уборки и урожайность. Данный анализ проводится на основе диаграммы для пяти типов аппроксимаций, и выбираем ту линию тренда, для которой величина достоверности аппроксимации наибольшая, т.е. у которой самый наибольший коэффициент корреляции.

Квадрат коэффициента корреляции равен 0,8572. Уравнение данной зависимости имеет вид:

Ух = 58,964х 2 -88,707х+112,8

Для оценки степени пригодности полученного корреляционного уравнения в практических целях необходимо проверить его достоверность.

Рассчитываем ошибку уравнения по формуле:

где Yi - фактическое значение результативного признака, в демонстрационном примере – это Уфакт.; Yх - значения результативного признака, рассчитанные по уравнению регрессии, в демонстрационном примере – это Урасчетн.; n –число наблюдений, m- число параметров уравнения регрессии.

Значения Yх рассчитываются по уравнению регрессии путем подставления в него значений фактического признака (х). В РГР необходимо подсчитать ошибку уравнения для всех видов зависимостей, найти относительную ошибку уравнения, а также выявить минимальную ошибку уравнения регрессии, и убедиться, что она соответствует той зависимости, у которой самый высокий коэффициент аппроксимации (R 2 ).

Минимальная ошибка уравнения равна 5,308431. Она соответствует линейной зависимости, у которой самый высокий коэффициент аппроксимации (R 2 ), равный 0,8572.

Глава 4. Дисперсионный анализ.

4.1. Понятие дисперсионного анализа

В основе дисперсионного анализа лежит правило сложения дисперсий. В соответствии с ним общая дисперсия результативного признака при сгруппированных данных равна сумме межгрупповой и внутригрупповой дисперсий.

Межгрупповая вариация результативного признака вызвана влиянием на него одного или нескольких изучаемых факторных признаков. Дисперсию, измеряющую межгрупповую вариацию, называют межгрупповой или факторной. Внутригрупповая вариация является результатом влияния на результативный признак неучтенных факторов. Показатель, характеризующий внутригрупповую вариацию, называется внутригрупповой или остаточной дисперсией. Весь объём вариации результативного признака характеризуется общей дисперсией.

Идея дисперсионного анализа заключается в сравнении факторной дисперсии с остаточной. Отношение факторной дисперсии к остаточной носит название F- критерия или критерия Фишера и используется для оценки достоверности связи между результативным и факторными признаками. Если различие между факторной и остаточной дисперсиями значимо, то делается вывод о том, что фактор оказывает существенное влияние на результативный признак

Список литературы

1. Венецкий И.Г., Кильдишев В.С. Теория вероятностей и математическая статистика. М.: Статистика, 1975.

2. Ефимова М.Р., Рябцев В.М. Общая теория статистики. М.: Финансы и статистика, 1991.

3. Марк Джон, Крейг Стинсон. Эффективная работа с MicrosoftExcel 2000. СПб.: Питер 2001.

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения.

Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований.

Актуальность данной темы обусловлена тем, что статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

В теоретической части курсовой работы рассмотрены следующие аспекты:

1) Понятие статистических рядов распределения, их виды;

2) Атрибутивные и вариационные ряды распределения;

3) Расчет средних величин, моды и медианы;

4) Графическое представление рядов распределения;

Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания:

При работе с табличными данными использовался персональный компьютер конфигурации: процессор Intel Pentium Seleron 848 МГц, 128 MбОЗУ, система Microsoft Windows XP Professional версия 2000, табличный процессор Excel пакета MicrosoftOffice 2000.

При написании курсовой работе были использованы учебник базового курса, дополнительная литература, а также Интернет-ресурсы.

Статистическое наблюдение – это первый этап любого статистического исследования и заключается в сборе данных о массовых явлениях путем регистрации их признаков (источник первичной информации). По документам отчетности можно провести и единовременные выборочные обследования (см. выборочные и генеральные совокупности).
На втором этапе статистического исследования на основе первичной информации выступает сводка – большей частью неформализованная, содержательная процедура обработки первичных материалов наблюдений с целью получения итоговых или упорядоченных числовых характеристик изучаемой статистической совокупности. Ее важным моментом является группировка.

Прикрепленные файлы: 1 файл

Тема 1Вариационные ряды.doc

Тема 1. Сводка и группировка статистической информации. Вариационные ряды

Шихалёв А.М., к.э.н., доцент кафедры ЭМиИ ИУиТР К(П)ФУ

Сводка и группировка статистической информации

Статистическое наблюдение – это первый этап любого статистического исследования и заключается в сборе данных о массовых явлениях путем регистрации их признаков (источник первичной информации). По документам отчетности можно провести и единовременные выборочные обследования (см. выборочные и генеральные совокупности).

На втором этапе статистического исследования на основе первичной информации выступает сводка – большей частью неформализованная, содержательная процедура обработки первичных материалов наблюдений с целью получения итоговых или упорядоченных числовых характеристик изучаемой статистической совокупности. Ее важным моментом является группировка.

Группировка – это объединение статистических данных в однородные по определенным признакам группы. Она помогает изучить структуру статистической совокупности и некоторые элементы взаимосвязи меду явлениями.

Распределение единиц совокупности по количественному признаку называется вариационным рядом (ВР). Они могут быть построены по дискретным или непрерывным признакам. Отсюда и название – дискретные ВР (задача1) и интервальные ВР (задача 2). При этом интервальные ВР могут быть как с интервалами (шагами) одинаковой величины, так и с шагами неодинакового размера. Таки образом, в достаточной степени формализованный аппарат ВР является средством группировки на уровне дискретных или непрерывных признаков.

Построение дискретных вариационных рядов

Исходная статистическая совокупность

по дискретному признаку (разрядам рабочих одного цеха)

3 5 6 3 2 4 3 5 5 6

4 3 2 3 4 5 4 2 4 6

5 3 4 5 4 3 3 6 2 3

4 6 3 4 4 5 4 5 3 4

2 6 3 4 5 3 4 4 5 4

Чтобы показать распределение рабочих по ТР, построим ВР (дискретный, коли исходные данные носят здесь дискретный характер), то есть новую, более компактную статсовокупность с новым именем X = , i=1,n (n (1)

Для этого необходимо и достаточно сделать следующее.

1) Найти максимальное и минимальное значение среди элементов исходной статистической совокупности: ymax = 6 р., ymin = 2 р. Можно оценить и размах выборки R = ymax - ymin = 6 – 2 = 4 (разряда), то есть установить, что в пределах размаха выборки помещаются все разряды от 2-го до 6-го (2, 3, 4, 5, 6). Однако непосредственного применения в данном случае размах выборки не находит и выступает не как этап формализации, но как сопутствующая информация. Здесь важно то, что в качестве элементов новой статистической совокупности Х будут выступать разряды от минимального до максимального: Х = , i=1,n. Сосчитаем их, чтобы определить мощность множества │Х│= n. Тогда х1= 2 р.; х2= 3 р.; х3= 4 р.; х4= 5 р.; х5= 6 р. Всего насчитали пять вариантов, следовательно n = 5. При этом n

Дискретный вариационный ряд. Результаты отображения вида (1)

Имя и значения вариантов

появления разряда в табл. 1

Особенности нахождения среднего значения вариационного ряда

На вопрос, каким же будет среднее значение (хср) разряда рабочих на умозрительном уровне, ответить легко: по второй графе табл. 2 – 4-й разряд, поскольку среднее – это когда сумму всех элементов совокупности (здесь – вариантов ВР) делим на их число. Тогда сумма разрядов составит 2+3+4+5+6 = 20. Среднее как частное от деления суммы на число элементов совокупности 20 / n = 20 / 5 = 4 (р.).ет меру этой неодинаковост

Произведя вычисления по формуле (2), получим:

∑ хi ∙ fi 2∙ 5 + 3∙ 13 + 4∙ 16 + 5∙ 10 + 6∙ 6 199

Хоть и близко значение 3,98 к 4,00, но все же они разные по своей сути. А вот если бы частота для всех вариантов (разрядов) была бы одинаковой 10; всего вариантов n=5, на каждый вариант по 10, в сумме 50; все сходится). Умножим числитель и знаменатель выражения (2) на единицу и внесем ее как постоянную величину в знак сумм. Тогда одинаковость частот можно так:

fi = f1 = f2 = f3 = f4 = f5 = fconst = f = 10, (3)

а выражение (2) с преобразованиями примет вид (постоянное значение частоты выносим за знак сумм числителя и знаменателя):

∑ 1∙ хi ∙ f f ∑ 1∙ хi 1∙ ∑ хi 1

хсрв = ———— = ———— = —— = — ∑ хi = xср. (4)

То есть сумма единиц в знаменателе от 1 до N и есть (1+1+1+ …… +1) = N единиц. Остальное соответственно в числителе и знаменателе выражения (4) сокращается.

Таким образом при одинаковой частоте появления вариантов среднее взвешенное хсрв сводится к простой механической средней xср.

Или, другими словами, механическое среднее представляет собой средневзвешенную величину в случае, когда частота появления вариантов ВР одинакова. То есть среднее механическое – это в общем случае частный случай среднего взвешенного.

Построение интервальных вариационных рядов

Задача 2. Источник статистической информации – результаты мониторинга, проведенного самим исследователем состояния основных фондов (капитала) в млн. руб. выбранных для исследования малых предприятий (МП) города в рамках выполнения хоздоговорного заказа со стороны Совета министров РТ. В результате наблюдений составлена таблица исходных статистических данных в виде однородной совокупности, приведенной в табл. 3.

Исходная статистическая совокупность по непрерывному

признаку (размер ОФ выбранных для исследования МП города)

9.4 8.0 6.3 10.0 15.0 8.2 7.3 9.2 5.8 8.7

5.2 13.2 8.1 7.5 11.8 14.6 8.5 7.8 10.5 6.0

5.1 6.8 8.3 7.7 7.9 9.0 10.1 8.0 12.0 14.0

8.2 9.8 13.5 12.4 5.5 7.9 9.2 10.8 12.1 12.4

12.9 12.6 6.7 9.7 8.3 10.8 15.0 7.0 13.0 9.5

Читайте также: