Приведите пример вариационного ряда по какому нибудь признаку кратко

Обновлено: 05.07.2024

Для изучения показателей общественного здоровья, для выявления общих закономерностей различных явлений, врачу необходимо знать и владеть методикой вычисления средних величин, так как эти свойства не могут быть обнаружены при анализе единичных явлений.

Таблицы

Логическая структура темы "Средние величины"

Логическая структура темы "Вариационный ряд"

Коэффициенты К для вычисления среднего квадратичного отклонения

Таблица 5. Коэффициенты К для вычисления среднего квадратичного отклонения по амплитуде вариационного ряда (Аmp) (таблица С.И. Ермолаева)

Таблица 5. Коэффициенты К для вычисления среднего квадратичного отклонения по амплитуде вариационного ряда (Аmp) (таблица С.И. Ермолаева)

Структура вариационного ряда по сигмальным отклонениям

Оценка достоверности результатов исследования

Понятие о средних величинах, свойства и их применение в практике врача.

ВАРИАЦИОННЫЙ РЯД

1. Определение вариационного ряда

Вариационный ряд – это ряд чисел (вариант), характеризующих изучаемый признак, расположенных в ранговом порядке (в убывающей или возрастающей последовательности) с соответствующими этим вариантам (V) частотами (Р).

V– варианта , каждое числовое значение изучаемого количественного признака.

Р– численность отдельной варианты в изучаемой совокупности, величина, указывающая сколько раз встречается данная варианта в вариационном ряду.

N– общее число наблюдений , из которых состоит вариационный ряд.

Вариационный ряд применяется для определения среднего уровня признака (средних величин) и уровней разнообразия признака (критериев разнообразия).

2. Построение вариационного ряда:

а) Провести ранжирование вариант ряда, т.е. расположить их в убывающей или возрастающей последовательности.

б) Составить вариационный ряд (ряд) вариант с соответствующими им частотами.

в) Подсчитать число наблюдений (∑ p= n)

3. Виды вариационных рядов

1) Простой – каждой варианте (V) соответствует частота р = 1.

2) Взвешенный – варианты в ряду встречаются с разной частотой (p > 1).

4. Преобразование вариационных рядов (группировка).

Группировка – это способ укорочения вариационного ряда в целях уменьшения последующих счетных операций.

5. Этапы построения сгруппированного вариационного ряда.

6. Применение средних величин:

  • Для оценки состояния здоровья: показатели физического развития, например: средний вес, средний рост и т.д.; показатели соматического состояния, например: уровень давления, средний уровень холестерина и т.д.
  • Для оценки организации медицинской помощи: показатели деятельности каждого врача в отдельности и лечебно-профилактического учреждения в целом. Например: среднее число посещений в день к врачу, средняя длительность лечения по отдельным заболеваниям.
  • В санитарно-противоэпидемической работе.

7. Свойства средней арифметической в вариационном ряду:

8. Способы расчета средней арифметической (М).

Среднеарифметический способ расчета применяется для вычисления среднеарифметической простой и среднеарифметической взвешенной.

9. Критерии разнообразия признака и методика их расчета.

1) Среднее квадратическое отклонение – сигма(σ):

а) вычисление по способу моментов;

б) по амплитуде ряда

Аmp = Vmax – Vmin

Коэффициент К находим по таблице в зависимости от числа наблюдений n , на пересечении десятков и единиц.

Например, если n = 32, то К = 4,14.

Таблица 5. Коэффициенты К для вычисления среднего квадратичного отклонения по амплитуде вариационного ряда (Аmp) (таблица С.И. Ермолаева)

Таблица 5. Коэффициенты К для вычисления среднего квадратичного отклонения по амплитуде вариационного ряда (Аmp) (таблица С.И. Ермолаева)

2) Коэффициент вариации (С)

Практическое применение среднего квадратического отклонения.

УЧЕБНОЕ ЗАДАНИЕ К ЗАДАЧАМ:

1. Вычислить среднюю арифметическую величину (М) и критерии разнообразия вариационного ряда (σ, Cv).

2. Оценить полученные результаты и сделать соответствующие выводы.

3. Сравнить полученные данные с результатами других исследований.

ЗАДАЧА-ЭТАЛОН

Условие задачи:

В районе А. проведено измерение роста 67 девушек 17-летнего возраста (данные представлены ниже). Средний рост девушек 17-летнего возраста района В.

М2 = 165,4 см, σ = ±10,2 см.

Расчет по способу средней взвешенной

n = 67

Оценивая полученные результаты (Мv), делаем соответствующие выводы.

Средний рост девушек 17-летнего возраста в районе города А cоставляет 165,36 см, σ = ± 5,07 см.

Сравниваем полученные данные с результатами измерения среднего роста 17-летних девушек в районе В.

М = 165,36 см, σ = ± 5,07 см

М2 = 165,4 см, σ = ± 10,2 см , что свидетельствует о большей вариабельности изучаемого признака в районе В.

Оценка достоверности средних величин проводится по ошибке (m)

Оценка достоверности различий средних величин по величине коэффициента t:

Если t = 1,96 и более, то различия достоверны.

ОПРЕДЕЛЕНИЕ НЕОБХОДИМОЙ ЧИСЛЕННОСТИ ВЫБОРКИ

Одной из наиболее важных и ответственных задач при организации и проведении выборочного наблюдения - установление необходимой численности выборочной совокупности. То есть такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.

При этом должно быть учтено:

1) с какой степенью точности следует получить предельную ошибку выборки в результате выборочного наблюдения;

2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения;

3) какова степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.

Это значит, что необходимая численность выборки ( n ) устанавливается в зависимости от размеров предельной ошибки выборки ( ∆ ), от величины коэффициента доверия ( t ) и от размеров величины дисперсии ( σ2 ).

Сами формулы необходимой численности выборки выводятся из формул предельной ошибки выборки следующим образом.

С помощью вариационного ряда и вариационной кривой можно выразить наследственной(какой именно?) или ненаследственной изменчивости? Приведите пример.

Вариационный ряд (врц. кривая) строится на различных показателях одного и того же признака. Например-признак: рост мужчин (женщин) для определённой народности, а показатель- данные в см на каждого отдельного человека, от минимума до максим. в этой группе.
Крайние значения вариац. ряда-макс. и минимум показывают границы наследственной (комбинативной )изменчивости. Ненаследственная изменчивость -это все значения внутри всего ряда, т. е. колебания признака.

Группы варьирующих величин называют вариациями или классами. Варьированием называется само явление изменчивости организмов, признаков, величин и т.д.

Пример 1. Имеются данные о суточных удоях коров, кг: 12; 8,4; 10,7; 12,3; 7,6; 15,8; 20,4; 16,7; 13,7; 14,1; 18,7; 11,2; 12,3; 14,7; 16,1; 13,2; 8,0; 13,7; 15,1; 9,2; 16,0; 17,4; 13,1; 12,5; 11,5; 13,8; 11,6; 10,2; 14,8; 9,4; 6,1; 8,2; 18,3; 22,9; 11,5; 15,2; 14,0; 9,5; 10,8; 12,0.

Для составления вариационного ряда по данному признаку необходимо:

1. Варианты сгруппировать в классы, для чего находятлимиты, в нашем примере минимальное – 6,1 и максимальное значение – 22,9.

2. Определяют разницу между показателями 22,9 - 6,1 = 16,8.

3. Находят классное расстояние по формуле:

а) Число классов зависит от количества особей в выборке, точности исследований и т.д.

Принято: количество особей число классов

201 – и более 12 – 17

б) Полученный указатель классового промежутка для удобства следует округлить, например: 382 до 400; 43,7 до 40; 2,5 до 3; и т.д. При округлении допускается уменьшение или увеличение количества классов. В нашем примере выбрано 6 классов.

4. Установить начало границы первого класса. Оно должно быть целым круглым числом, близким к минимуму, но не больше его и желательно, чтобы делилось без остатка на величину классового промежутка.

Определяются границы классов. Нижней границей первого класса служит минимальная величина выборки, округленная до ближайшего меньшего числа. В нашем примере 6,1 надо округлить до 6, которое и будет служить нижней границей первого класса. Прибавив к ней величину классового промежутка (3 кг) находим нижнюю границу второго класса (9). Также на ходим границы и остальных классов (12,15,18,21), чтобы при разноске варианта не попала на границу между классами, проставляют верхнюю границу каждого класса. Для этого уменьшают нижнюю границу каждого класса на 0,1 или на 1, в зависимости от точности измерения. Уменьшив нижние границы на 0,1 кг получим границы первого класса 6,0 – 8,9; второго – 9,0 – 11,9 и т.д.

5. Определив границы классов, разносят все варианты по классам. Разноску вариантов по классам производят по порядку их записи, ставя в классах сначала точки, а когда их наберется 4, то соединять их с черточками:

Число вариант в классе называют частотами и обозначают символом (Р).

Число частот при разноске должно быть равно общему числу вариант при выборке (n).

В примере n = 40.

Двойной ряд чисел, отражающий распределение вариант по классам, называется вариационным рядом.

Составленный вариационный ряд будет иметь следующий вид:

Разноска Р
6 – 8,9
9 – 11,9
12 – 14,9
15 – 17,9
18 – 20,9
21 – 23,9
n = 40 n = 40

В вариационном ряду существует определенная закономерность. Крайние вариации не многочисленны: с приближением к середине ряда частоты вариаций увеличиваются. Тот класс, в который входит максимальное число частот, называется модальным классом. В приведенном примере модальным будет класс 12 – 14,9, на который пришлось 14 частот.

Для наглядности вариационный ряд может быть изображен в виде графика. Для этого на горизонтальной оси располагают классы, а на вертикальной – частоты классов. Точки пересечения этих линий соединяют кривой.

Задание №1. Построить вариационный ряд и вариационную кривую по живой массе коров холмогорской породы (кг): 745, 432, 500, 488, 384, 445, 432, 520, 421, 469, 460, 535, 486, 556, 441, 473, 534, 505, 432, 434, 417, 406, 450, 491, 420, 445, 426, 490, 442, 439, 429, 421, 470, 391, 482, 390, 426, 488, 411, 475, 440, 539, 488, 433, 546, 493, 472, 441, 463, 468, 483, 442, 524, 447, 430, 485, 440, 488, 439, 445, 504, 550, 495, 536, 426, 388, 407, 425, 390, 418, 465, 391, 365, 383, 427, 448, 452, 455, 387, 374, 360, 545, 467, 519, 456, 441, 434, 488, 443, 493, 457, 425, 429, 445, 442, 393, 405, 422, 400, 456, 441.

Контрольные вопросы:

1. Что называется биометрией?

2. Что называется генеральной совокупностью?

3. Какие выборки называются малыми, большими?

4. Что называется вариационным рядом?

5. Как правильно выбрать число классов?

6. Как выбрать границу первого класса?

7. Как рассчитать классовый промежуток?

8. Что такое разноска?

9. Что называется модальным классом?

10. Как построить вариационную кривую?

Группы варьирующих величин называют вариациями или классами. Варьированием называется само явление изменчивости организмов, признаков, величин и т.д.




Пример 1. Имеются данные о суточных удоях коров, кг: 12; 8,4; 10,7; 12,3; 7,6; 15,8; 20,4; 16,7; 13,7; 14,1; 18,7; 11,2; 12,3; 14,7; 16,1; 13,2; 8,0; 13,7; 15,1; 9,2; 16,0; 17,4; 13,1; 12,5; 11,5; 13,8; 11,6; 10,2; 14,8; 9,4; 6,1; 8,2; 18,3; 22,9; 11,5; 15,2; 14,0; 9,5; 10,8; 12,0.

Для составления вариационного ряда по данному признаку необходимо:

1. Варианты сгруппировать в классы, для чего находятлимиты, в нашем примере минимальное – 6,1 и максимальное значение – 22,9.

2. Определяют разницу между показателями 22,9 - 6,1 = 16,8.

3. Находят классное расстояние по формуле:

а) Число классов зависит от количества особей в выборке, точности исследований и т.д.

Принято: количество особей число классов

201 – и более 12 – 17

б) Полученный указатель классового промежутка для удобства следует округлить, например: 382 до 400; 43,7 до 40; 2,5 до 3; и т.д. При округлении допускается уменьшение или увеличение количества классов. В нашем примере выбрано 6 классов.

4. Установить начало границы первого класса. Оно должно быть целым круглым числом, близким к минимуму, но не больше его и желательно, чтобы делилось без остатка на величину классового промежутка.

Определяются границы классов. Нижней границей первого класса служит минимальная величина выборки, округленная до ближайшего меньшего числа. В нашем примере 6,1 надо округлить до 6, которое и будет служить нижней границей первого класса. Прибавив к ней величину классового промежутка (3 кг) находим нижнюю границу второго класса (9). Также на ходим границы и остальных классов (12,15,18,21), чтобы при разноске варианта не попала на границу между классами, проставляют верхнюю границу каждого класса. Для этого уменьшают нижнюю границу каждого класса на 0,1 или на 1, в зависимости от точности измерения. Уменьшив нижние границы на 0,1 кг получим границы первого класса 6,0 – 8,9; второго – 9,0 – 11,9 и т.д.

5. Определив границы классов, разносят все варианты по классам. Разноску вариантов по классам производят по порядку их записи, ставя в классах сначала точки, а когда их наберется 4, то соединять их с черточками:

Число вариант в классе называют частотами и обозначают символом (Р).

Число частот при разноске должно быть равно общему числу вариант при выборке (n).

В примере n = 40.

Двойной ряд чисел, отражающий распределение вариант по классам, называется вариационным рядом.

Составленный вариационный ряд будет иметь следующий вид:

Разноска Р
6 – 8,9
9 – 11,9
12 – 14,9
15 – 17,9
18 – 20,9
21 – 23,9
n = 40 n = 40

В вариационном ряду существует определенная закономерность. Крайние вариации не многочисленны: с приближением к середине ряда частоты вариаций увеличиваются. Тот класс, в который входит максимальное число частот, называется модальным классом. В приведенном примере модальным будет класс 12 – 14,9, на который пришлось 14 частот.

Для наглядности вариационный ряд может быть изображен в виде графика. Для этого на горизонтальной оси располагают классы, а на вертикальной – частоты классов. Точки пересечения этих линий соединяют кривой.

Задание №1. Построить вариационный ряд и вариационную кривую по живой массе коров холмогорской породы (кг): 745, 432, 500, 488, 384, 445, 432, 520, 421, 469, 460, 535, 486, 556, 441, 473, 534, 505, 432, 434, 417, 406, 450, 491, 420, 445, 426, 490, 442, 439, 429, 421, 470, 391, 482, 390, 426, 488, 411, 475, 440, 539, 488, 433, 546, 493, 472, 441, 463, 468, 483, 442, 524, 447, 430, 485, 440, 488, 439, 445, 504, 550, 495, 536, 426, 388, 407, 425, 390, 418, 465, 391, 365, 383, 427, 448, 452, 455, 387, 374, 360, 545, 467, 519, 456, 441, 434, 488, 443, 493, 457, 425, 429, 445, 442, 393, 405, 422, 400, 456, 441.

Статистический ряд распределения – это количественное распределение единиц совокупности на однородные группы по некоторому варьирующему признаку.

В зависимости от природы признака различают атрибутивные и вариационные ряды.
Атрибутивный ряд распределения построен на качественном признаке.
Вариационный ряд распределения построен на количественном признаке.

Например:
Качественными признаками, которые не поддаются измерению, являются: профессия, пол, национальность и т.п.
Количественными признаками, которые можно подсчитать или измерить, являются: количество людей в группе, число повторений в опыте, возраст, вес, рост, скорость, температура и т.п.

По упорядоченности вариационные ряды делятся на упорядоченные (ранжированные) и неупорядоченные . Упорядочить ряд можно по возрастанию или убыванию исследуемого признака.

Классификация рядов распределения

Например:
Дискретными признаками, которые принимают отдельные значения, являются: количество людей в группе, число детей в семье, количество домов, число опытов и т.п.
Непрерывными признаками, которые могут принимать любые значения в интервале, являются: возраст, вес, рост, скорость, температура и т.п.

Варианты – это отдельные значения признака, которые он принимает в вариационном ряду.
Частоты – это численности отдельных вариант.

Распределение учеников по оценкам за контрольную работу

Оценка, \(x_i\) 2 3 4 5 Всего
К-во учеников, \(f_i\) 3 15 10 5 33

В данном ряду признак – это оценка, варианты признака \(x_i\) – это множество , частоты \(f_i\) – это количество учеников, получивших каждую из оценок.

п.2. Дискретный вариационный ряд, полигон частот и кумулята

Дискретный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся прерывно и принимающему конечное множество значений.

Варианты, \(x_i\) \(x_1\) \(x_2\) . \(x_k\)
Частоты, \(f_i\) \(f_1\) \(f_2\) . \(f_k\)

Здесь k - число вариант исследуемого признака.
Тогда общее количество исходов (число единиц в совокупности): \(N=\sum_^k f_i\)

Для распределения учеников по оценкам из нашего примера получаем такой полигон: Полигон частот

Относительная частота варианты \(x_i\) - это отношение частоты \(f_i\) к общему количеству исходов: $$ w_i=\frac,\ \ i=\overline $$ Относительная частота \(w_i\) является эмпирической оценкой вероятности варианты \(x_i\) в исследуемом ряду.

Полигон относительных частот – это ломаная, которая соединяет точки \((x_i,w_i)\).
Полигон относительных частот является эмпирическим законом распределения исследуемого признака.

Накопленные относительные частоты – это суммы: $$ S_1=w_1,\ \ S_i=S_+w_i,\ \ i=\overline $$ Кумулята – это ломаная, которая соединяет точки \((x_i,S_i)\).
Ступенчатая кривая \(F(x_i)\), построенная по точкам \((x_i,S_i)\), является эмпирической функцией распределения исследуемого признака.

Например:
Проведем необходимые расчеты и построим полигон относительных частот, кумуляту и эмпирическую функцию распределения учеников по оценкам.

Оценка, \(x_i\) 2 3 4 5 Всего
К-во учеников, \(f_i\) 3 15 10 5 33
\(w_i\) 0,0909 0,4545 0,3030 0,1515 1
\(S_i\) 0,0909 0,4545 0,8485 1 -

Полигон относительных частот (эмпирический закон распределения)

Кумулята (красная ломаная) и эмпирическая функция распределения (ступенчатая синяя кривая).

Эмпирическая функция распределения: $$ F(x)= \begin 0,\ x\leq 2\\ 0,0909,\ 2\lt x\leq 3\\ 0,5455,\ 3\lt x\leq 4\\ 0,8485,\ 4\lt x\leq 5\\ 1,\ x\gt 5 \end $$

п.3. Выборочная средняя, мода и медиана

Выборочная средняя дискретного вариационного ряда определяется как средняя взвешенная по частотам: $$ X_=\frac=\frac1N\sum_^k x_if_i $$ Или, через относительные частоты: $$ X_=\sum_^k x_iw_i $$

Мода дискретного вариационного ряда – это варианта с максимальной частотой: $$ M_o=x*,\ \ f(x*)=\underset>f_i $$ Мод может быть несколько. Тогда говорят, что ряд мультимодальный .

На полигоне частот мода – это абсцисса самой высокой точки.

Медиана дискретного вариационного ряда – это значение варианты посредине упорядоченного ряда.

Алгоритм:
1. Отсортировать ряд по возрастанию.
2а. Если общее количество измерений N нечётное, найти \(m=\lceil\frac N2\rceil\) и округлить в сторону увеличения. \(M_e=x_m\) - искомая медиана.
2б. Если общее количество измерений N чётное, найти \(m=\frac N2\) и вычислить медиану как среднее \(M_e=\frac>\).

На графике кумуляты медиана – это абсцисса первой точки слева, ордината которой превысила 0,5.
Например:
1) Найдем выборочную среднюю для распределения учеников по оценкам:

Оценка, \(x_i\) 2 3 4 5 Всего
К-во учеников, \(f_i\) 3 15 10 5 33
\(x_if_i\) 6 45 40 25 116

$$ X_=\frac=\frac\approx 3,5 $$ Средняя оценка за контрольную – 3,5.
2) Найдем моду. Максимальная частота – 15 человек – у троечников. Значит: \(M_o=3\).
3) Найдем медиану. Общее количество измерений N=33 - нечетное.
Находим: \(m=\lceil\frac N2\rceil=17\)
Смотрим на ряд слева направо. Сначала у нас идет 3 двоечника, затем 15 троечников.
Вместе их 18, и 17-й человек в ряду - троечник. Группа троечников является медианной: \(M_e=3\).
Также, медиану можно найти по графику кумуляты. (3;0,5455) – это первая слева точка, в которой ордината больше 0,5. Значит, медиана равна абсциссе этой точки, т.е. \(M_e=3\).

п.4. Степень асимметрии вариационного ряда

Мода, медиана и выборочная средняя совпадут, если вариационный ряд является симметричным : $$ X_=M_o=M_e $$ Если вершина распределения сдвинута влево и правая часть ветви длиннее левой (длинный правый хвост), такая асимметрия называется правосторонней . При правосторонней асимметрии: $$ M_o\lt M_e\lt X_ $$ Если вершина распределения сдвинута вправо и левая часть ветви длиннее правой (длинный левый хвост), такая асимметрия называется левосторонней . При левосторонней асимметрии: $$ M_o\gt M_e\gt X_ $$ Для умеренно асимметричных рядов (по Пирсону) модуль разности между модой и средней не более 3 раз превышает модуль разности между медианой и средней: $$ \frac<|M_o-X_|><|M_e-X_|>\geq 3 $$

Например:
Для распределения учеников по оценкам мы получили \(X_=3,5;\ M_o=3;\ M_e=3\).
Т.к. средняя оказалась больше моды и медианы, наше распределение имеет правостороннюю асимметрию (что видно на полигоне частот – правый хвост длиннее).
При этом \(\frac<|M_o-X_|><|M_e-X_|>=\frac=1\lt 3\), т.е. распределение умеренно асимметрично.

п.5. Выборочная дисперсия и СКО

Выборочная дисперсия дискретного вариационного ряда определяется как средняя взвешенная для квадрата отклонения от средней: \begin D=\frac<(x_1-X_)^2 f_1+(x_2-X_)^2 f_2+. +(x_k-X_)^2 f_k>=\\ =\frac1N\sum_^k(x_i-X_)^2 f_i=\frac1N\sum_^k x_i^2 f_i-X_^2 \end Или, через относительные частоты: $$ D=\sum_^k(x_i-X_)^2 w_i=\sum_^k x_i^2 w_i-X_^2 $$

Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $$ \sigma=\sqrt $$

Например:
1) Найдем выборочную дисперсию для распределения учеников по оценкам:

Оценка, \(x_i\) 2 3 4 5 Всего
К-во учеников, \(f_i\) 3 15 10 5 33
\(x_i^2\) 4 9 16 25 -
\(x_i^2 f_i\) 12 135 160 125 432

$$ D=\frac-3,5^2=\frac-3,5^2\approx 0,73 $$ 2) Значение СКО: \(\sigma=\sqrt\approx 0,86\)

п.6. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации

Исправленная выборочная дисперсия дискретного вариационного ряда определяется как: \begin S^2=\frac\sum_^k(x_i-X_)^2 f_i=\fracD \end

В теоретической статистике доказывается, что выборочная дисперсия D является смещенной оценкой дисперсии при распространении на генеральную совокупность.
А именно, выборочная дисперсия D всегда меньше математического ожидания для дисперсии генеральной совокупности.
Исправленная выборочная дисперсия S 2 является несмещенной оценкой.

Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $$ s=\sqrt $$

Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $$ V=\frac>\cdot 100\text $$

п.7. Алгоритм исследования дискретного вариационного ряда

На входе: таблица с вариантами \(x_i\) и частотами \(f_i,\ i=\overline\)
Шаг 1. Составить расчетную таблицу. Найти \(w_i,S_i,x_if_i,x_i^2,x_i^2f_i\)
Шаг 2. Построить полигон относительных частот (эмпирический закон распределения) и график кумуляты с эмпирической функцией распределения. Записать эмпирическую функцию распределения.
Шаг 3. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 4. Найти выборочную дисперсию и СКО.
Шаг 5. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.

п.8. Примеры

Пример 1. На площадке фриланса была проведена выборка из 100 фрилансеров и подсчитано количество постоянных заказчиков, с которыми они работают.
В результате было получено следующее распределение:

Число постоянных заказчиков 0 1 2 3 4 5
Число фрилансеров 22 35 27 11 3 1

Исследуйте полученный вариационный ряд.

\(x_i\) 0 1 2 3 4 5
\(f_i\) 23 35 27 11 3 1 100
\(w_i\) 0,23 0,35 0,27 0,11 0,03 0,01 -
\(S_i\) 0,23 0,58 0,85 0,96 0,99 1 -
\(x_if_i\) 0 35 54 33 12 5 139
\(x_i^2\) 0 1 4 9 16 25 -
\(x_i^2f_i\) 0 35 108 99 48 25 315

2) Полигон относительных частот (эмпирический закон распределения):

Кумулята и эмпирическая функция распределения:

$$ F(x)= \begin 0,\ x\leq 0\\ 0,23,\ 0\lt x\leq 1\\ 0,58,\ 1\lt x\leq 2\\ 0,85,\ 2\lt x\leq 3\\ 0,96,\ 3\lt x\leq 4\\ 0,99,\ 4\lt x\leq 5\\ 1,\ x\gt 5 \end $$ 3) Выборочная средняя: $$ X_=\frac1N\sum_^k x_if_i= \frac\cdot 139=1,39 $$ Мода (абсцисса самой высокой точки на полигоне частот): \(M_0=1\).
Медиана (абсцисса первой слева точки на кумуляте, где значение превысило 0,5): точка (1;0,58), \(M_e=1\).

\(X_\gt M_e=M_0\) – распределение асимметрично, с правосторонней асимметрией.
При этом \(\frac<|M_0-X_|><|M_e-X_|>=\frac=1\lt 3\), т.е. распределение умеренно асимметрично.

4) Выборочная дисперсия: $$ D=\frac1N\sum_^k x_i^2f_i-X_^2=\frac\cdot 315-1,39^2=1,2179\approx 1,218 $$ CKO: $$ \sigma=\sqrt\approx 1,104 $$
5) Исправленная выборочная дисперсия: $$ S^2=\fracD=\frac\cdot 1,218\approx 1,230 $$ Стандартное отклонение выборки: $$ s=\sqrt\approx 1,109 $$ Коэффициент вариации: $$ V=\frac\cdot 100\text=\frac\cdot 100\text\approx 79,8\text\gt 33\text $$ Представленная выборка неоднородна. Полученное значение средней \(X_=1,39\) не может быть распространено на генеральную совокупность всех фрилансеров.

Читайте также: