Полигон и гистограмма реферат

Обновлено: 05.07.2024

Решение . Найдем относительные частоты, для чего разделим частоты на объем выборки:

Т а б л и ц а 11.2

К о н т р о л ь: 0,35 + 0,4 + 0,25 = 1.

Пусть известно статистическое распределение частот количественного признака Х. Обозначим через число наблюдений, при которых наблюдались значения признака, меньшие х, а через — общее число наблюдений (объем выборки). Относительная частота события равна . При изменении x изменяется и относительная частота, т.е. относительная частота есть функция от х.

Эмпирической функцией распределения (функцией распределения выборки) называется функция , определяющая для каждого значения х относительную частоту события , т.е.

где — число вариант, меньших х; — объем выборки.

Функция называется эмпирической, потому что она находится эмпирическим (опытным) путем.

В отличие от эмпирической функции распределения выборки функция распределения генеральной совокупности называется теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция определяет вероятность события , а эмпирическая функция определяет относительную частоту этого же события.

Из закона больших чисел в форме Бернулли (теорема 9.2) следует, что при больших относительная частота события , т.е. и вероятность этого же события мало отличаются одно от другого в том смысле, что

С другой стороны, из определения функции вытекает, что она обладает всеми свойствами :

  1. значения эмпирической функции принадлежат отрезку ;
  2. — неубывающая функция;
  3. если — наименьшая варианта, то при ; если — наибольшая варианта, то при .

Отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической функции распределения генеральной совокупности. Другими словами, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Пример 2. Построить эмпирическую функцию по данному распределению выборки:

Т а б л и ц а 11.3

Решение . Найдем объем выборки: . Наименьшая варианта равна 1, следовательно,

Построение рядов распределения является составным элементом сводки данных статистического наблюдения. Они представляют собой группировку, где известна численность единиц в группах или удельный вес группы в общем итоге. По форме это простейшая разновидность структурной группировки по одному признаку в групповой таблице с двумя графами: группы по выделенному признаку и численности групп. Численные значения признака в рядах распределения называются вариантами , а численность каждой группы – частотами (обычно обозначаются буквой f ). Сумма всех частот определяет численность всей совокупности, или ее объем (это обычно n ). Численности групп, выраженные в долях от общей численности единиц, называются частостями и обозначаются буквой w . Сумма частостей равна 1, если они выражены в ее долях, и 100%, если они выражены в процентах.

Ряды распределения подразделяются на атрибутивные (группировка по атрибутивным признакам) и вариационные (по количественным признакам). По характеру вариации признака различают вариационные ряды распределения прерывные (дискретные) и непрерывные (интервальные) . В первом случае признак изменяется прерывно, т.е. через определенное число единиц. Во втором группировочный признак в определенном интервале может принимать любые значения.

Анализ рядов распределения сопровождается их графическим изображением. Именно графики лучше всего позволяют судить о форме распределения. Для отображения вариационных рядов распределения используются следующие графики: полигон , гистограмму и кумуляту . Полигон применяют для графического изображения дискретного вариационного ряда, и этот график является разновидностью статистических ломаных. В прямоугольной системе координат по оси абсцисс откладываются варианты признака, а по оси ординат – частости каждого варианта. На пересечении абсциссы и ординаты фиксируют точки, соответствующие данному ряду распределения. Соединив эти точки прямыми, получим ломаную, которая и является полигоном, или эмпирической кривой распределения. Для замыкания полигона крайние вершины соединяют с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе, или с серединами предыдущего (перед начальным) и последующим (за последним) интервалов.


Рисунок 1. Графическое изображение полигона

Гистограмма применяется для графического изображения непрерывных (интервальных) вариационных рядов. При этом на оси абсцисс откладывают интервалы ряда. На этих отрезках строят прямоугольники, высота которых по оси ординат в принятом масштабе соответствует частотам. При равных интервалах по оси абсцисс откладывают прямоугольники, сомкнутые друг с другом, с равными основаниями и ординатами, пропорциональными весам. Данный ступенчатый многоугольник и называется гистограммой . Его построение аналогично построению столбиковых диаграмм. Гистограмма может быть преобразована в полигон распределения, для чего середины верхних сторон прямоугольников соединяют отрезками прямых. Две крайние точки прямоугольников замыкают по оси абсцисс на середине интервалов аналогично замыканию полигона. В случае неравенства интервалов график строится не по частотам или частостям, а по плотности распределения (отношению частот или частостей к величине интервала), и тогда высоты прямоугольников графика будут соответствовать величинам этой плотности.

Рисунок 2. Графическое изображение гистограммы

Кумулята изображает кумулятивные ряды распределения, где по оси абсцисс откладывают варианты признака, а по оси ординат – накопленные частоты или частости. Полученные точки соединяют прямыми, образующими кумуляту. При построении кумуляты интервального ряда распределения нижней границе первого интервала соответствует частота, равная нулю, а верхней границе – вся частота данного интервала. Верхней границе второго интервала соответствует накопленная частота, равная сумме частот первых двух интервалов, и т.д. Другой формой кумулятивного ряда распределения является огива , в графике которой накопленные частоты берутся в обратном порядке, т.е. от наибольшего к наименьшему значению изучаемого признака.

Гост

ГОСТ

Полигон частот

Пусть нам дан ряд распределения, записанный с помощью таблицы:


Полигон частот -- ломанная, которая соединяет точки $(x_m,n_m)$ ($m=1,2,\dots ,m)$.

То есть, для построения полигона частот необходимо на оси абсцисс откладывают значения вариант, а по оси ординат соответствующие частоты. Полученные точки соединяют ломанной:

Полигон частот.

Рисунок 2. Полигон частот.

Помимо обычной частоты существует еще понятие относительной частоты.

Получаем следующую таблицу распределения относительных частот:


Полигон относительных частот -- ломанная, которая соединяет точки $(x_m,W_m)$ ($m=1,2,\dots ,m)$.

То есть, для построения полигона частот необходимо на оси абсцисс откладывают значения вариант, а по оси ординат соответствующие относительные частоты. Полученные точки соединяют ломанной:

Полигон относительных частот.

Рисунок 4. Полигон относительных частот.

Гистограмма частот

Помимо понятия полинома для непрерывных значений существует понятие гистограммы.

Гистограмма частот -- ступенчатая фигура, состоящая из прямоугольников с основанием -- частичными интервалами длины $h$ и высотами $\frac$:

Гистограмма частот.

Рисунок 5. Гистограмма частот.

Готовые работы на аналогичную тему

Заметим, что площадь одного такого прямоугольника $\frac=n_i$. Следовательно, площадь всей фигуры равна $\sum=n$, то есть равна объему выборки.

Гистограмма относительных частот -- ступенчатая фигура, состоящая из прямоугольников с основанием -- частичными интервалами длины $h$ и высотами $\frac$:

Гистограмма относительных частот.

Рисунок 6. Гистограмма относительных частот.

Заметим, что площадь одного такого прямоугольника $\frac=W_i$. Следовательно, площадь всей фигуры равна $\sum=W=1$.

Примеры задачи на построение полигона и гистограммы

Пусть распределение частот имеет вид:


Построить полигон относительных частот.

Построим сначала ряд распределения относительных частот по формуле $W_i=\frac$


Получим следующий полигон относительных частот.


Дан ряд непрерывного распределения частот:


Очевидно, что данном случае длина частичного интервала $h=2.$ Найдем высоты прямоугольников каждой точки разбиения.

Гистограмма представляет собой ступенчатую фигуру в виде прямоугольников. Длина каждого прямоугольника представляет собой равный одинаковый частотный интервал и вычисляется по формуле:

ni — частоты;

wi — относительные частоты;

n — объём выборки;

Построить гистограмму относительных, абсолютных и накопленных частот выборки, вычислить эмпирическую плотность распределения частот.

Таблица относительных частот и эмпирическая плотность распределения частоты

График гистограммы абсолютных частот

Гистограмма абсолютных частот график

График гистограммы относительных частот

Гистограмма относительных частот график

Гистограмма накопленных частот график

Полигон это тоже самое, что и многоугольник распределения вероятностей или частот и строится для дискретной случайной величины.

Полигон в статистике — это график (или ломанная линия), отрезки которой соединяют точки с координатами хi, wi в прямоугольной системе координат между собой (см. рисунок ниже) и наглядно показывает распределение частот как для количественных, так и порядковых значений переменных, то плотность распределения случайной величины.

Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат — соответствующие им частоты ni и соединяют точки.

полигон

полигон


9263

Читайте также: