Элементы математической статистики кратко

Обновлено: 05.07.2024

Основным содержанием математической статистики является систематизация, обработка и использование статистической информации для определения статистических закономерностей признака или признаков некоторой совокупности элементов.

Так как сплошная обработка всех элементов совокупности практически невозможна, то, как правило, используется выборочный метод. Отсюда, различают генеральную и выборочную совокупность.

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов, из которых выполняется выборка.

Пусть для изучения количественного (дискретного или непрерывного) признака из генеральной совокупности извлечена выборка , причем наблюдалось раз, раз, раз и , т.е. объем выборки равен . Наблюдаемые значения называют вариантами, а последовательность вариант, записанных в порядке возрастания – вариационным рядом.


Числа наблюдений называют частотами, а их отношения к объему выборки – относительными частотами.

Перчень вариант вариационного ряда и соответствующих им частот, или относительных частот, называют дискретным статистическим распределением выборки.

В табличной форме он имеет вид:

X = xi x1 x2 x3 xk
ni n1 n2 n3 nk
Wi W1 W2 W3 Wk

Полигоном частот называют ломанную, отрезки которой соединяют точки , , …, , где –варианты выборки и – соответствующие им частоты.

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки , где –варианты выборки и – соответствующие им относительные частоты.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения относительную частоту события :


,

где – число вариант, меньших .

Эмпирическая функция обладает следующими свойствами:


1. Значения эмпирической функции принадлежат отрезку .


2. – неубывающая функция.

3. Если – наименьшая варианта, а – наибольшая, то при и при .

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.

Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

Точечной называют статистическую оценку, которая определяется одним числом.

Наилучшей называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Наилучшей оценкой генеральной средней служит выборочная средняя


,

где – варианта выборки, – частота варианты , – объем выборки.

Наилучшей оценкой генеральной дисперсии служит исправленная выборочная дисперсия


.


Модой называют варианту, которая имеет наибольшую частоту.

Например для ряда



Пример. При изучении случайной величины Х в результате 40 независимых наблюдений получили выборку

10, 13, 10, 9, 9, 12, 12, 6, 7, 9, 8, 9, 11, 9, 14, 13, 9, 8, 8, 7, 10, 10, 11, 11, 11, 12, 8, 7, 9, 10, 14, 13, 8, 8, 9, 10, 11, 11, 12, 12.

1. Построить дискретное статистическое распределение для этой выборки, а также полигон относительных частот.

2. Найти: выборочную среднюю и среднее квадратическое отклонение ; моду .

Решение.

1. Построим дискретное статистическое распределение



Найдем относительные частоты, для чего разделим частоты на объем выборки:


.

Запишем распределение относительных частот:



1/40 3/40 6/40 8/40 6/40 6/40 5/40 3/40 2/40


Контроль: .

Отложим на оси абсцисс варианты , а на оси ординат – соответствующие им относительные частоты . Соединив точки отрезками прямых, получим искомый полигон относительных частот рис. 6.






















Рис. 6.


2. Так как , то в соответствии с вышеприведенными формулами получим выборочную среднюю



.


Для вычисления определим



.


.



В данном статистическом распределении мода равна , так как эта варианта имеет наибольшую частоту появления

Задания типа 61-70

Линейная корреляция. Уравнение прямой линии регрессии.

Связи между различными явлениями в природе сложны и многообразны, их можно определенным образом классифицировать. В технике и естествознании часто речь идет о функциональной зависимости между переменными х и у, когда каждому возможному значению х поставлено в однозначное соответствие определенное значение у, например, зависимость между давлением и объемом газа (закон Бойля-Мариотта).

В реальном мире многие явления природы происходят в обстановке действия многочисленных факторов, влияние каждого из которых мало, а число их велико. В этом случае связь теряет свою однозначность и изучаемая физическая система переходит не в определенное состояние, а в одно из возможных для нее состояний. Зависимость между величинами Х и У называется статистической, если каждому значению одной переменной соответствует несколько значений другой, встречающихся не одинаково часто. Иными словами, каждому значению одной величины Х соответствует закон распределения другой величины У.

Статистическая зависимость между величинами Х и У называется корреляционной, если изменение величины Х влечет за собой изменение среднего значения величины У.

Пример. Изучается зависимость между величинами Х и У. Каждому значению Х соответствует несколько значений У.

Х У
5, 6, 10
6, 10, 12
10, 12, 14


Условной средней называется среднее арифметическое значений У, соответствующих данному значению Х. Так

; ; .


Заметим, что каждому значению величины Х соответствует единственное значение условной средней, т.е. зависимость является функциональной: .

Следовательно, корреляционной зависимостью между величинами Х и У называется функциональная зависимость условной средней от х. Уравнение зависимости называется уравнением регрессии у на х.

График функции называется линией регрессии у на х. Аналогично можно вычислить условные средние , определить зависимость и построить линию регрессии х на у.

В корреляционном анализе решают две основные задачи:

1) Установить форму корреляционной связи, т.е. установить вид функций f(x), φ(y) (линейные, квадратические, показательные и др.).

Для определения вида зависимости в прямоугольной системе координат строят точки, координаты которых (х, у) получены в результате наблюдений. Если точки расположены, например, вблизи некоторой прямой, то корреляцию называют линейной.


2) Оценить тесноту корреляционной связи степенью рассеивания значений у около условной средней .

Большое рассеивание свидетельствует о слабой зависимости у от х или об ее отсутствии.

Малое рассеивание свидетельствует о наличии тесной связи между х и у.

Пусть установлено, что зависимость между признаками Х и У имеет линейный характер. Тогда уравнение регрессии может быть представлено в виде:


.

При этом х называется регрессором, угловой коэффициент прямой а0 называется коэффициентом регрессии у на х и обозначается . Если исследуемая зависимость представлена в виде , то коэффициент b0 называется коэффициентом регрессии х на у и обозначается . В качестве меры тесноты связи в случае линейной зависимости используют коэффициент корреляции r:


.

Если r > 0, то увеличение одной величины ведет к увеличению другой величины; если r

Свидетельство и скидка на обучение каждому участнику

Зарегистрироваться 15–17 марта 2022 г.

Конспект лекций по математике

для студентов II курса

социально-экономического профиля СПО

Вопросы: 1. Введение

2. Генеральная совокупность и выборка

3. Вариационный и статистический ряды

4. Интервальный статистический ряд

5. Статистические характеристики выборки

Математическая статистика — раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностно-статистических моделей случайных явлений.

Целью математической статистики является описание, объяснение и предсказание явлений действительности на основе установленных законов.

Предметом математической статистики является изучение случайных величин (или случайных событий) по результатам наблюдений (статистическим данным).

Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Рассмотрим схему исследований при решении задачи математической статистики. Эти исследования делятся на два этапа.

На первом этапе, который называют описательной статистикой ( descriptive statistics ), путем наблюдений и экспериментов собираются, регистрируются статистические данные, затем они упорядочиваются, представляются в компактной, наглядной или функциональной форме. Вычисляются различные средние величины, характеризующие статистические данные.

На втором этапе на основе вычислений на предшествующем этапе необходимо получить достаточно обоснованные выводы о свойствах исследуемого случайного явления, используя методы оценивания и проверки гипотез.

Современная математическая статистика разрабатывает способы определения числа необходимых наблюдений, испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) позволяет принимать решения в условиях неопределенности.

Математическая статистика возникла в XVII в. и развивалась вместе с теорией вероятностей. Основоположниками науки являются Я. Бернулли, К.Гаусс, П. Лаплас. В XIX в. большой вклад внесли российские математики П. Чебышев, А. Марков, А. Ляпунов. В XX в. важные результаты были получены советскими математиками В.И. Романовским, Е.Е. Слуцким, А.Н. Колмогоровым, Н.В. Смирновым, английскими учеными Э. Пирсоном, У. Го́ссе (Стьюдентом), Р. Фишером, Г. Крамером, американскими учеными Ю. Нейманым, А. Вальдом, Р. Мизесом и другими учеными.

2. Генеральная совокупность и выборка

Рассмотрим абстрактный эксперимент, в результате его проведения мы наблюдаем или измеряем значение х изучаемой случайной величины Х (это может быть в действительности величина инфляции, параметр детали при массовом производстве, цена на жилье в отдельных районах столичных городах, любой общий количественный признак определенного множества объектов).

Определение 1 . Генеральной совокупностью называется множество возможных значений изучаемой случайной величины Х с законом распределения F ( X ) . Возможные значения генеральной совокупности Х называются ее элементами . Закон распределения F ( X ) называется генеральным законом распределения , а числовые характеристики Хгенеральными числовыми характеристиками .

Генеральная совокупность может быть конечной (множество значений случайной величины Х конечно) или бесконечной. Например, 1) Х – число детей, родившихся в городе за определенный промежуток времени. Генеральная совокупность это множество неотрицательных чисел с некоторым законом распределения. 2) Х – величина отклонения детали от заданного размера при массовом производстве. Генеральная совокупность это множество действительных чисел с некоторым законом распределения.

Иногда из всей генеральной совокупности случайно отбирают ограниченное число объектов и подвергают их изучению, по свойствам которой судят о свойствах генеральной совокупности.

Определение 2 . Выборочной совокупностью или выборкой называется совокупность случайно отобранных элементов их генеральной совокупности. Объемом выборки называется число ее элементов.

Выборку нельзя составить как попало. Выборка должна быть репрезентативной (представительной) и однородной. Репрезентативность обеспечивается простым случайным выбором:

Выбор является случайным.

Каждый элемент генеральной совокупности может быть выбран.

Каждый элемент выбирается независимо от остальных.

Все элементы выборки получаются в равных условиях.

Однородность означает, что условия проведения экспериментов для получения выборки не должны меняться. Но на практике простой случайный выбор не всегда осуществим (он является эталонным), применяются различные виды выбора: механический выбор (измерения проводят через равные промежутки времени, контролируется каждая m деталь, выбирается каждый s человек по списку); серийный выбор (контролируется не одна таблетка, а вся упаковка, не один человек группы, а вся группа); типический выбор (урожайность участка, социологический опрос, зарплата в отрасли); выбор с помощью случайных независимых измерений (температура среды, загрязненность воды, величина тока) и другие. Все виды выборов могут комбинироваться между собой. В математической статистике применяется только простой случайный выбор.

После того как сделана выборка, все ее элементы обследуют по отношению к генеральной совокупности и в результате получают наблюдаемые данные. Далее они упорядочиваются, представляются в компактной, наглядной или функциональной форме. Вычисляются различные средние величины, характеризующие статистические данные.

3. Вариационный и статистические ряды

Обычно выборка представляет собой множество чисел, расположенных в беспорядке. Для дальнейшего изучения выборку подвергают обработке.

Определение 3 . Наблюдаемые значения выборки называются вариантами . Последовательность всех вариант, записанных в возрастающем порядке, называется вариационным рядом .

Архангельск – 59, Барнаул – 45, Белгород – 56.5, Владивосток – 94, Волгоград – 48, Воронеж -48, Екатеренбург – 70, Казань – 64, Калининград – 60.5, Киров -47, Магнитогорск – 31, Майкоп – 36.5, Москва – 211.5, Рязань – 47, Самара – 65, Сочи – 83.5, Томск – 52, Тула – 52, Ярославль – 47.

Построим вариационный ряд.

Элемент выборки 211.5 является аномальным, что объясняется исключительным положением города. Этот элемент следует исключить из выборки. Тогда вариационный ряд примет вид:

31, 36.5, 45, 47, 48, 52, 56.5, 59, 60.5, 64, 65, 70, 83.5, 94.

Пусть из генеральной совокупности извлечена выборка: варианта х 1 наблюдалась n 1 раз, варианта х 2 n 2 раз, …, варианта х k n k раз и n 1 + + n 2 +…+ n k = n объем выборки . Числа вариантов n 1 , n 2 ,…, n k называются частотами . Отношения частот к объему выборки , где i =1,2,…, k , называются относительными частотами.

Определение 4 . Статистическим рядом называется вариационный ряд с указанием соответствующих частот или относительных частот.

В общем случае статистический ряд представляют в виде таблиц.

Пример 2. Преобразуем выборку из примера 1 в статистический ряд частот.

Объем выборки n =18 .

Статистический ряд относительных частот.

Статистический ряд можно изобразить графически в виде полигона частот или полигона относительных частот , что позволяет получить наглядное представление о закономерности варьирования наблюдаемых значений случайной величины. В прямоугольной системе координат наносят точки с координатами ( x i , n i ) или ( x i , ), полученные точки соединяют отрезками, полученную ломанную называют полигоном.

Для примера 2 полигон частот можно представить в виде рисунок 1.

Статистический ряд графически можно изобразить в виде кумулятивной кривой (кривой сумм — кумуляты). При построении кумуляты дискретного вариационного ряда на оси абсцисс откладывают варианты x i , а по оси ординат соответствующие им накопленные частоты . Соединяя точки с координатами ( x i ) отрезками прямых, получаем ломаную (кривую), которую называют кумулятой. Для получения накопительных частот и дальнейшего построения точек ( x i ) составляется расчетная таблица.

Накопительные относительные частоты

График кумуляты дает представление о графике функции распределения F ( X ) генеральной совокупности.

Пример 3. Для статистического ряда примера 2 составим расчетную таблицу для накопительных частот и построим кумуляту (Рисунок 2).

4. Интервальный статистический ряд

Если выборка получена из непрерывной генеральной совокупности, объем наблюдаемых значений случайной величины большой, то вариационный и статистические ряды будут трудно обозримыми множествами и строят интервальный статистический ряд. Для построения такого ряда весь интервал варьирования наблюдаемых значений случайной величины разбивают на ряд частичных интервалов и подсчитывают частоту попадания значений величины в каждый частичный интервал.

Пусть , , . — результаты независимых наблюдений над генеральной совокупностью Х . Если количество наблюдений n достаточно большое (), то результаты наблюдений сводят в интервальный статистический ряд, который формируется следующим образом.

Вычисляют размах варьирования R признака Х , как разность между наибольшим и наименьшим значениями признака, то есть

. Размах R варьирования признака Х делится на k разных частей и таким образом определяется число интервалов в таблице. Величину k выбирают, пользуясь следующими правилами:

1), (30≤ n ≤ 1000; при n =40 k =6; при n =100 k =8; при n =200 k =10, при n =400 k =12; при n =1000 k =17);

2) k = 1 +3,3 lg n (формула Старджесса).

3) 6 ≤ k ≤10.

Длина h каждого частичного интервала определяется по формуле . Величину h обычно округляют до некоторого значения d . Например, если результаты признака Х — целые числа, то h округляют до целого значения, если содержат десятичные знаки, то h округляют до значения d , содержащего такое же число десятичных знаков. Затем подсчитывается частота n i , с которой попадают значения признака Х в i -ый интервал. Значение , которое попадает на границу интервала относятся к левому. За начало первого интервала рекомендуется брать величину

Промежуточные интервалы получают прибавляя к концу предыдущего интервала длину частичного интервала h :

Основным содержанием математической статистики является систематизация, обработка и использование статистической информации для определения статистических закономерностей признака или признаков некоторой совокупности элементов.

Так как сплошная обработка всех элементов совокупности практически невозможна, то, как правило, используется выборочный метод. Отсюда, различают генеральную и выборочную совокупность.

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов, из которых выполняется выборка.

Пусть для изучения количественного (дискретного или непрерывного) признака из генеральной совокупности извлечена выборка , причем наблюдалось раз, раз, раз и , т.е. объем выборки равен . Наблюдаемые значения называют вариантами, а последовательность вариант, записанных в порядке возрастания – вариационным рядом.

Числа наблюдений называют частотами, а их отношения к объему выборки – относительными частотами.

Перчень вариант вариационного ряда и соответствующих им частот, или относительных частот, называют дискретным статистическим распределением выборки.

В табличной форме он имеет вид:

X = xi x1 x2 x3 xk
ni n1 n2 n3 nk
Wi W1 W2 W3 Wk

Полигоном частот называют ломанную, отрезки которой соединяют точки , , …, , где –варианты выборки и – соответствующие им частоты.

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки , где –варианты выборки и – соответствующие им относительные частоты.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения относительную частоту события :

где – число вариант, меньших .

Эмпирическая функция обладает следующими свойствами:

Свойство 1. Значения эмпирической функции принадлежат отрезку .

Свойство 2. – неубывающая функция.

Свойство 3. Если – наименьшая варианта, а – наибольшая, то при и при .

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.

Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

Точечнойназывают статистическую оценку, которая определяется одним числом.

Наилучшей называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Наилучшей оценкой генеральной средней служит выборочная средняя

где – варианта выборки, – частота варианты , – объем выборки.

Наилучшей оценкой генеральной дисперсии служит исправленная выборочная дисперсия

Модой называют варианту, которая имеет наибольшую частоту.

Например для ряда

Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно, то центр вариационного ряда и есть медиана; если число вариант четно, то медиана равна полусумме двух центральных вариант.

Например, для ряда медиана равна 5; для ряда медиана равна .

Размахом варьирования называют разность между наибольшей и наименьшей вариан-тами:

Например, для ряда размах равен .

Задачи типа 431-440.

ÕПример.При изучении случайной величины Х в результате 40 независимых наблюдений получили выборку

10, 13, 10, 9, 9, 12, 12, 6, 7, 9, 8, 9, 11, 9, 14, 13, 9, 8, 8, 7, 10, 10, 11, 11, 11, 12, 8, 7, 9, 10, 14, 13, 8, 8, 9, 10, 11, 11, 12, 12.

1. Построить дискретное статистическое распределение для этой выборки, а также полигон относительных частот.

2. Найти: 1) выборочную среднюю и среднее квадратическое отклонение ;

2) моду , медиану и размах варьирования ;

Решение. 1.

Построим дискретное статистическое распределение

Найдем относительные частоты, для чего разделим частоты на объем выборки:




Запишем распределение относительных частот:

1/40 3/40 6/40 8/40 6/40 6/40 5/40 3/40 2/40


Отложим на оси абсцисс варианты , а на оси ординат – соответствующие им относительные частоты . Соединив точки отрезками прямых, получим искомый полигон относительных частот рис.1.

2.1. Так как , то в соответствии с вышеприведенными формулами получим выборочную среднюю

Для вычисления определим

2.2. В данном статистическом распределении мода равна , так как эта варианта имеет наибольшую частоту появления

Медиана в приведенном примере равна , так как варианта делит вариационный ряд на две части, которые имеют одинаковое количество вариант

Размах варьирования будет n

Основным содержанием математической статистики является систематизация, обработка и использование статистической информации для определения статистических закономерностей признака или признаков некоторой совокупности элементов.

Так как сплошная обработка всех элементов совокупности практически невозможна, то, как правило, используется выборочный метод. Отсюда, различают генеральную и выборочную совокупность.

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов, из которых выполняется выборка.

Пусть для изучения количественного (дискретного или непрерывного) признака из генеральной совокупности извлечена выборка , причем наблюдалось раз, раз, раз и , т.е. объем выборки равен . Наблюдаемые значения называют вариантами, а последовательность вариант, записанных в порядке возрастания – вариационным рядом.

Числа наблюдений называют частотами, а их отношения к объему выборки – относительными частотами.

Перчень вариант вариационного ряда и соответствующих им частот, или относительных частот, называют дискретным статистическим распределением выборки.

В табличной форме он имеет вид:

X = xi x1 x2 x3 xk
ni n1 n2 n3 nk
Wi W1 W2 W3 Wk

Полигоном частот называют ломанную, отрезки которой соединяют точки , , …, , где –варианты выборки и – соответствующие им частоты.

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки , где –варианты выборки и – соответствующие им относительные частоты.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения относительную частоту события :

где – число вариант, меньших .

Эмпирическая функция обладает следующими свойствами:

Свойство 1. Значения эмпирической функции принадлежат отрезку .

Свойство 2. – неубывающая функция.

Свойство 3. Если – наименьшая варианта, а – наибольшая, то при и при .

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение.

Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

Точечнойназывают статистическую оценку, которая определяется одним числом.

Наилучшей называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки.

Наилучшей оценкой генеральной средней служит выборочная средняя

где – варианта выборки, – частота варианты , – объем выборки.

Наилучшей оценкой генеральной дисперсии служит исправленная выборочная дисперсия

Модой называют варианту, которая имеет наибольшую частоту.

Например для ряда

Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если число вариант нечетно, то центр вариационного ряда и есть медиана; если число вариант четно, то медиана равна полусумме двух центральных вариант.

Например, для ряда медиана равна 5; для ряда медиана равна .

Размахом варьирования называют разность между наибольшей и наименьшей вариан-тами:

Например, для ряда размах равен .

Задачи типа 431-440.

ÕПример.При изучении случайной величины Х в результате 40 независимых наблюдений получили выборку

10, 13, 10, 9, 9, 12, 12, 6, 7, 9, 8, 9, 11, 9, 14, 13, 9, 8, 8, 7, 10, 10, 11, 11, 11, 12, 8, 7, 9, 10, 14, 13, 8, 8, 9, 10, 11, 11, 12, 12.

1. Построить дискретное статистическое распределение для этой выборки, а также полигон относительных частот.

2. Найти: 1) выборочную среднюю и среднее квадратическое отклонение ;

2) моду , медиану и размах варьирования ;

Решение. 1.

Построим дискретное статистическое распределение

Найдем относительные частоты, для чего разделим частоты на объем выборки:

Запишем распределение относительных частот:

1/40 3/40 6/40 8/40 6/40 6/40 5/40 3/40 2/40


Отложим на оси абсцисс варианты , а на оси ординат – соответствующие им относительные частоты . Соединив точки отрезками прямых, получим искомый полигон относительных частот рис.1.

2.1. Так как , то в соответствии с вышеприведенными формулами получим выборочную среднюю

Для вычисления определим

2.2. В данном статистическом распределении мода равна , так как эта варианта имеет наибольшую частоту появления

Медиана в приведенном примере равна , так как варианта делит вариационный ряд на две части, которые имеют одинаковое количество вариант

Продолжаем изучать элементарные задачи по математике. Сегодня мы поговорим о статистике.

Статистика — это раздел математики в котором изучаются вопросы сбора, измерения и анализа информации, представленной в числовой форме. Происходит слово статистика от латинского слова status (состояние или положение дел).

Так, с помощью статистики мы можем узнать свое положение дел, касающихся финансов. С начала месяца можно вести дневник расходов и по окончании месяца, воспользовавшись статистикой, узнать сколько денег в среднем мы тратили каждый день или какая потраченная сумма была наибольшей в этом месяце либо узнать какую сумму мы тратили наиболее часто.

На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце немного сбавить аппетит, чтобы тратить меньше денег, либо наоборот позволить себе не только хлеб с водой, но и колбасу.

Выборка. Объем. Размах

Что такое выборка? Если говорить простым языком, то это отобранная нами информация для исследования. Например, мы можем сформировать следующую выборку — суммы денег, потраченных в каждый из шести дней. Давайте нарисуем таблицу в которую занесем расходы за шесть дней

расходы за шесть дней статистика рисунок 1

Выборка состоит из n-элементов. Вместо переменной n может стоять любое число. У нас имеется шесть элементов, поэтому переменная n равна 6

Элементы выборки обозначаются с помощью переменных с индексами . Последний элемент является шестым элементом выборки, поэтому вместо n будет стоять число 6.

расходы за шесть дней статистика рисунок 2

Обозначим элементы нашей выборки через переменные


Количество элементов выборки называют объемом выборки. В нашем случае объем равен шести.

Размахом выборки называют разницу между самым большим и маленьким элементом выборки.

В нашем случае, самым большим элементом выборки является элемент 250 , а самым маленьким — элемент 150 . Разница между ними равна 100

размах равен 100 R 100

Среднее арифметическое

Понятие среднего значения часто используется в повседневной жизни.

  • средняя зарплата жителей страны;
  • средний балл учащихся;
  • средняя скорость движения;
  • средняя производительность труда.

Речь идет о среднем арифметическом — результате деления суммы элементов выборки на их количество.

Среднее арифметическое — это результат деления суммы элементов выборки на их количество.

формула нахождения среднего значения

Вернемся к нашему примеру

расходы за шесть дней статистика рисунок 2

Узнаем сколько в среднем мы тратили в каждом из шести дней:

расходы за шесть дней статистика рисунок 3

Средняя скорость движения

При изучении задач на движение мы определяли скорость движения следующим образом: делили пройденное расстояние на время. Но тогда подразумевалось, что тело движется с постоянной скоростью, которая не менялась на протяжении всего пути.

В реальности, это происходит довольно редко или не происходит совсем. Тело, как правило, движется с различной скоростью.

Когда мы ездим на автомобиле или велосипеде, наша скорость часто меняется. Когда впереди нас помехи, нам приходиться сбавлять скорость. Когда же трасса свободна, мы ускоряемся. При этом за время нашего ускорения скорость изменяется несколько раз.

Речь идет о средней скорости движения. Чтобы её определить нужно сложить скорости движения, которые были в каждом часе/минуте/секунде и результат разделить на время движения.

Задача 1. Автомобиль первые 3 часа двигался со скоростью 66,2 км/ч, а следующие 2 часа — со скоростью 78,4 км/ч. С какой средней скоростью он ехал?

средняя скорость движения рисунок 1

Сложим скорости, которые были у автомобиля в каждом часе и разделим на время движения (5ч)

нахождение средней скорости движения задача 1

Значит автомобиль ехал со средней скоростью 71,08 км/ч.

Определять среднюю скорость можно и по другому — сначала найти расстояния, пройденные с одной скоростью, затем сложить эти расстояния и результат разделить на время. На рисунке видно, что первые три часа скорость у автомобиля не менялась. Тогда можно найти расстояние, пройденное за три часа:

66,2 × 3 = 198,6 км.

Аналогично можно определить расстояние, которое было пройдено со скоростью 78,4 км/ч. В задаче сказано, что с такой скоростью автомобиль двигался 2 часа:

78,4 × 2 = 156,8 км.

Сложим эти расстояния и результат разделим на 5

нахождение средней скорости движения задача 1 второй способ

Задача 2. Велосипедист за первый час проехал 12,6 км, а в следующие 2 часа он ехал со скоростью 13,5 км/ч. Определить среднюю скорость велосипедиста.

нахождение средней скорости движения задача 2

Скорость велосипедиста в первый час составляла 12,6 км/ч. Во второй и третий час он ехал со скоростью 13,5. Определим среднюю скорость движения велосипедиста:

нахождение средней скорости движения задача 2 рисунок 2

Мода и медиана

Модой называют элемент, который встречается в выборке чаще других.

Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров

таблица для определения моды рисунок 1

Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.

Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат

выборка люди и смартфоны

Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.

Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.

Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:

таблица для определения медианы рисунок 1

Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:

таблица для определения медианы рисунок 2

Выпишем рост спортсменов отдельно:

180, 182, 183, 184 , 185, 188, 190

В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.

Медианой упорядоченной выборки называют элемент, располагающийся посередине.

Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.

В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану

рост семерых спортсменов рисунок 1

Но возможны случаи, когда количество элементов выборки чётно.

К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:

таблица для определения медианы рисунок 3

Построим этих шестерых спортсменов по росту:

таблица для определения медианы рисунок 4

Выпишем рост спортсменов отдельно:

180, 182, 184, 186, 188, 190

В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.

В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.

Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186

рост шестерых спортсменов рисунок 2

Найдем среднее арифметическое элементов 184 и 186

средняя арифметическое чисел 184 и 186

Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.

Поэтому более точное определение медианы зависит от количества элементов в выборке.

Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.

Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.

Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:

Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:

0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1

Определим среднее арифметическое для данной выборки — получим значение 2,2

среднее ариф для 011121235450161

По данному значению можно сказать, что в среднем у спортсменов 2,2 очка

Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:

0, 0, 1, 1, 1, 1, 1 , 1 , 2, 2, 3, 4, 5, 5, 6

В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.

Частота

Частота это число, которое показывает сколько раз в выборке встречается тот или иной элемент.

Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует 36 школьников. Составим таблицу в которую будем заносить число подтягиваний, а также число участников, которые выполнили столько подтягиваний.

таблица для определения частоты рисунок 1

По таблице можно узнать сколько человек выполнило 5, 10 или 15 подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10 подтягиваний выполнили восемь человек, 15 подтягиваний выполнили три человека.

таблица для определения частоты рисунок 2

Такие таблицы называют таблицами частот.

Частота обладает следующим свойством: сумма частот равна общему числу данных в выборке.

Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведенные в таблице:

4 + 5 + 10 + 8 + 6 + 3 = 36

Относительная частота

Относительная частота это в принципе та же самая частота, которая была рассмотрена ранее, но только выраженная в процентах.

Относительная частота равна отношению частоты на общее число элементов выборки.

Вернемся к нашей таблице:

таблица для определения частоты рисунок 2

Пять подтягиваний выполнили 4 человека из 36. Шесть подтягиваний выполнили 5 человек из 36. Восемь подтягиваний выполнили 10 человек из 36 и так далее. Давайте заполним таблицу с помощью таких отношений:

таблица для определения частоты рисунок 3

Выполним деление в этих дробях:

таблица для определения частоты рисунок 4

Выразим эти частоты в процентах. Для этого умножим их на 100. Умножение на 100 удобно выполнить передвижением запятой на две цифры вправо:

таблица для определения частоты рисунок 5

Теперь можно сказать, что пять подтягиваний выполнили 11% участников, 6 подтягиваний выполнили 14% участников, 8 подтягиваний выполнили 28% участников и так далее.

Понравился урок?
Вступай в нашу новую группу Вконтакте и начни получать уведомления о новых уроках

Возникло желание поддержать проект?
Используй кнопку ниже

Читайте также: