Математико статистическая обработка данных реферат

Обновлено: 04.07.2024

Целью данной курсовой работы является изучение и, как в следствии, расширение знаний о математической статистике, ознакомление с методами обработки экспериментального материала, с целью получения надежных выводов, ознакомление с методикой применения статистических критериев для проверки гипотез.

1. Постановка задачи. Цель работы. Исходные данные

. Вычисление основных выборочных характеристик по заданной выборке

. Результаты вычисления интервальных оценок для математического ожидания и дисперсии

. Результаты ранжирования выборочных данных и вычисление моды и медианы

. Параметрическая оценка функции плотности распределения

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона

Список использованной литературы

интервальный дисперсия выборочный данные

Целью данной курсовой работы является изучение и, как в следствии, расширение знаний о математической статистике, ознакомление с методами обработки экспериментального материала, с целью получения надежных выводов, ознакомление с методикой применения статистических критериев для проверки гипотез.

. Постановка задачи. Цель работы. Исходные данные

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

По выборке объёма N провести статистическую обработку результатов эксперимента.

Изучить и усвоить основные понятия математической статистики. Овладеть методикой статистического оценивания числовых характеристик случайной величины и нормального закона распределения. Ознакомиться с методикой применения статистических критериев для проверки гипотез.

Проведен эксперимент, в результате которого была получена выборка N = 60, которая соответствует случайной величине, распределённой по нормальному закону. Данная выборка представлена в таблице 1.1

10.2836 10.7148 9.4963 12.8971 10.9190 12.8067
14.0510 7.3201 7.9052 15.2359 10.6512 9.6341
11.0156 12.4240 8.9727 12.1429 13.1025 11.9252
11.8667 8.3636 10.2223 9.1232 12.2658 11.1741
10.8028 10.4434 11.2314 9.6948 11.0725 8.3374
12.4564 9.5759 8.7116 14.2939 9.5319 13.1150
11.8891 17.3345 6.9275 13.3734 13.4795 13.8429
12.1071 11.7579 14.8285 9.5450 12.1039
12.9304 7.3669 12.4592 12.3466 11.8461 11.5607
10.7288 15.9654 16.1488 9.8759 12.9522 12.5015

2. Вычисление основных выборочных характеристик по заданной выборке среднее арифметическое случайной величины Х (N = 60)

) среднее линейное отклонение

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

) дисперсия случайной величины Х

) несмещенная оценка дисперсии

5) среднеквадратическое отклонение

6) несмещенная выборочная оценка для среднеквадратического отклонения

7) коэффициент вариации

) коэффициент асимметрии случайной величины Х

9) коэффициент эксцесса случайной величины Х

10) вариационный размах

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

= Xmax — Xmin = 17,3345- 6,9275= 10,407

На основании полученных вычислений можно сделать следующие выводы:

Выполняется необходимое условие для того, чтобы выборка имела нормальный закон распределения, т.к. для коэффициента вариации V выполняется неравенство:

V = Xmax, то есть X8 = 18,1775> Xmax = 17,3345.

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

По результатам вычислений составляем таблицу. В первой графе таблицы помещаем частичные интервалы, во второй графе — середины интервалов, в третьей графе записано количество элементов выборки, попавших в каждый интервал — частоты, в четвертой графе записаны относительные частоты и в пятой графе записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности. Данная информация представлена в таблице 4.2.

Значение выборочной функции и плотности

h ni3
[6,1775; 7,6775) 6,9275 3 0,05 0,033 33
[7,6775; 9,1775) 8,4275 6 0,1 0,067 67
[9,1775; 10,6775) 9,9275 12 0,2 0,133 133
[10,6775; 12,1775) 11,4275 17 0,283 0,189 189
[12,1775; 13,6775) 12,9275 14 0,233 0,156 156
[13,6775; 15,1775) 14,4275 4 0,067 0,044 44
[15,1775; 16,6775) 15,9275 3 0,05 0,033 33
[16,6775; 18,1775) 17,4275 1 0,016 0,011

По результатам вычислений функции плотности, представленной в таблице 4.2., можно сделать вывод, что мода имеет один локальный максимум в окрестности точки х = 11,4275 и с частотой по n = 17.

Оценку медианы находим, используя вариационный ряд:

Так как N = 2k, k = N / 2 = 60 / 2 = 30

Сравнение оценок медианы и оценки математического ожидания показывает, что они отличаются на 1,34 %.

. Параметрическая оценка функции плотности распределения

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

Исходя из гипотезы, что заданная выборка имеет нормальный закон распределения, найдем параметрическую оценку функции плотности, используя формулу для плотности распределения вероятности нормального закона:

Где и известны — они вычисляются по выборке.

Значения этой функции вычисляются для середины частичных интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.

Для этого вычисляем значения для i = 1,2,…, k, затем по таблице значений функций плотности стандартной нормальной величины находим значение .

Переходим к вычислению функции:

Функция , вычисленная при заданных параметрах и в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.

Поэтому для определения теоретической частоты , распределенной по всей ширине интервала, эту функцию необходимо умножить на .

Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.2.

Из полученных результатов проведенных вычислений следует, что сумма вероятностей в интервале [6,1775; 18,1775) почти равна единице, а сумма всех частот равна 59,61. Данные результаты объясняются тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные.

Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Представленные в таблице 5.2 результаты вычислений показывают, что это условие выполняется не всегда. Поэтому все те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .

0,0330,0670,1330,1890,1560,0440,0330,011
0,0220,070,1420,1820,1450,0730,0230,005

Рис. 1. График. Теоретическая и экспериментальная плотности вероятности.

Результаты вычисления экспериментальных и теоретических вероятностей и частот

Нужна помощь в написании курсовой?

Мы - биржа профессиональных авторов (преподавателей и доцентов вузов). Наша система гарантирует сдачу работы к сроку без плагиата. Правки вносим бесплатно.

[xi-1; xi)
[6,1775; 7,6775) 3 6,9275 0,05 0,033 -2,064 0,022 0,033 1,98 2
[7,6775; 9,1775) 6 8,4275 0,1 0,067 -1,38 0,07 0,105 6,3 6
[9,1775; 10,6775) 12 9,9275 0,2 -0,7 0,142 0,213 12,78 13
[10,6775; 12,1775) 17 11,4275 0,283 0,189 -0,016 0,182 0,273 16,38 16
[12,1775; 13,6775) 14 12,9275 0,233 0,156 0,67 0,145 0,2175 13,05 13
[13,6775; 15,1775) 4 14,4275 0,067 0,044 1,35 0,073 0,1095 6,57 7
[15,1775; 16,6775) 3 15,9275 0,05 0,033 2,03 0,023 0,035 2,1 2
[16,6775; 18,1775) 1 17,4275 0,016 0,011 2,71 0,005 0,0075 0,45 1
Σ 0,999 0,9935 59,61

. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона

Для проверки гипотезы о нормальном распределении случайной величины Х сравнивают между собой экспериментальные и теоретические частоты по критерию Пирсона:

Статистика имеет распределение с V = k — r — 1 степенями свободы, где k — число интервалов эмпирического распределения, r — число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:

В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:

N ≥ 50 ≥ 5 где i = 1,2,3…

Из результатов вычислений, приведенных в таблице 1.5.1, следует, что необходимое условие для применения критерия согласия Пирсона не выполнены, т.к. в некоторых группах , то выдвинутая гипотезы о теоретическом законе распределения отвергается при заданном уровне значимости.

Для определения способов математико-статистической обработки, прежде всего, необходимо оценить характер распределения по всем используемым параметрам.

Для параметров имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики которые во многих случаях являются более молодыми, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение - модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов.

Важнейшие первичные статистики:

а) средняя арифметическая - величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой М или x ;

б) cpеднее квадратичное отклонение (обозначаемое греческой буквой s (сигма) и называемое также основным, или стандартным, отклонением) - мера разнообразия входящих в группу объектов, она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средины, тем большим оказывается среднее квадратичное отклонение.

в) коэффициент вариант - частное от деления сигмы на среднюю, умноженное на 100%. Обозначается CV :

Для нормального распределения известны точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант:

Слева и справа от средней арифметической лежит 50% вариант.

В интервале от М-16 до М+16 лежат 68.7% всех вариант.

В интервале от М-1.966 до М+1.966 лежат 95% вариант.

Таким образом, ориентируясь на эти характеристики нормального распределения можно оценить степень близости к нему рассматриваемого распределения.

г) коэффициент асимметрии и эксцесс.

Коэффициент асимметрии - показатель скошенности распределения в левую или правьте сторону по оси абсцисс. Если правая ветвь кривей длиннее левой - говорят о положительной асимметрии, в противоположном случае - об отрицательной.

Эксцесс - показатель островершинности. Кривые, более высокие в своей средней части, островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины - с прогибом в средней части.

Очень большие эксцесс и асимметрия часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру при компьютерной обработке.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особенно ответственные - трижды), причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.

Статистические ошибки репрезентативности показывают в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) наши частные определения, полученные на основании конкретных выборок.

Очевидно, что величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка.

2. Корреляционный анализ

Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде.

Прежде всего, надо выделить коэффициенты корреляции величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности 0.05 и 0.01.

Корреляционным исследование исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными (психическими свойствами, процессами, состояниями и др.).

Виды интерпретаций наличия корреляционной связи между двумя измерениями:

  • Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой.
  • Корреляция, обусловленная 3-й переменной. 2 переменные (а, с) связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитивности, если есть R ( a , b )и R ( b , с), то R (а, с).
  • Случайная корреляция, не обусловленная никакой переменной.
  • Корреляция, обусловленная неоднородностью выборки.

Виды корреляционных связей:

  • положительная корреляция - повышение уровня одной переменной сопровождается повышением уровня другой.
  • отрицательная корреляция - рост уровня одной переменной сопровождается снижением уровня другой.
  • нулевая корреляция - отсутствие связи переменных.

3. Факторный анализ

Факторный анализ - раздел многомерного статистического анализа, обьединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры корреляционных матриц.

Данные факторного анализа, как и корреляционного помогают обнаружить взаимосвязи между переменными, но не могут дать достаточных оснований для выводов о причинно-следственных зависимостях, об иерархии причинных связей.

В различных факторных структурах личностных свойств устойчиво присутствуют именно стержневые психические качества, например, такие как тревожность, активность (энергия), нейротизм.

Факторный анализ является сложной процедурой. Как правило хорошее факторное решение (достаточно простое и содержательно интерпретируемое) удается получить по меньшей мере после нескольких циклов его проведения - от отбора признаков до попытки интерпретации после вращения факторов. Требования.

1) Переменные должны быть измерены по крайней мере на уровне шкалы интервалов (по классификации Стивенса). Многие переменные, такие, как меры отношений и мнений в совокупности, различные переменные при обработке результатов тестирования, не имеют точно определенной метрической основы. Тем не менее предполагается, что порядковым переменным можно давать числовые значения, не нарушая их внутренних свойств.

2) Не следует включать дихотомические переменные. Но если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа к данным, содержащим дихотомические переменные, оправдано.

3) Отбирая переменные для факторного анализа следует учесть, что на один фактор должно приходиться по крайней мере три переменные.

4) Для обоснованного окончательного решения необходимо, чтобы число испытуемых было в три или более раз больше, чем число переменных, в пространстве которых определяется окончательное факторное решение.

5) Не имеет смысла включать в факторный анализ переменные, которые имеют очень слабые связи с остальными переменными. С большой вероятностью они будут иметь малую общность и не войдут ни в один фактор.

6) Важнейшим моментом поиска хорошего факторного решения является определение числа факторов перед их вращением. В окончательном решении лучше всего основываться на содержательных предположениях о структуре изучаемого явления.

4. Использование прикладных статистических программ

Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы.

В полной мере эти преимущества могут использованы, если психолог имеет необходимый уровень подготовки в этой области.

Обычно, чем мощнее компьютерная программа (чем более широкие у нее возможности), тем больше времени она требует дня освоения.

Затрачивать время на ее изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно.

Использование таких программ для решения несложных задач также требует определенной суммы умений. Для того, чтобы избежать лишних сложностей и временных затрат, целесообразно:

Проведение анализа формы гистограммы и выдвижение гипотезы о законе распределения физической величины Во многих случаях при изучении статистических данных (выборки) необходимо знать закон распределения генеральной совокупности. Для этого проводится сравнение формы гистограммы с внешним видом закономерностей законов распределения. Делается предположение о законе изменения физической величины, т… Читать ещё >

  • статистические методы контроля качества и обработка экспериментальных данных

Статистические методы обработки данных ( реферат , курсовая , диплом , контрольная )

Математические законы теории вероятностей не являются беспредметными абстракциями, лишенными физического содержания, а представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях [23]. Теория вероятностей дает возможность определить вероятности событий, законы распределения и числовые характеристики случайных величин, но для того, чтобы провести обработку и представить данные, необходимо провести эксперимент, применить (разработать) метод фиксации данных.

Раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей, получил название математическая статистика (рис. 11).

Направления математической статистики.

Рис. 11. Направления математической статистики

В связи с этим основной задачей, решаемой математической статистикой, является [23] определение закона распределения случайной величины и нахождение числовых характеристик распределения либо вида функции отклика и ее параметров.

Методы математической статистики используются при планировании организации производства, анализе технологических процессов, для контроля качества продукции и многих других целей.

Определение закона распределения случайной величины

Для определения закона распределения, описывающего заданную выборку (набор экспериментальных данных), необходимо сравнить две выборки данных: экспериментальную и теоретическую, для чего требуется выполнить следующие шаги.

1. Группировка данных и построение гистограммы Для построения гистограммы данные группируют, для чего диапазон изменения значений выборки разбивают на несколько равных интервалов к шириной.

Статистические методы обработки данных.

Рекомендации по выбору количества интервалов

где хтт и jcmax — соответственно минимальное и максимальное значения в выборке xN>. Количество интервалов к согласно различным рекомендациям [24] может получиться разным, а при больших объемах выборок п достаточно большим.

Можно воспользоваться рекомендациями Всероссийского научно-исследовательского института метрологии (табл. 6) [24, 25].

Далее, для каждого интервала подсчитывается количество попадающих в него значений т. Затем для каждого интервала вычисляется относительная частота (3).

По полученным данным строится гистограмма (см. рис. 3).

2. Проведение анализа формы гистограммы и выдвижение гипотезы о законе распределения физической величины Во многих случаях при изучении статистических данных (выборки) необходимо знать закон распределения генеральной совокупности. Для этого проводится сравнение формы гистограммы с внешним видом закономерностей законов распределения. Делается предположение о законе изменения физической величины, т. е. выдвигается статистическая гипотеза о том, что генеральная совокупность распределена по выбранному закону. Данная гипотеза является основной (нулевой) гипотезой Н0.

Одновременно с основной гипотезой //0 выдвигается альтернативная гипотеза Н, являющаяся логическим отрицанием гипотезы Я0 и принимаемая при отвержении гипотезы Н0.

После выдвижения гипотезы вычисляются значения функции распределения (плотности вероятности и т. д. ) для экспериментальной выборки в ряде точек по принятому закону.

3. Проверка правдоподобия гипотезы о законе распределения Проверка статистической гипотезы означает проверку согласования исходных выборочных данных (выборки) с выдвинутой основной гипотезой.

При этом возможны две ситуации — основная гипотеза:

Таким образом, при проверке статистических гипотез существует вероятность допустить две ошибки: или, соответственно:

  • • опровергнуть верную гипотезу — ошибка первого рода а;
  • • принять ложную гипотезу — ошибка второго рода (3.

Вероятность совершения ошибки первого рода называется уровнем значимости. Чаще принимаются уровни значимости а= 0,05; 0,01; 0,001, которые называют пятипроцентным, однопроцентным и 0,1%-м [26].

Курсовая работа состоит из двух глав. Первая глава призвана обеспечить анализ количественной стороны массовых явлений, служит основой для принятия соответствующих управленческих решений. Также в данной главе рассматривается определение функции плотности и построение ее графика, сравнение экспериментальной и теоретической вероятности. Вторая глава раскрывает понятие рынка труда, в ней рассмотрены основные категории трудоспособного и экономически активного населения, рассмотрены коэффициенты, с помощью которых и определяется количественная оценка социальных явления (таких как занятость, безработица).

Содержание

Введение . . . . . . . . . . . . . . . . . . . 3
Глава 1. Статистическая обработка данных . . . . . . . . . 4
Постановка задачи. Цель работы. Исходные данные . . . . . 4
Вычисление основных выборочных характеристик по заданной
выборке . . . . . . . . . . . . . . . . . 5
Результаты вычисления интервальных оценок для математического
ожидания и дисперсии . . . . . . . . . . . . . 7
Результаты ранжирования выборочных данных и вычисление моды и
медианы . . . . . . . . . . . . . . . . . 10
Параметрическая оценка функции плотности распределения . . . 12
Проверка гипотезы о нормальном распределении случайной
величины по критерию Пирсона . . . . . . . . . . 17

Прикрепленные файлы: 1 файл

Statistika_Luchnikova.doc

Глава 1. Статистическая обработка данных . . . . . . . . . 4

    1. Постановка задачи. Цель работы. Исходные данные . . . . . 4
    2. Вычисление основных выборочных характеристик по заданной
      1. Результаты вычисления интервальных оценок для математического

      ожидания и дисперсии . . . . . . . . . . . . . 7

        1. Результаты ранжирования выборочных данных и вычисление моды и
          1. Параметрическая оценка функции плотности распределения . . . 12
          2. Проверка гипотезы о нормальном распределении случайной

          величины по критерию Пирсона . . . . . . . . . . 17

          Первое и главное: Статистические данные являются важнейшей частью глобальной информационной системы государства.

          Актуальность работы вызвана тем, что в наше время важность правильной, рациональной организации и реализации статистических методов вошла в повседневный обиход современной жизни. Это неудивительно. Статистика является корреляционной наукой. Она включает в себя разделы как теоретические, так и прикладные (экономическая, социальная, отраслевая статистика). В этой связи статистика представляет собой необходимое звено в системе организации и функционирования, как малого субъекта бизнеса, так и страны в целом.

          Курсовая работа состоит из двух глав. Первая глава призвана обеспечить анализ количественной стороны массовых явлений, служит основой для принятия соответствующих управленческих решений. Также в данной главе рассматривается определение функции плотности и построение ее графика, сравнение экспериментальной и теоретической вероятности. Вторая глава раскрывает понятие рынка труда, в ней рассмотрены основные категории трудоспособного и экономически активного населения, рассмотрены коэффициенты, с помощью которых и определяется количественная оценка социальных явления (таких как занятость, безработица).

          Целью курсового проекта является изучение и усвоение основных понятий математической статистики, овладение методикой статистического оценивания числовых характеристик случайной величины и нормального закона распределения, знакомство с методикой применения статистических критериев для проверки гипотез.

          Глава 1. Статистическая обработка данных

          1.1. Постановка задачи. Цель работы. Исходные данные

          1) Постановка задачи

          По выборке объёма N провести статистическую обработку результатов эксперимента.

          Изучить и усвоить основные понятия математической статистики. Овладеть методикой статистического оценивания числовых характеристик случайной величины и нормального закона распределения. Ознакомиться с методикой применения статистических критериев для проверки гипотез.

          3) Исходные данные

          Проведен эксперимент, в результате которого была получена выборка N = 60, которая соответствует случайной величине, распределённой по нормальному закону. Эта выборка изложена в следующей таблице.

          Читайте также: