Основополагающие концепции математической статистики реферат

Обновлено: 05.07.2024

Прикрепленные файлы: 1 файл

Основные понятия математической статистики.docx

Министерство образования Российской федерации
Московский Государственный Областной Университет

Основные понятия математической статистики

Выполнила: студентка группы 24НИТф

Научный руководитель: Брянцева Т.Н.

Основные понятия математической статистики

Математи́ческая стати́стика — наука, разрабатывающая математические методы систематизации и использования статистических данных для научных и практических выводов.

Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (напр., оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании).

Соединение элементов теории вероятностей и математической статистики называют стохастикой.

Стохастика - это тот раздел математики, который возник и развивается в тесной связи с практической деятельностью человека. Сегодня элементы стохастики входят в математику для всех, становятся новым, важным аспектом математического и общего образования.

Статистика возникла в 17 веке и развивалась параллельно с теорией вероятностей. Дальнейшее развитие математической статистики (вторая половина 19 начало 20-ых веков) обязано в первую очередь, П.Л. Чебышеву, А.А. Маркову, А.М. Ляпунову, К. Гауссу, А. Кетле, Ф.Гальтону, К Пирсону, и др. В 20 –ом наиболее существенный вклад в математическую статистику был сделан А.Н. Колмогоровым, В.И. Романовским, Е.Е. Слуцким, Н.В. Смирновым, Б.В. Гнеденко, а также английскими Стъюдентом, Р. Фишером, Э. Пурсоном и американскими (Ю. Нейман, А Вальд) учёными.

Математическая статистика — раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений. В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.

Выделяют описательную статистику, теорию оценивания и теорию проверки гипотез. Описательная статистика есть совокупность эмпирических методов, используемых для визуализации и интерпретации данных (расчет выборочных характеристик, таблицы, диаграммы, графики и т. д.), как правило, не требующих предположений о вероятностной природе данных. Некоторые методы описательной статистики предполагают использование возможностей современных компьютеров. К ним относятся, в частности, кластерный анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости.

Методы оценивания и проверки гипотез опираются на вероятностные модели происхождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что характеристики изучаемых объектов описываются посредством распределений, зависящих от (одного или нескольких) числовых параметров. Непараметрические модели не связаны со спецификацией параметрического семейства для распределения изучаемых характеристик. В математической статистике оценивают параметры и функции от них, представляющие важные характеристики распределений (например, математическое ожидание, медиана, стандартное отклонение, квантили и др.), плотности и функции распределения и пр. Используют точечные и интервальные оценки.

Большой раздел современной математической статистики — статистический последовательный анализ, фундаментальный вклад в создание и развитие которого внес А. Вальд во время Второй мировой войны. В отличие от традиционных (непоследовательных) методов статистического анализа, основанных на случайной выборке фиксированного объема, в последовательном анализе допускается формирование массива наблюдений по одному (или, более общим образом, группами), при этом решение об проведении следующего наблюдения (группы наблюдений) принимается на основе уже накопленного массива наблюдений.

Компьютеры в математической статистике

В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчётов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).

Основными объектами изучения для математической статистики являются случайные величины. Это функции, определенные на некоторых случайных событиях ("случайное событие" - основное понятие теории вероятностей; как известно, сам термин "вероятность" осмыслен лишь применительно к некоторому случайному событию) и принимающие числовые значения. В качестве типичного для социолога случайного события является выбор того или иного респондента. Случайными величинами могут служить признаки, определенные для этих респондентов. Скажем, возьмем такой признак, как возраст. "Переходя" от события к событию. т.е. от одного респондента к другому (скажем, перебирая анкеты), мы будем фиксировать разные значения возраста (18, 36, 24, . .. лет), т.е. разные значения нашей случайной величины. Случайная величина может быть многомерной - например, когда ей отвечает несколько признаков, а ее значениями являются не отдельные числа, а сочетания чисел - значений рассматриваемых признаков. Скажем, если наряду с возрастом мы будем учитывать пол (0 - мужчина, 1 - женщина) и зарплату (в рублях), то в качестве значений нашей трехмерной случайной величины могут выступать, например, тройки чисел: (18, 0, 524), (36, 1, 1200) и т.д.

Сказанным не ограничивается определение случайной величины. Мы не упомянули самого главного - для каждой совокупности значений случайной величины должна быть определена вероятность того, что, обследуя респондентов, социолог встретит значение из этой совокупности. Напомним, что вероятностью события называют некоторую числовую характеристику степени возможности его появления в определенных, могущих повторяться неограниченное число раз, условиях.

Совокупность вероятностей встречаемости значений рассматриваемой случайной величины называется отвечающим ей распределением вероятностей, или просто ее распределением. Функция, задающая для определенных наборов значений случайной величины отвечающую им вероятность, называется функцией распределения этой случайной величины. Задать случайную величину, по существу, и означает задать соответствующее вероятностное распределение.

Математическая статистика позволяет находить широкий круг статистических закономерностей. Любая из них является некоторым набором параметров вероятностных распределений рассматриваемых случайных величин (одномерных и многомерных). Такого рода характеристиками являются, к примеру, разные меры средней тенденции, разброса значений случайных величин, связи между признаками и т.д. Результат, скажем, регрессионного анализа можно рассматривать как совокупность коэффициентов регрессии, которые в конечном итоге тоже являются некоторыми параметрами исходного многомерного распределения (характеристиками многомерной случайной величины) и т.д. Однако сами параметры, в той же мере, как и те вероятности, на базе которых они рассчитываются, остаются неизвестными исследователю. Вместо истинных значений параметров мы имеем только их выборочные оценки, рассчитанные на основе частотных распределений. Эти оценки называются статистиками.

Итак, поскольку исследователь изначально имеет дело лишь с частотами, а не с соответствующими вероятностями, то фактически исходные случайные величины предстают перед ним в весьма приближенном виде. То, что на основе выборочных данных мы рассчитываем не сами параметры распределений, а лишь их выборочные оценки (отвечающие им статистики), усугубляет степень приблизительности искомых закономерностей.

Распределение числовой случайной величины – это функция, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.

Первое – если случайная величина принимает конечное число значений. Тогда распределение задается функцией Р(Х = х), ставящей каждому возможному значению х случайной величины Х вероятность того, что Х = х.

Второе – если случайная величина принимает бесконечно много значений. Это возможно лишь тогда, когда вероятностное пространство, на котором определена случайная величина, состоит из бесконечного числа элементарных событий. Тогда распределение задается набором вероятностей P(a


Вероятность вытащить зеленый шар


Вероятность вытащить коричневый шар


Т.к. эти три события несовместны, то пользуясь теоремой сложения вероятностей определим вероятность того, что шар окажется цветным (не белым)

Дано:
В вопросах к зачету имеются 75% вопросов, на которые студенты знают ответы. Преподаватель выбирает из них два вопроса и задает их студенту. Определить вероятность того, что среди полученных студентом вопросов есть хотя бы один, на который он знает ответ

Решение:
Вероятность вытащить знакомый вопрос p=0.75, незнакомый q=1-p=1-0.75=0.25
Пусть H1 - гипотеза, что студент не знает ни одного из 2-х вопросов.
Вероятность этой гипотезы:


Искомая вероятность соответственно равна:

Пример 8.
Дано следующее распределение дискретной случайной величины Х

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

Государственное автономное образовательное учреждение

среднего профессионального образования Республики Крым

Тематический доклад на тему:

г. Евпатория, 2018 г.

Задачи любой науки состоят в выявлении и исследовании закономерностей, которым подчиняются реальные процессы.

Теория вероятностей – математическая наука, изучающая закономерности случайных явлений. Знание закономерностей, которым подчиняются массовые случайные события, позволяет предвидеть, как эти события будут протекать.

Методы теории вероятностей широко применяются в различных отраслях науки и техники: в теории надёжности, теории массового обслуживания, теоретической физике, геодезии, астрономии, теории ошибок, теории управления, теории связи и во многих других теоретических и прикладных науках. Теория вероятностей служит для обоснования математической статистики.

Математическая статистика – раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей. Методы математической статистики используются при планировании организации производства, анализе технологических процессов, для контроля качества продукции и многих других целей.

Дальнейшее развитие теории вероятностей приходится на XVII-XIX века благодаря работам А.Муавра, П.Лапласа, К.Гаусса, С.Пуассона и др.

Большой вклад в последующее развитие теории вероятностей и математической статистики внесли российские математики С.Н.Бернштейн, В.И.Романовский, А.Н.Колмогоров, А.Я. Хинчин, Б.В.Гнеденко и др., а также учёные англо-американской школы Стьюдент (псевдоним В. Госсета), Р. Фишер, Э. Пирсон, Е. Нейман и др. Особо следует отметить неоценимый вклад академика А.Н.Колмогорова в становление теории вероятностей как математической науки.

Широкому внедрению статистических методов исследования способствовало появление во второй половине XX века электронных вычислительных машин и, в частности, персональных компьютеров. Статистические программные пакеты сделали эти методы более доступными и наглядными, так как трудоёмкую работу по расчёту статистик, параметров, характеристик, построению таблиц и графиков в основном стал выполнять компьютер, а исследователю осталась главным образом творческая работа: постановка задачи, выбор методов решения и интерпретация результатов.

Развитие методов последовательного анализа привело, с одной стороны, к изучению управляемых случайных процессов, с другой - к появлению теории статистических решений . Эта теория исходит из того, что результаты последовательно проводимых наблюдений служат основой принятия некоторых решений (промежуточных - продолжать испытания или нет, и окончательных - в случае прекращения испытаний). В задачах оценки параметров окончательные решения суть числа (значение оценок), в задачах проверки гипотез - принимаемые гипотезы. Цель теории - указать правила принятия решений, минимизирующих средний риск или убыток (риск зависит и от вероятностных распределений результатов наблюдений, и от принимаемого окончательного решения, и от расходов на проведение испытаний и т. д.). Вопросы целесообразного распределения усилий при проведении статистического анализа явлений рассматриваются в теории планирования эксперимента , ставшей важной частью современной математической статистики.

Наряду с развитием и уточнением общих понятий математической статистики, развиваются и её отдельные разделы, такие, как дисперсионный анализ, статистический анализ случайных процессов, многомерный статистический анализ. Появились новые оценки в регрессионном анализе (см. также Стохастическая аппроксимация ). Большую роль в задачах математической статистики играет т. н. бейесовский подход к решению статистических задач.

Более важную роль играет теория вероятностей при статистическом исследовании вероятностно случайных явлений. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы математической статистики, как проверка статистических гипотез, статистическое оценивание распределений вероятностей и входящих в них параметров и т. д. Область же применения этих более глубоких статистических методов значительно уже, т. к. здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определенным вероятностным закономерностям. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам в виду того, что входящее в определение стационарного процесса допущение наличия сохраняющихся в течении длительного времени неизменных распределений вероятностей в этом случае, как правило, совершенно неприемлемо.

Математическая статистика – раздел прикладной математики, наука о математических методах систематизации и использования статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятности, позволяющую оценить надежность и точность выводов. Этот раздел прикладной математики посвящен изучению случайных величин по результатам наблюдений.

Методы математической статистики нашли широкое применение в различных областях науки (физике, биологии, медицине, экономике, социологии, информатике и др.) и могут применяться для решения различных задач. При этом можно сформулировать три основные (типичные) задачи математической статистики, наиболее часто встречающиеся на практике.

1.Определение закона распределения случайной величины. По результатам независимых наблюдений случайной величины требуется оценить неизвестную функцию распределения или плотность вероятности этой случайной величины.

2.Задача проверки правдоподобия гипотез. Из обширного круга задач, связанных с проверкой статистических гипотез, наиболее типичными являются две задачи. Первая: как согласуются результаты эксперимента с гипотезой о том, что исследуемая случайная величина имеет плотность распределения ? Вторая: не противоречит ли полученная оценка неизвестного параметра выдвинутой гипотезе о значении данного параметра?

3.Задача оценки неизвестных параметров распределения. Предполагается, что закон распределения исследуемой случайной величины известен до опыта из физических или теоретических предположений (к примеру, нормальный). Возникает более узкая задача – определить некоторые параметры (числовые характеристики) случайной величины, т. е. по экспериментальным данным крайне важно оценить значения этих параметров. С этой задачей отыскания "подходящих значений" числовых характеристик тесно связана задача оценки их точности и надежности.

- под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях общественной жизни;

- статистикой называют цифровой материал, служащий для характеристики какой – либо области общественных явлений или территориального распределения какого – то показателя;

- статистикой называется отрасль знания, особая научная дисциплина, соответственно учебный предмет в высших и средних специальных учебных заведениях.

Задачи статистической науки:

1.Постоянные (долговременные): а) обеспечить органы управления государством, регионами, отраслями и отдельными предприятиями своевременной полной и достоверной информацией, необходимой для принятия решений; б)информировать общественность о явлениях и процессах, происходящих в обществе.

2.Актуальные задачи формируются исходя из потребности общества и экономики на современном этапе: а)получение объективной информации о деятельности хозяйственных структур; б) создание автоматизированных баз данных о деятельности текущих хозяйственных структур с возможностью санкционированного доступа к ним для получения информации, необходимой для решения текущих хозяйственных задач; в) прогнозирование развития важных социально – экономических процессов и явлений.

Исследование массовых общественных явлений включает в себя следующие этапы (этапы статистического исследования ):

1)сбор статистической информации и ее первичная обработка (статистическое наблюдение);

2)группировка и выборка результатов наблюдения в определенные совокупности;

3)обобщение и анализ полученных материалов.

На первом этапе статистического исследования формируются первичные статистические данные, или исходная статистическая информация, которая является фундаментом будущего статистического здания. Если при сборе первичных статистических данных допущена ошибка или материал оказался недоброкачественным, это повлияет на правильность и достоверность как теоретических, так и практических выводов. Поэтому статистическое наблюдение от начальной до завершающей стадии – получения итоговых материалов – должно быть тщательно продуманным и четко организованным.

Статистическое наблюдение представляет собой научно организованный по единой программе учет фактов, характеризующих явления и процессы общественной жизни, и сбор полученных на основе этого учета массовых данных. К статистическому наблюдению предъявляются следующие требования:

полнота статистических данных (полнота охвата единиц изучаемой совокупности, сторон того или иного явления, а также полнота охвата во времени);

достоверность и точность данных;

их единообразие и сопоставимость.

Однако не всякий сбор сведений является статистическим наблюдением. О статистическом наблюдении можно говорить лишь тогда, когда изучаются статистические закономерности, т.е. такие, которые проявляются только в массовом процессе, в большом числе единиц какой – то совокупности. Поэтому статистическое наблюдение должно быть планомерным, массовым и систематическим.

На втором этапе совокупность делится по признакам различия и объединяется по признакам сходства, подсчитываются суммарные показатели по группам и в целом. С помощью различных методов изучаемые явления делятся на важнейшие типы, характерные группы и подгруппы оп существенным признакам. С помощью группировок ограничивают качественно однородные в существенном отношении совокупности, что является предпосылкой для определения и применения обобщающих показателей.

На заключительном этапе анализа с помощью обобщающих показателей рассчитываются относительные и средние величины, дается сводная оценка вариации признаков, характеризуется динамика явлений, применяются индексы, балансовые построения, рассчитываются показатели, характеризующие тесноту связей в изменении признаков. С целью наиболее рационального и наглядного изложения цифрового материала он представляется в виде таблиц и графиков.

Статистическая совокупность – это множество явлений, имеющих один или несколько общих признаков и отличающихся между собой по значениям других признаков.

Единица совокупности – каждое отдельное явление, подлежащее учету, наделенное признаками сходства.

Учетные признаки – это свойства, характерная черта явления, подлежащая статистическому изучению.

1)качественные (атрибутивные) – выражают существенное неотъемлемое свойство предмета. Противоположные качественные признаки называют альтернативными (мужчина – женщина, отличник – не отличник т.д.);

2)количественные – отдельные значения различаются по величине (возраст, рост, вес).

Статистические данные – сведения о числе объектов какой – либо обширной совокупности, обладающих теми или иными признаками. Являются исходным материалом для любого статистического исследования. На основании статистических данных можно сделать научно обоснованные выводы. Для этого статистические данные должны быть предварительно определенным образом систематизированы и обработаны.

Одним из основных методов обработки статистических данных является выборочный метод . При выборочном исследовании из всей совокупности отбирают некоторым образом определенное число объектов и только их подвергают исследованию.

Генеральная совокупность – совокупность всех исследуемых объектов. Генеральную совокупность образуют, например, все больные с данным диагнозом, все новорожденные и дети т.д. Общую сумму членов генеральной совокупности называют ее объемом и обозначают буквой N . Теоретически объем генеральной совокупности ничем не ограничен. Поэтому обычно изучается какая – то часть объектов генеральной совокупности – выборка.

Выборочная совокупность (выборка) – набор случайно отобранных объектов из генеральной совокупности.

Возникновение и развитие математической статистики, как и других математических дисциплин, определялось потребностями практики; в настоящее время ее методы широко используются в различных технических дисциплинах. Они играют важную роль в экономических исследованиях, сельском хозяйстве, биологии, психологии, медицине, физических науках, геологии, социологических исследованиях и других, считавшихся долго далекими от математики, науках.


Лекции


Лабораторные


Справочники


Эссе


Вопросы


Стандарты


Программы


Дипломные


Курсовые


Помогалки


Графические

Доступные файлы (1):


  1. Предмет математической статистики

  2. Вариационный ряд и его характеристики

  3. Выборочный метод и статистическое оценивание

  4. Понятие о проверке статистических гипотез

Список использованной литературы

Введение
Явления, происходящие в природе, в обществе, в человеке, очень сложны и разнообразны. Ученые изучают разные стороны этих явлений, причем каждая наука вырабатывает свои специфические методы исследования. Например, таким важным социальным явлением, как преступность, занимаются не только юристы, но и социологи, психологи, медики и иные специалисты. Есть тут серьезная работа и для математиков. Их задача состоит в том, чтобы подвергнуть математической статистике огромный статистический материал: отчеты органов внутренних дел и другие документы, содержащие различные числовые данные. Цель этой работы – выделить наиболее существенные сведения об интересующем нас явлении.
1. Предмет математической статистики
Термин статистика употребляется ча­ще всего для обозначения двух понятий. Во-первых, статистикой называют набор количе­ственных данных о некотором явлении, со­вокупности объектов и т.п. Эти данные на­зывают статистическими.

Во-вторых, термином статистика объ­единяют совокупность методов исследования, основанных на анализе статистических дан­ных.

В каждой области деятельности разрабо­таны свои специфические статистические ме­тоды. Существует много разных статистик: социально-экономическая, демографическая, медицинская, юридическая, звёздная и ряд других. Поскольку всякая статистика опери­рует с числами, то основой всех статистических методов является математика. Совокуп­ность математических методов обработки, си­стематизации, анализа и использования статистических данных составляет предмет спе­циальной науки – математической статисти­ки. Именно математические методы в силу их объективности позволяют получать наиболее значимые результаты при обработке статисти­ческих данных. Глубина и достоверность этих результатов зависит как от мощности приме­няемых математических методов, так и от пра­вильности их применения. Разумеется, досто­верность результатов зависит также от доброкачественнности статистического материала, который подвергается обработке.

Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов на­блюдений массовых случайных явлений для выявления существующих закономерностей.

Математическая статистика тесно связана с теорией вероятностей. Обе эти математические дисциплины изучают массовые случайные явления. Связующим звеном между ними являются предельные теоре­мы теории вероятностей. При этом теория вероятностей выводит из ма­тематической модели свойства реального процесса, а математическая статистика устанавливает свойства математической модели, исходя из данных наблюдений (говорят "из статистических данных").

Предметом математической статистики является изучение случай­ных величин (или случайных событий, процессов) по результатам на­блюдений. Полученные в результате наблюдения (опыта, эксперимен­та) данные сначала надо каким-либо образом обработать: упорядочить, представить в удобном для обозрения и анализа виде. Это первая зада­ча.

Затем, это уже вторая задача, оценить, хотя бы приблизительно, интересующие нас характеристики наблюдаемой случайной величи­ны. Например, дать оценку неизвестной вероятности события, оценку неизвестной функции распределения, оценку математического ожида­ния, оценку дисперсии случайной величины, оценку параметров рас­пределения, вид которого неизвестен, и т.д.

Следующей, назовем ее условно третьей, задачей является провер­ка статистических гипотез, т.е. решение вопроса согласования ре­зультатов оценивания с опытными данными.

Одной из важнейших задач математической статистики является разработка методов, позволяющих по результатам обследования выборки делать обоснованные выводы о распределении признака изучаемых объектов по всей совокупности.
2. Вариационный ряд и его характеристики
Ряды распределения – это ряды абсолютных и относительных чи­сел, которые характеризуют распределение единиц совокупности по качественному (атрибутивному) или количественному признаку. При­мером распределения совокупности по качественному признаку мо­жет быть распределение сотрудников милиции (офицеров) по специ­альному званию: полковников – 1, подполковников – 3, майоров – 8 … всего – 50 человек. Эта же совокупность может быть распределена по количественному признаку, скажем, по возрасту: моложе 20 лет – 2, 20-24 года – 18, 25-29 лет – 10 и т.д. В обоих примерах ряды распре­деления выражены в абсолютных числах. Последние в подобных слу­чаях называются частотами ряда распределения. Они указывают, на­сколько части повторяется та или иная варианта (признак). Варианта "майор" имеет частоту 8, а варианта "20-24 года" – 18.

Если значения качественных или количественных признаков вы­ражены в относительных числах (например, в процентах к общему числу), то эти значения именуются частостями. В этом случае наши примеры выглядят так: полковников – 2 %, подполковников – 6, май­оров – 16 … всего 100 %; моложе 20 лет – 4 %, 20-24 года – 18, 25-29 лет – 10 … всего 100 %.

Ряды распределения в таблицах, как правило, имеют и частоты, и частости (табл. 1).

Распределение сотрудников милиции по званию и возрасту

Вариация признаков может быть дискретной, или прерывной (20, 21, 22, 23, 24, 25 лет и т.д.), либо непрерывной (до 20 лет, 20-25, 25-30 лет и т.д.). При дискретной вариации величина количественно­го признака (варианты) может принимать вполне определенные значе­ния, отличающиеся в нашем примере на 1 год (20,21,22 и т.д.). При не­прерывной вариации величина количественного признака у единиц совокупности в определенном численном промежутке (интервале) мо­жет принимать любые значения, хоть сколько-нибудь отличающиеся друг от друга. Например, в интервале 20-25 лет возраст конкретных сотрудников может быть 20 лет и 2 дня, 21 год и 10 месяцев и т.д.

Вариационные ряды, построенные по дискретно варьирующим признакам, именуют дискретными вариационными рядами, а построен­ные по непрерывно варьирующим признакам (интервалам) – интер­вальными вариационными рядами. Вариационный ряд всегда состоит из двух основных граф (колонок) цифр.

В первой колонке указываются значения количественного призна­ка в порядке возрастания. В нашем примере интервального вариаци­онного ряда: до 20 лет, 20-24 года, 25-29 лет и т.д. При дискретной ва­риации 20, 21, 22, 23, 24, 25 лет. Эти значения количественного призна­ка и называют вариантами. В статистической литературе этот термин иногда употребляется как существительное мужского рода (вариант, варианты), а иногда – как существительное женского рода (варианта, варианты).

Во второй колонке указываются числа единиц, которые свойствен­ны той или иной варианте. Их называют частотами, если они выраже­ны в абсолютных числах, т.е. сколько раз в изучаемой совокупности встречается та или иная варианта, или частостями, если они выраже­ны в удельных весах или долях, т.е. в процентах или коэффициентах к итогу.

Интервальный вариационный ряд иногда строится с равными интервалами (20-24, 25-29 лет), а иногда с неравными (14-15, 16-18, 19-20, 21-25 лет) интервалами. В первом случае оба интервала равны 5 годам, а во втором случае – 2, 3, 5 годам. При построении интерваль­ного ряда с непрерывной вариацией верхняя граница каждого интер­вала обычно является нижней границей последующего (20-25, 25-30, 30-35 и т.д.), а в построении интервального ряда по дискретному при­знаку границы смежных интервалов не повторяются (1-5 дней, 6-10 дней, 11-15 дней и т.д.)

Статистический анализ вариационных рядов требует не только на­личия единичных частот (частостей), но и накопленных частот (частостей). Накопленная частота для той или иной варианты представляет собой
сумму частот всех предшествующих вариант (интервалов). В на­шем примере (табл. 1) для интервала 20-24 года накопленная частота будет равна:
2 + 18 = 20 человек, а накопленная частость 4 + 36 = 40 %, а для интервала 25-29 лет соответственно: 2 + 18 + 10 = 30 человек, или 4 + 36 + 20 = 60 %. Таким образом, от варианты к варианте (от интерва­ла к интервалу) идет накопление (кумуляция) частот и частостей.

Вариационные ряды легко изображаются графически в виде поли­гона или гистограммы. Графическое изображение накопленных частот (частостей) воспроизводится в системе прямоугольных координат в виде кумуляты, или кумулятивной кривой. По оси ординат откладыва­ется величина накопленных частот, а по оси абсцисс – возрастающие значения количественного признака. Накопленные частоты и кумулята – это интегральные показатели плотности распределения в вариа­ционном ряду.
3. Выборочный метод и статистическое оценивание
Основной формой сбора крими­нологической и социально-правовой информации является статисти­ческая отчетность правоохранительных и других юридических учреж­дений. Но их отчеты, отражая важнейшие показатели, ограничены по объему. Юридическая наука и практика систематически нуждаются в та­кой информации, которая бы адекватно отражала возникающие во­просы в меняющейся действительности. Поэтому по актуальным во­просам, которые не отражены в официальной отчетности, следует про­водить специально организованные изучения, применяя такое несплошное наблюдение, которое дает относительно надежные и достоверные данные. Это достигается при выборочном наблюдении.

Методика выборочного наблюдения досконально разработана математической статистикой. Оно получило самое широкое признание и распространение в различных отраслях науки и практики как метод, во многих случаях замещающий сплошное изучение тех или иных явле­ний и процессов. Выборочный метод относительно прост, экономи­чен, оперативен, надежен и имеет вполне определимую точность.

Выборочные данные достаточно полно отра­жают особенности всей, или, как говорят статистики, генеральной, со­вокупности изучаемых явлений.

Теория выборочного наблюдения базируется на статистических закономерностях, которые формируются и обнаруживаются в массо­вых явлениях и процессах. Это свойство закономерностей получило название закона больших чисел. Математической основой закона боль­ших чисел, да и статистической науки в целом, служит теория вероят­ностей.

Приведем экспери­ментальный пример распределения случайных величин, заимствован­ный из статистической литературы и приближенный к нашим проб­лемам.

Были взяты 10 пачек по 10 карточек, пронумерованных от 1 до 10. Каждую пачку тщательно перемешали. После этого из каждой пачки по жребию было извлечено по одной карточке. Сумма номеров вы­нутых карточек составила 52. Карточки были возвращены в свои пачки, которые вновь перемешивались. При втором извлечении сум­ма номеров вынутых карточек составила 46. Подобные операции были проделаны 30 раз. Полученные данные: 52, 46, 72 и т.д. (табл. 2).

Содержание работы

Введение…………………………………………………………………… 2
1. Задачи математической статистики…………………………………… 3
2. Математическая статистика. Основные понятия…………………. 4
2.1. Генеральная и выборочная совокупности…………………………. 4
2.2. Повторная и бесповторная выборки. Репрезентативная выборка.. 5
2.3. Способы отбора………………………………………………………. 6
2.4. Статистический ряд, полигон частот и гистограмма……………… 9
2.5. Статистические гипотезы……………………………………….. 12

2.6. Критерий Пирсона (хи-квадрат)……………………………….. 14
2.7. Линейная корреляция………………………………………………… 22

Содержимое работы - 1 файл

реферат по математике и статистике Смирнова.docx

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Нижегородский государственный лингвистический университет

на тему: “Основные понятия, методы и приемы математической статистики”

студентка 1-го курса

1. Задачи математической статистики…………………………………… 3

2. Математическая статистика. Основные понятия…………………. 4

2.1. Генеральная и выборочная совокупности…………………………. 4

2.2. Повторная и бесповторная выборки. Репрезентативная выборка.. 5

2.4. Статистический ряд, полигон частот и гистограмма……………… 9

2.6. Критерий Пирсона (хи-квадрат)……………………………….. 14

2.7. Линейная корреляция………………………………………………… 22

Математическая статистика – это раздел математики, который изучает методы сбора, систематизации, обработки результатов наблюдений массовых случайных явлений.

Здесь в шутливой форме дан типичный пример статистического вывода: если бы кости были симметричны, то наблюдаемое событие (5 раз подряд выпали 3 шестерки) имело бы ничтожно малую вероятность (1/6 ⁸ ) ⁵ =4,71 ∙ 10  ¹¹ и, поскольку в эксперименте наблюдалось такое событие, вполне логично сделать вывод, что априорная модель (симметричность костей) ложна.

Первыми крупными работами, относящимися к математической статистике, были исследования Я. Бернулли и П. Лапласа. К. Гаусс разработал теорию ошибок наблюдений. Научное обоснование закономерностей случайного рассеивания связано с именами русских математиков П.Л. Чебышева, А.А. Маркова и А.М. Ляпунова, значительно углубивших результаты известных к тому времени классических исследований.

Ряд важнейших современных понятий и методов, оказавших большое влияние на развитие современной теории математической статистики, предложил Р.Фишер (метод максимума правдоподобия, дисперсионный анализ, понятия состоятельности, достаточности, эффективности и др.). Систематическое развитие теории проверки статистических гипотез началось с работ К. Пирсона по критерию хи-квадрат. Основной вклад в построение этой теории внесли Ю. Нейман и Э. Пирсон, которые ввели понятия ошибок первого и второго рода и показали общность и значение метода отношения правдоподобия для построения критериев. Общая теория статистических решающих функций, охватывающая как теорию проверки статистических гипотез, так и теорию оценивания, создана А. Вальдом.

Большую роль в развитии математической статистики сыграли работы Г. Крамера, Э. Лемана, С. Рао, М. Кендалла, А. Стьюарта, С. Уилкса, а также советских ученых А.Н. Колмогорова, Б.В. Гнеденко, Ю.В. Линника, Е.Е. Слуцкого, Н.В. Смирнова, В.И. Романовского, Л.Н. Большева, Ю.В. Прохорова и др.

Математическая статистика-это непрерывно и интенсивно развивающаяся наука.

Задачи математической статистики.

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных – результатов наблюдений.

Первая задача математической статистики – указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.

Вторая задача математической статистики – разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся:

а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;

б) проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) и решает многие другие задачи.

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Математическая статистика. Основные понятия.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали.

Иногда проводят сплошное обследование, т.е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяют сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N=1000, а объем выборки n=100.

Замечание. Часто генеральная совокупность содержит конечное число объектов. Однако если это число достаточно велико, то иногда в целях упрощения вычислений, или для облегчения теоретических выводов, допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема генеральной совокупности (достаточно большого объема) практически не сказывается на результатах обработки данных выборки.

Повторная и бесповторная выборки. Репрезентативная выборка.

При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии со сказанным выборки подразделяют на повторные и бесповторные.

Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.

На практике обычно пользуются бесповторным случайным отбором.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют. Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборкой стирается; в предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает.

На практике применяются различные способы отбора. Принципиально эти способы можно подразделить на два вида:

1. Отбор, не требующий расчленения генеральной совокупности на части. Сюда относятся: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор.

2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся: а) типический отбор; б) механический отбор; в) серийный отбор.

Читайте также: