Способы определения минимального объема выборки реферат

Обновлено: 05.07.2024

Для определения вероятностей интересующих нас событий мы применяем выборочный метод: проводим n независимых экспериментов, в каждом из которых может произойти (или не произойти) событие А (вероятность р появления события А в каждом эксперименте постоянна). Тогда относительная частота p* появлений событий А в серии из n испытаний принимается в качестве точечной оценки для вероятности p появления события А в отдельном испытании. При этом величину p* называют выборочной долей появлений события А, а р — генеральной долей.

В силу следствия из центральной предельной теоремы (теорема Муавра-Лапласа) относительную частоту события при большом объеме выборки можно считать нормально распределенной с параметрами M(p*)=p и

Поэтому при n>30 доверительный интервал для генеральной доли можно построить, используя формулы:

где uкр находится по таблицам функции Лапласа с учетом заданной доверительной вероятности γ: 2Ф(uкр)=γ.

При малом объеме выборки n≤30 предельная ошибка ε определяется по таблице распределения Стьюдента:
где tкр=t(k; α) и число степеней свободы k=n-1 вероятность α=1-γ (двустороння область).

Формулы справедливы, если отбор проводился случайным повторным образом (генеральная совокупность бесконечна), в противном случае необходимо сделать поправку на бесповторность отбора (таблица).

Средняя ошибка выборки для генеральной доли

Генеральная совокупность Бесконечная Конечная объема N
Тип отбора Повторный Бесповторный
Средняя ошибка выборки

Задачи о генеральной доле

Пример №1 . С помощью случайного повторного отбора руководство фирмы провело выборочный опрос 900 своих служащих. Среди опрошенных оказалось 270 женщин. Постройте доверительный интервал, с вероятностью 0.95 накрывающий истинную долю женщин во всем коллективе фирмы.
Решение. По условию выборочная доля женщин составляет (относительная частота женщин среди всех опрошенных). Так как отбор является повторным, и объем выборки велик (n=900) предельная ошибка выборки определяется по формуле

Значение uкр находим по таблице функции Лапласа из соотношения 2Ф(uкр)=γ, т.е. Функция Лапласа (приложение 1) принимает значение 0.475 при uкр=1.96. Следовательно, предельная ошибка и искомый доверительный интервал
(p – ε, p + ε) = (0.3 – 0.18; 0.3 + 0.18) = (0.12; 0.48)
Итак, с вероятностью 0.95 можно гарантировать, что доля женщин во всем коллективе фирмы находится в интервале от 0.12 до 0.48.

Пример №3 . Проверив 2500 изделий в партии, обнаружили, что 400 изделий высшего сорта, а n–m – нет. Сколько надо проверить изделий, чтобы с уверенностью 95% определить долю высшего сорта с точностью до 0.01 ?
Решение ищем по формуле определения численности выборки для повторного отбора.

Ф(t) = γ/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96
Выборочная доля w = 0.16; ошибка выборки ε = 0.01

Пример №4 . Партия изделий принимается, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0.97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости α=0,02 принять партию?
Решение. Сформулируем основную и альтернативную гипотезы.
H0:p=p0=0,97 — неизвестная генеральная доля p равна заданному значению p0=0,97. Применительно к условию — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0.97; т.е. партию изделий можно принять.
H1:p Пример №5 . Два завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Среди 200 отобранных изделий первого завода оказалось 20 бракованных, среди 300 изделий второго завода — 15 бракованных.
На уровне значимости 0.025 выяснить, имеется ли существенное различие в качестве изготавливаемых этими заводами деталей.
Решение. Это задача о сравнении генеральных долей двух совокупностей. Сформулируем основную и альтернативную гипотезы.
H0:p1=p2 — генеральные доли равны. Применительно к условию — вероятность появления бракованного изделия в продукции первого завода равна вероятности появления бракованного изделия в продукции второго завода (качество продукции одинаково).
H0:p1≠p2 — заводы изготавливают детали разного качества.
Для вычисления наблюдаемого значения статистики K (таблица) рассчитаем оценки по выборке.

Наблюдаемое значение равно

Так как альтернативная гипотеза двусторонняя, то критическое значение статистики K≈ N(0,1) находим по таблице функции Лапласа из равенства
По условию α=0,025 отсюда Ф(Ккр)=0,4875 и Ккр=2,24. При двусторонней альтернативе область допустимых значений имеет вид (-2,24;2,24). Наблюдаемое значение Kнабл=2,15 попадает в этот интервал, т.е. на данном уровне значимости нет оснований отвергать основную гипотезу. Заводы изготавливают изделия одинакового качества.

Математической статистикойназывается раздел математики, который занимается разработкой методов получения, описания и обработки экспериментальных данных, полученных в ходе наблюдения за массовыми случайными явлениями, с целью изучения закономерностей этих явлений.

Основным понятием, которым оперирует математическая статистика является статистическая совокупность.

Статистическая совокупность – это группа, состоящая из объектов однородных относительно некоторого признака и взятых вместе в определенных границах пространства и времени.

Признаки, по которым формируется статистическая совокупность, делятся на количественные и качественные.

К качественному признаку можно отнести наличие (да, имеется) или отсутствие (нет, не имеется) детей в семье, а к количественному – количество детей (один, два, три, четыре, …).

Для определённости статистические совокупности обозначаются прописными буквами латинского алфавита, причем чаще всего берутся буквы из последней трети алфавита – U, V, X, Y, Z. Число объектов совокупности называется ее объемом.

Статистическая совокупность, распределение которой по интересующему нас признаку необходимо изучить, называется генеральной совокупностью.

Иначе, генеральная совокупность – это совокупность всех объектов, которые являются носителями изучаемого признака.

Множество объектов, отобранных из генеральной совокупности для изучения определённого признака, называется выборочной совокупностью или выборкой.

Выборочный метод

Выборочный метод является единственно возможным, если ставится задача исследования бесконечной статистической совокупности или исследование связано с уничтожением наблюдаемых объектов (например, анализ содержимого консервных банок). Недостатком этого метода является то, что для исследования берется только часть генеральной совокупности, а значит, возможным появление ошибок. Математическая статистика дает рекомендации, как организовать отбор объектов для выборки, чтобы свести эти ошибки к минимуму, и дает методику оценки величины этих ошибок.

Основным требованием к выборке является её репрезентативность или представительность (от лат. represento – представляю). Репрезентативная выборка должна отбираться из генеральной совокупности таким образом, чтобы все объекты генеральной совокупности имели одинаковую вероятность попасть в выборку.

Опыт показывает (и подтверждается законом больших чисел), что выборка, полученная способом рандомизации (от англ. random – случай), то есть простым случайным отбором, даёт объективную картину изучаемой совокупности. Она отображает все закономерности, присущие генеральной совокупности и её широко используют при исследованиях, например, в биологии, медицине, метрологии и др. Однако, в случаях, когда генеральная совокупность неоднородна и доступность для исследователя отдельных её частей неодинакова, обеспечить репрезентативность выборки, используя механически метод рандомизации, невозможно.

Например, при изучении общественного мнения жителей большого города можно сделать ошибочные выводы, если произвести случайный опрос на улицах, так как данная выборка вряд ли будет отображать совокупное мнение всех слоёв общества (тех, кто в это время находится в аудиториях, на работе или сидит дома).

В подобных случаях для обеспечения представительности следует использовать расслоённую выборку, однако внутри каждого выделенного слоя необходимо соблюдать принцип рандомизации.

При практическом изучении генеральной совокупности чаще всего используют два основных типа выборок:

1). Повторная выборка, когда каждый элемент, случайно отобранный и исследованный, возвращается в общую совокупность и может быть вновь отобран повторно;

2). Бесповторная выборка, когда отобранный элемент не возвращается в общую совокупность.

Кроме того, выборки различаются по объему, что приходится учитывать при вычислении и анализе числовых характеристик:

1). Выборка малого объема, когда ее численность ;

2). Выборка большого объема, .

Описание и числовые характеристики дискретной выборки

Пусть при проведении эксперимента из генеральной совокупности объёмом N извлечена выборка Х объёмом n (nN), элементами (признаками) которой является ряд значений: х1, х2, …, хn, причем признак х1 встречается в выборке m1 раз, х2m2, …, хkmk раз и .

Наблюдаемые значения признака называют вариантами.

Если варианты записаны в порядке их поступления в процессе отбора, то вариационный ряд называется простым.

Если же для обнаружения закономерности при первичном анализе данные сгруппированы и записаны в порядке их возрастания или убывания, то вариационный ряд называется ранжированным(от франц. ranger – выстраивать).

Несложно проверить, что при этом выполняется условие .

Для удобства представления и анализа данных варианты ранжированной выборки и соответствующие им mi или заносятся в специальную таблицу:

х х1 х2 xи xk
m m1 m2 mи mk
p* p1 p2 pи pk

Таблицу, содержащую все сгруппированные варианты выборки и соответствующие им частоты или относительные частоты, называют статистическим дискретным рядом распределения признака (статистическим распределением выборки).

Разность между наибольшей и наименьшей вариантой называется размахом или амплитудой A вариационного ряда (варьирования признака): xmax-xmin= DХ.

Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения. Для графического изображения дискретного ряда распределения используют полигон частотили относительных частот. При построении полигона частот используют координатную плоскость, на которой откладывают точки с координатами, соответствующими парам значений статистического распределения (хi; mi) или (хi; рi), а затем соединяют их отрезками прямых. Для замыкания полигона крайние точки с координатами (х1; m1) и (xk; mk) соединяют с точками на оси абсцисс, отстоящими в принятом масштабе от xmin=x1 и от xmax=xn, на одно деление (рис. ).

Числовыми характеристиками выборки являются:

1. Выборочная средняя .

2. Выборочная дисперсия или .

3. Выборочное среднее квадратическое отклонение .

В некоторых случаях дополнительно определяют структурные средние характеристики выборки, которые также характеризуют центр распределения:

4. Мода М0 – варианта, которая встречается в выборке наиболее часто.

5. Медиана Ме – варианта, которая делит объем выборки пополам.

Очень часто они дают больше информации о центре распределения, чем средняя арифметическая величина выборки. Например, при характеристике уровня заработной платы более информативным будет показатель медианы, который говорит: половины работников предприятия получает зарплату менее Ме, другая половина имеет зарплату выше этого уровня, чем показатель – в среднем каждый работающий получает зарплату .

При регистрации количества обслуживаемых на дому в 12 пунктах социальной помощи были получены результаты (данные записаны в порядке их поступления): 66, 69, 72, 70, 75, 73, 70, 71, 70, 72, 69, 70.

Составить статистическое распределение выборки.

Ранжированный ряд более удобен для первичного анализа:

66, 69, 69, 70, 70, 70, 70, 71, 72, 72, 73, 75. Данный ряд является дискретным по своей природе, так как варианты, в данном случае это количество обслуживаемых людей, могут принимать только отдельные значения. Тогда распределение выборки, согласно определению будет иметь вид:

Х
m
p * 1/12 1/6 1/3 1/12 1/6 1/12 1/12

Графическое изображение распределения выборки – полигон частот будет иметь вид:

Вычислим выборочные характеристики:

1. Выборочная средняя

2. Выборочная дисперсия

3. Выборочное среднее квадратическое отклонение .

4. Мода , т.к. эта варианта встречается в выборке чаще всего (m=4).

Варианты выборки: 66, 69, 69, 70,70, 70, 70, 71, 72, 72, 73, 75.

Оценка параметров генеральной совокупности

Целью исследования, как правило, является описание всей генеральной совокупности, а не отдельной выборки, поэтому одной из основных задач статистики является оценка параметров генеральной совокупности (которые невозможно вычислить из-за отсутствия данных о всех объектах совокупности) по соответствующим параметрам выборки.

Различают точечные и интервальные оценки параметров генеральной совокупности.

Точечной называют оценку, если она оценивает одно численное значение параметра, т.е. определяется одним числом.

Интервальнойоценкой называется интервал, который с заданной вероятностью накрывает оцениваемый параметр.

Статистические методы позволяют получать лишь те интервальные оценки, доверительная вероятность p которых близка к единице. Наиболее часто доверительную вероятность или степень надежности принимают равной 0,9; 0,95; 0,99; 0,999. При исследованиях доверительную вероятность обычно принимают равной 0,95. При разработке стандартов используется степень надежности 0,99.

Для получения хорошего приближения при оценке параметров генеральной совокупности П* соответствующие параметры выборочной совокупности ПВ должны отвечать двум основным требованиям: несмещённости и состоятельности.

Точечная оценка является состоятельной, если для любого, сколько угодно малого, положительного числа e будет выполняться равенство: .

Наилучшей (эффективной) называют оценку с наименьшей дисперсией.

1. Несмещённой оценкой генеральной средней является выборочная средняя, так как , то .

2. Выборочная дисперсия, а следовательно, и среднее квадратическое отклонение, являются смещёнными оценками соответствующих параметров генеральной совокупности.

Следовательно, несмещенная оценка генеральной дисперсии равна: .

3. Несмещенной оценкой генерального среднеквадратического отклонения является величина: .

4. Погрешностью выборочной средней является интервал, который показывает где, независимо от случайного характера выборки, будет находиться генеральная средняя или неслучайное значение величин генеральной совокупности - ее математическое ожидание:

Т.о. оцененная по выборке генеральная средняя будет находиться в интервале длиной m с центром в точке математического ожидания М:

5. Доверительным интервалом eназывается интервал, в котором с заданной вероятностью будут находиться случайные величины рассматриваемого распределения в генеральной совокупности:

где t – коэффициент пропорциональности (коэффициент Стьюдента), величина которого зависит как от объема выборки, так и от вероятности, с которой предполагается гарантировать результат.

Величина коэффициента Стьюдента определяется по таблице в зависимости от объема выборки и величины доверительной вероятности.

Т.о., по результатам статистического анализа выборки и оценки параметров генеральной совокупности, мы гарантируем, что величины генеральной совок4упности с заданной вероятностью будут принимать свои значения в интервале: .

Определение минимального объёма выборки

Как следует из выше сказанного, точность оценки параметров генеральной совокупности в большой степени определяется объёмом выборки. Но даже элементарная логика подсказывает, что неразумно стремиться к неоправданно большому числу наблюдений, если убедительный результат можно получить и при некотором минимальном объёме выборки.

Необходимая численность выборки n, отвечающая точности, с которой намечено получить средний результат, зависит от величины ошибки выборочной средней и может быть определена по формуле: ,

где – необходимая точность оценки, t – нормированное отклонение, с которым связана та или иная доверительная вероятность p.

t определяется как аргумент интегральной функции Лапласа по заданной доверительной вероятности при условии, что .

Пример. Для определения среднего возраста студентов академии необходимо провести выборочное обследование. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам. Сколько студентов нужно обследовать, чтобы с вероятностью 0,95 отклонение оценки от истинного среднего возраста не превышало 3 лет?

Решение: По условию задачи ε=3 года, sx=10 лет. По таблице интегральной функции Лапласа найдём значение аргумента при заданной доверительной вероятности p=0,95 t=1,96.

Итак, найдём минимальное количество необходимых для обследования студентов: .

Т.о., выборка численностью 43 человека обеспечит заданную точность при оценке среднего возраста студентов.

ПЛАН СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ

Пусть в результате статистического исследования некоторой случайной величины Х были получены выборочные результаты: X = < x1, x2, . xn>.

1. Проводим описание выборки, т.е. ранжируем ее и результат представляем в виде ряда распределения при помощи таблицы и графиков (полигон частот, гистограмма, кумулята).

2. Вычисляем выборочные характеристики:

· Выборочная дисперсия или .

· Выборочное среднее квадратическое отклонение .

3. Делаем оценку параметров генеральной совокупности:

· Оценка генеральной средней .

· Оценка генеральной дисперсии .

· Оценка генерального среднеквадратического отклонения .

· Погрешность выборочной средней .

· Доверительный интервал при уровне значимости α (или доверительной вероятности р).

История государства Древнего Египта: Одним из основных аспектов изучения истории государств и права этих стран является.

Сущность выборочного наблюдения. Основные требования, предъявляемые к статистическому наблюдению. Ошибки регистрации, связанные с недостаточной квалификацией наблюдателей. Формирование выборочной совокупности. Пример использования таблицы случайных чисел.

Подобные документы

Понятие и специфика выборочного наблюдения как метода статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются на основе положений случайного отбора. Приемы отбора, характеристика и сущность серийной выборки.

реферат, добавлен 15.10.2014

Теоретические основы выборочного наблюдения. Средний арифметический показатель и особенности его использования. Дисперсия, ее сущность и значение. Определение ошибки выборки. Порядок исследования социально-экономических явлений выборочным методом.

контрольная работа, добавлен 28.12.2012

Моделирование выборки из равномерного закона распределения. Построение вариационного ряда выборки, гистограммы и полигона частот, эмпирической функции распределения. Расчет выборочного среднего и выборочной дисперсии. Нахождение выборочной моды и медианы.

контрольная работа, добавлен 22.11.2012

Методы расчета среднего разряда, дисперсии производственных рабочих. Определение необходимой численности выборки для анализа выборочной доли с определенной вероятностью. Порядок вычисления процентного содержания предприятий в выборочной совокупности.

контрольная работа, добавлен 16.11.2015

Репрезентативность - способность выборки характеризовать соответствующую генеральную совокупность с определенной точностью и достаточной надежностью. Методика определения расчетной суммы рангов. Ключевые условия существования выборочной совокупности.

контрольная работа, добавлен 15.09.2014

Определение выборочных точечных оценок параметров. Расчет выборочного среднего по статистическому ряду. Определение выборочного среднеквадратического отклонения. Подробные формулы выборочного коэффициента эксцесса. Исчисление выборочного квантиля.

презентация, добавлен 15.09.2017

Основные понятия и определения математической статистики. Ее теоретические основы как науки. Характеристики выборочной и генеральной совокупности. Основные способы формирования выборочной совокупности. Многоступенчатый отбор и многофазная выборка.

лекция, добавлен 08.07.2014

Определение необходимого объема выборки и оценка результатов наблюдения. Формулы для необходимого объем выборки для некоторых способов формирования совокупности. Вывод о возможности распространения результатов и особенности способа коэффициентов.

лекция, добавлен 23.02.2014

Анализ содержания предположений, которые легли в основу теории случайных ошибок. Сравнительная характеристика генеральной и выборочной совокупности измерений. Определение минимального количества измерений. Методика определения коэффициента Кохрена.

лекция, добавлен 26.09.2017

Генерирование последовательности равномерно распределенных случайных чисел, их характеристика и построение гистограммы. Расчёт среднеквадратического отклонения, математического ожидания и дисперсии полученных данных с использованием функций SciLab.

Индикатором степени отличия оценки, истинной для совокупности в целом, от оценки, которая ожидается для типичной выборки, является средняя квадратическая ошибка (см. ниже). Например, исследуется мнение жителей о жилищно-коммунальной реформе, и заказчик данного исследования указал, что его устроит точность полученных результатов, равная ±5%. Предположим, что 60% членов выборки высказались… Читать ещё >

Определение объема выборки ( реферат , курсовая , диплом , контрольная )

В реальности решение об объеме выборки является компромиссом между теоретическими предположениями о точности результатов обследования и возможностями их практической реализации, прежде всего имеются в виду затраты на проведение опроса.

Следует отметить, что объем выборки никак не влияет на репрезентативность полученных результатов. Предположим, например, что для изучения мнения населения о пенсионной реформе в целом проводился опрос на основе принципа удобства на одном из московских перекрестков. И хотя было опрошено 5000 респондентов, полученные результаты не являются репрезентативными даже для Москвы. Это обусловлено тем, что был использован метод формирования выборки, который в данном случае применять было нельзя.

Однако размер выборки влияет на точность результатов. Точность выборки характеризует близость профиля выборки (например, итогового ответа на какой-то вопрос) к истинному профилю совокупности. Случайная выборка большого размера обеспечивает получение более точных результатов.

На практике используется несколько подходов к определению объема выборки. Прежде всего опишем наиболее простые.

Объем выборки может быть установлен исходя из неких заранее оговоренных условий. Скажем, заказчик исследования знает, что при изучении общественного мнения выборка обычно составляет 1000— 1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры. В случае если в каком-то регионе проводятся ежегодные исследования, то в каждом году используется выборка одного и того же объема. В отличие от первого подхода здесь при определении объема выборки используется определенная логика, которая, однако, является весьма уязвимой. Например, при проведении определенных исследований может потребоваться точность меньше, чем при традиционном изучении общественного мнения, да и объем совокупности может быть во много раз меньше нежели при изучении общественного мнения. Таким образом, данный подход не принимает в расчет текущие обстоятельства и может быть достаточно дорогим.

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете предусматриваются затраты на проведение определенных обследований, которые нельзя превышать. Очевидно, что ценность получаемой информации не принимается в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Представляется разумным учитывать затраты не абсолютным образом, а по отношению к полезности информации, полученной в результате проведенных обследований. Заказчик и исследователь должны рассмотреть различные объемы выборки и методы сбора данных, затраты, учесть другие факторы.

Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности получаемых результатов. Он также используется при анализе полученных результатов для отдельных подгрупп, формируемых в составе выборки по полу, возрасту, уровню образования и т. п. Требования к надежности и точности результатов для отдельных подгрупп диктуют определенные требования к объему выборки в целом.

Наиболее теоретически обоснованный и корректный подход к определению объема выборки основан на расчете доверительных интервалов. Рассмотрение данного подхода начнем с краткой характеристики ряда базовых понятий математической статистики (см. подробнее, например, в [4]).

Например, проведено исследование числа визитов автовладельцев в сервисные мастерские за год. Доверительный интервал для среднего числа визитов был рассчитан равным 5—7 визитам при 99%-ном уровне доверительности. Это означает, что если появится возможность провести независимо 100 раз выборочные исследования, то для 99 средних значений числа визитов попадут в диапазон от 5 до 7 визитов, другими словами, 99% автовладельцев попадут в доверительный интервал.

Индикатором степени отличия оценки, истинной для совокупности в целом, от оценки, которая ожидается для типичной выборки, является средняя квадратическая ошибка (см. ниже). Например, исследуется мнение жителей о жилищно-коммунальной реформе, и заказчик данного исследования указал, что его устроит точность полученных результатов, равная ±5%. Предположим, что 60% членов выборки высказались за реформу. Это означает, что диапазон возможных оценок для всей совокупности составляет 65—75%. Причем чем больше объем выборки, тем меньше ошибка. Высокое значение вариации обусловливает высокое значение ошибки и наоборот.

Теперь после знакомства с базовыми понятиями определим объем выборки на основе расчета доверительного интервала. Исходной информацией, необходимой для реализации данного подхода, является:

  • 1. Величина вариации, которой, как считается, обладает совокупность.
  • 2. Желаемая точность. 3. Уровень доверительности, которому должны удовлетворять результаты проводимого обследования.

Когда на заданный вопрос существует только два варианта ответа, выраженные в процентах (используется процентная мера), объем выборки определяется по следующей формуле:

Определение объема выборки.

где п — объем выборки;

z — нормированное отклонение, определяемое исходя из выбранного уровня доверительности (табл. 10.1); р — найденная вариация для выборки: q = (100 — р); е — допустимая ошибка.

Значение нормированного отклонения оценки (z) от среднего значения в зависимости от доверительной вероятности (а) полученного результата

3. Строим графики (гистограмму частот и кумуляту) в осях (х; р) и (x; s) соответственно.

4. Вычисляем выборочные характеристики центра распределения:

1). Выборочная средняя

2). Мода – варианта, имеющая наибольшую частоту в распределении

3). Медиана – значение, делящее число вариант пополам

5. Вычисляем выборочные характеристики вариации:

1). Размах колебаний (размах вариации) выборки

2). Линейное отклонение вариант от выборочного среднего

3). Среднее линейное отклонение

4). Выборочная дисперсия

5). Выборочное среднее квадратическое отклонение

6). Квартильное отклонение

Квартили – значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% вариант будут меньше первого квартиля по величине, 25% вариант будут заключены между первым и вторым квартилями, 25% - между вторым и третьим , и остальные 25% превышают , т.е. это значения делящие число вариант на четыре части:

7). Коэффициент децильной дифференциации

Децили – значения, делящие число вариант на десять равных частей:

III. Производим оценку параметров генеральной совокупности:

1). Оценка генеральной средней

2). Интервальная оценка ошибки (погрешности) выборочного среднего

3). Оценка генеральной дисперсии

4). Оценка генерального среднего квадратического откланения

5). Доверительный интервал для оценки погрешности генерального математического ожидания , где поправочный коэффициент t определяется в зависимости от объема выборки и заданного уровня значимости α (заданной доверительной вероятности p).

Для большой выборки, независимо от ее объема и закона распределения поправочный коэффициент t определяется по таблице Лапласа (табл.1). Для нормально распределенных выборок малого объема целесообразно определять поправочный коэффициент t по таблице Стьюдента (табл.2) в зависимости от заданной вероятности p (уровня значимости α) и числа степеней свободы .

Определение минимального объёма выборки

Точность оценки параметров генеральной совокупности в большой степени определяется объёмом выборки. Необходимая численность выборки n, отвечающая точности, с которой намечено получить средний результат, зависит от величины ошибки выборочной средней и может быть определена по формуле: , где – необходимая точность оценки, t – нормированное отклонение, с которым связана та или иная доверительная вероятность p. Значение t определяется как аргумент интегральной функции Лапласа по заданной доверительной вероятности при условии, что .

© 2014-2022 — Студопедия.Нет — Информационный студенческий ресурс. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав (0.005)

Читайте также: