Определение необходимой численности выборки кратко

Обновлено: 04.07.2024

Статистическая методология исследования массовых явлений различает, как известно, два способа наблюдения в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное, которое в условиях рыночных отношений в России находит все более широкое применение. Переход статистики РФ на международные стандарты системы национального счетоводства требует более широкого применения выборки для получения и анализа показателей СНС не только в промышленности, но и в других секторах экономики.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу ‑ по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и науч­но организованной работы по отбору единиц.

К выборочному наблюдению статистика прибегает по различным причинам. На современном этапе появилось множество субъектов хозяйствен­ной деятельности, которые характерны для рыночной экономики. Речь идет об акционерных обществах, малых и совместных предприятиях, фермерских хозяйствах и т.д. Сплошное обследование этих статистических совокупностей, состоящих из десятков и сотен тысяч единиц, потребовало бы огромных материальных, финансовых и иных затрат. Использование же выборочного обследования позволяет значительно сэкономить силы и средства, что имеет немаловажное значение.

Наряду с экономией ресурсов одной из причин превращения выборочного наблюдения в важнейший источник статистической информации является возможность значительно ускорить получение необходимых данных. Ведь при обследовании, скажем, 10% единиц совокупности будет затрачено гораздо меньше времени, а результаты могут быть представлены быстрее, и будут более актуальными. Фактор времени важен для статисти­ческого исследования особенно в условиях изменяющейся социально-экономической ситуации.

Реализация выборочного метода базируется на понятиях генеральной и выборочной совокупностей.

Генеральной совокупностью называется вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц формируется совокупность выборочная. Поэтому генеральную совокупность также называют основой выборки.

Отбор единиц в выборочную совокупность может быть повторным или беспо­вторным.

При повторном отборе попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Таким образом, некоторые единицы могут попадать в выборку дважды, трижды или даже большее число раз. И при изучении выборочной совокупности они будут рассматриваться как отдельные независимые наблюдения.

Отметим, что число единиц генеральной совокупности, участвующих в отборе, при таком подходе остается постоянным. Поэтому вероятность попадания в выборку для всех единиц совокупности на протяжении всего процесса отбора также не меняется.

На практике методология повторного отбора обычно используется в тех случаях, когда объем генеральной совокупности не известен и теоретически возможно повторение единиц с уже встречавшимися значениями всех регистрируемых признаков.

Например, при проведении маркетинговых исследований мы не можем сколько-нибудь точно оценить, какое число потребителей предпочитают стиральный порошок конкретной торговой марки, сколько покупателей предпочитают делать покупки именно в данном супермаркете и т.д. Поэтому возможно повторение совершенно идентичных единиц как по причине практически неограниченных объемов совокупности, так и вследствие возможной повторной регистрации. Предположим, при проведении обследования один и тот же покупатель может дважды прийти в магазин и дважды подвергнуться обследованию.

При выборочном контроле качества продукции объем генеральной совокупности также часто не определен, так как процесс производства может осуществляться постоянно, каждый день дополняя генеральную совокупность новыми единицами-изделиями. Поэтому в выборочную совокупность могут попасть два и более изделий с абсолютно одинаковыми характеристиками. Следовательно, и в этом случае при обработке результатов выборки необходимо ориентироваться на методологию, используемую при повторном отборе.

При бесповоротном отборе попавшая в выборку единица подвергается обследова­нию и в дальнейшей процедуре отбора не участвует. Такой отбор целесообразен и практически возможен в тех случаях, когда объем генеральной совокупности четко определен. Получаемые при этом результаты, как правило, являются более точными по сравнению с результатами, основанными на повторной выборке.

Как уже отмечалось выше, выборочное наблюдение всегда связано с определенны­ми ошибками получаемых характеристик. Эти ошибки называются ошибками репрезента­тивности (представительности).

Ошибки репрезентативности обусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную. Получаемые расхождения или ошибки репрезентативности позволяют заключить, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует различать систематические и случайные ошибки репре­зентативности.

Систематические ошибки репрезентативности связаны с нарушением принципов формирования выборочной совокупности. Например, вследствие каких-либо причин, связанных с организацией отбора, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными.

Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характе­ристики будут несколько различаться. Получаемые случайные ошибки могут быть стати­стически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.

При дальнейшем рассмотрении теории и методов выборочного наблюдения используются следующие общепринятые условные обозначения:

N ‑ объем (число единиц) генеральной совокупности;

n ‑ объем (число единиц) выборочной совокупности;

‑ генеральная средняя, т.е. среднее значение изучаемого признака по генераль­ной совокупности (средняя прибыль, средняя величина активов, средняя численность ра­ботников предприятия и т.п.);

‑ выборочная средняя,
т.е. среднее значение изучаемого признака по выборочной совокупности;

М ‑ численность единиц генеральной совокупности, обладающих определенным вариантом или вариантами изучаемого признака (численность городского населения, численность сельского населения, количество бракованных изделий, число нерентабельных предприятий и т.п.);

р ‑ генеральная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, во всей генеральной совокупности (доля городского населения в общей численности населения, доля бракованной продукции в общем выпуске, доля нерентабельных предприятий в общей численности предприятий и т.п.); определяетcя как

m численность единиц выборочной совокупности, обладающих определенным вариантом или вариантами изучаемого признака;

w ‑ выборочная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, в выборочной совокупности,

‑ средняя ошибка выборки;

‑ предельная ошибка выборки;


‑ коэффициент доверия, определяемый в зависимости от уровня вероятности.

Ошибка выборки или отклонение выборочной средней от средней генеральной находится в прямой зависимости от дисперсии изучаемого признака в генеральной совокуп­ности, и в обратной зависимости ‑ от объема выборки.

Таким образом среднюю ошибку выборки можно представить как

Формула 10.1

При проведении выборочного наблюдения дисперсия изучаемого признака в генеральной совокупности, как правило, не известна. В то же время, между генеральной дисперсией и средней из всех возможных выборочных дисперсий существует следующее соотношение:

Формула 10.2

В связи с тем, что на практике в большинстве случаев из генеральной совокупности в определенный момент времени производится только одна выборка, дисперсия изучаемого признака по этой выборке и используется при расчете ошибки.

Учитывая, что при достаточно большом объеме выборки отношение близко к 1, формула средней ошибки повторной выборки принимает следующий вид:

Где ‑ дисперсия изучаемого признака по выборочной совокупности.

При определении возможных границ значений характеристик генеральной сово­купности рассчитывается предельная ошибка выборки, которая зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы.

Согласно теореме А.М. Ляпунова, вероятность той или иной величины предельной ошибки, при достаточно большом объеме выборочной сово­купности, подчиняется нормальному закону распределения и может быть определена на основе интеграла Лапласа.

Значения интеграла Лапласа при различных величинах t табулированы и представ­лены в статистических справочниках.

При обобщении результатов выборочного наблюдения наиболее часто используются следующие уровни вероятности и соответствующие им значения t:

Таблица 10.1 ‑ . Некоторые значения t

Вероятность, рi. 0,683 0,866 0,954 0,988 0,997 0,999
Значение t 1,0 1,5 2,0 2,5 3,0 3,5

Например, если при расчете предельной ошибки выборки мы используем значение t=2, то с вероятностью 0,954 можно утверждать, что расхождение между выборочной средней и генеральной средней не превысит двукратной величины средней ошибки вы­борки.

Теоретической основой для определения границ генеральной доли, т.е. доли еди­ниц, обладающих тем или иным вариантом признака, является теорема Вернули. Согласно данной теореме вероятность получения сколь угодно малого расхождения между выборочной долей и генеральной долей при достаточно большом объеме выборки будет стремиться к единице. С учетом того, что вероятность расхождения между выборочной и генеральной долями подчиняется нормальному закону распределения, эта вероятность также определяется по функции F(t) при заданном значении t.

Процесс подготовки и проведения выборочного наблюдения включает ряд после­довательных этапов:

  1. Определение цели обследования.
  2. Установление границ генеральной совокупности.
  3. Составление программы наблюдения и программы разработки данных
  4. Определение вида выборки, процента отбора и метода отбора
  5. Отбор и регистрация наблюдаемых признаков у отобранных единиц.
  6. Насчет выборочных характеристик и их ошибок.
  7. Распространение полученных результатов на генеральную совокупность.

В зависимости от состава и структуры генеральной совокупности выбирается вид выборки или способ отбора.

К наиболее распространенным на практике видам относятся:

  • собственно-случайная (простая случайная) выборка;
  • механическая (систематическая) выборка;
  • типическая (стратифицированная, расслоенная) выборка;
  • серийная (гнездовая) выборка.

Отбор единиц из генеральной совокупности может быть комбинированным, много­ступенчатым и многофазным.

Комбинированный отбор предполагает объединение нескольких видов выборки. Так, например, можно комбинировать типическую и серийную, серийную и собственно-случайную выборки. Ошибка такой выборки определяется ступенчатостью отбора.

Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы, потом ‑ более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофазная выборка, в отличие от многоступенчатой, предполагает сохранение одной и той же единицы отбора на всех этапах его проведения; при этом отобранные на каждой стадии единицы подвергаются обследованию, каждый раз – по более расширенной программе.

Собственно-случайная (простая случайная) выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности.

Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной сово­купности таким образом, чтобы включение или не включение в нее отдельных единиц не вызывало сомнений. Так, например, при обследовании студентов необходимо указать, будут ли приниматься во внимание лица, находящиеся в академическом отпуске, студенты негосударственных вузов, военных училищ и т.п.; при обследовании торговых предприятий важно определиться, включит ли генеральная совокупность торговые павильоны, коммерческие палатки и прочие подобные объекты.

Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел.

Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности.

Различают среднюю и предельную ошибки выборки. Эти два вида связаны следующим соотношением:

Величина средней ошибки выборки рассчитывается дифференциро­ванно в зависимости от способа отбора и процедуры выборки.

Так, при собственно-случайном повторном отборе средняя ошибка определяется по формуле:

а при расчете средней ошибки собственно-случайной бесповторной выборки:

Формула 10.6

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

Формула 10.7

где и ‑ генеральная и выборочная средняя соответственно;

‑ предельная ошибка выборочной средней.

Пример.

При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 г. при среднем квадратическом отклонении 4 г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделия в генеральной совокупности.

Решение. Рассчитаем сначала предельную ошибку выборки. Так как при р = 0,997, t = 3, она равна:

Определим пределы генеральной средней:


или


Вывод: Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 г. до 30,84 г.

Пример 2.

В городе проживает 250 тыс. семей. Для определения среднего числа детей в семье была организована 2%-ная случайная бесповторная выборка семей. По ее результатам было получено следующее распре­деление семей по числу детей:

Таблица 10.2 ‑ Распределение семей по числу детей в городе N

С вероятностью 0,954 определите пределы, в которых будет находить­ся среднее число детей в генеральной совокупности.

Решение. В начале на основе имеющегося распределения семей определим выборочные среднюю и дисперсию:

Если задана предельная ошибка выборки, то мы можем определить минимальный объем выборочной совокупности, обеспечивающий заданную ошибку. В данном случае формулы которые необходимо использовать различны для различных способов отбора и типа исследуемого признака

· Выборка повторная, признак количественный



- выборочная дисперсия

t -параметр зависящий от вероятности


предельная ошибка

· Выборка бесповторная, а признак количественный


N- объем генеральной совокупности

· Выборка повторная, признак альтернативный


w- выборочная доля

· Выборка бесповторная, признак альтернативный


Малая выборка

Выборочное наблюдение, численность которого не превышает 30 единиц называется малой выборкой.

, где - дисперсия признака в выборочной совокупности

n - число единиц в выборке

обобщающая таблица формул определения объема выборки при различных способах отбора

Одним из научных принципов в теории выборочного ме­тода является обеспечение достаточного числа отобранных еди­ниц.

Теоретически необходимость соблюдения этого принципа представлена в доказательствах предельных теорем теории ве­роятностей, которые позволяют установить, какой объём еди­ниц следует выбрать из генеральной совокупности, чтобы он был достаточным и обеспечивал репрезентативность выборки.

Расчет необходимого объёма выборки строится с помощью формул, выведенных из формул предельных ошибок выборки (Δ), соответствующих тому или иному виду и способу отбора. Так, для собственно-случайного повторного отбора имеем

,


тогда


Смысл этой формулы в том, что при случайном повторном отборе объем необходимой численности выборки прямо пропор­ционален квадрату коэффициента доверия t и дисперсии ва­риационного признака и обратно пропорционален квад­рату предельной ошибки выборки Δ. В частности, с увели­чением предельной ошибки в два раза необходимая числен­ность выборки может быть уменьшена в четыре раза. Из трёх параметров два (t и Δ) задаются исследователем. При этом исследователь, исходя из цели и задач выборочного обследова­ния, должен решить вопрос: в каком количественном сочетании лучше включить эти параметры для обеспечения оптимального варианта? В одном случае его может устраивать в большой мере надежность полученных результатов (t), нежели мера точности (Δ), в другом - наоборот. Сложнее решить вопрос в отношении величины предельной ошибки выборки, так как этим показателем исследователь на стадии проектировки выбо­рочного наблюдения не располагает. Поэтому в практике при­нято задавать величину предельной ошибки выборки, как пра­вило, в пределах до 10 % предполагаемого среднего уровня признака. К установлению предполагаемого среднего уровня можно подходить по разному: использовать данные подобных, ранее проведенных обследований или же воспользоваться дан­ными основы выборки и произвести небольшую пробную вы­борку.

Наиболее сложно установить при проектировке выборочного наблюдения третий параметр в формуле - дисперсию выборочной совокупности. В этом случае необходимо исполь­зовать всю информацию, имеющуюся в распоряжении исследо­вателя, как-то: ранее проведенные подобные обследования, пробные обследования и др.

При изучении альтернативного признака (доли р) объем необходимой численности выборки определяется по следующей формуле:


Смысл этой формулы тот же. На стадии проектировки выборочного наблюдения, если невоз­можно хотя бы приблизительно определить дисперсию альтер­нативного признака, она принимается равной своему максимуму - 0,25.

Вопрос об определении необходимой численности выборки усложняется, если выборочное обследование предполагает изучение нескольких признаков единиц отбора. В этом случае средние уровни каждого из признаков и их вариация, как правило, различны и поэтому решить вопрос о том, дисперсии какого из признаков отдать предпочтение, возможно лишь с учетом цели и задач обследования.

СПОСОБЫ ОТБОРА И ВИДЫ ВЫБОРКИ, ОБЕСПЕЧИВАЮЩИЕ РЕПРЕЗЕНТАТИВНОСТЬ

В зависимости от методики формирования выборочной сово­купности различают следующие основные виды выборки: соб­ственно-случайную; механическую; типическую (стратифициро­ванную, районированную); серийную (гнездовую); комбиниро­ванную; многоступенчатую; многофазную; взаимопроникающую.

Собственно-случайная выборка должна формироваться в строгом соот­ветствии с научными принципами и правилами случайного от­бора. Для построения собственно-случайной выборки генераль­ная совокупность строго подразделяется на единицы отбора и затем в случайном повторном или бесповторном порядке отби­рается достаточное число единиц. Случайный порядок - это порядок равносильный жеребьевке. На практике такой поря­док лучшим образом обеспечивается при использовании спе­циальных таблиц случайных чисел. Если, например, из сово­купности, содержащей 1675 единиц, следует отобрать 30 еди­ниц, то из таблицы отбирают 30 четырехзначных чисел, которые меньше 1675.

В том случае, когда собственно-случайная выборка органи­зуется как повторная, расчет стандартной ошибки производится в соответствии с формулой (11.5). При бесповторном способе отбора формула для расчета стандартной ошибки выглядит следующим образом:


,

где - доля единиц генеральной совокупности, не попавших в выборку. Так как эта доля всегда меньше единицы, то ошибка при бесповторном отборе, при прочих равных условиях, всегда меньше, чем при повторном. Бесповторный отбор прак­тически организовать проще, чем повторный, и он применяется чаще. Более того, при обследовании продукции на годность к применению повторный отбор невозможен. Однако величину стандартной ошибки при бесповторном отборе можно определять по более простой формуле. Такая замена возможна, если доля единиц генеральной совокупности, не попавших в выборку, - большая и, следовательно, величина близка к единице. Так, например, при двухпроцентной выборке величина стандартной ошибки при повторном отборе будет примерно всего лишь на один процент больше, чем при бесповторном. Такое расхождение практически не отразится на ширине доверительного интервала. Другое дело, если про­водится, например, 19%-ный отбор: в этом случае расхожде­ние составит более 11%, что существенно изменит доверитель­ный интервал. Поэтому, если в первом случае замена формулы целесообразна, то во втором - непри­емлема.

Формировать выборку в строгом соответствии с правилами случайного отбора практически очень сложно, а иногда невоз­можно. Так, если при этом пользоваться таблицами случайных чисел, то необходимо перенумеровать все единицы генераль­ной совокупности, а если жеребьевкой, то на каждую единицу необходимо заготовить соответствующую фишку. При прове­дении многих выборочных обследований по стране в целом, ге­неральная совокупность настолько большая, что провести та­кую предварительную работу практически невозможно и неце­лесообразно. Поэтому на практике применяют другие виды выборок, каждая из которых не является строго случайной. Однако они должны быть организованы так, чтобы было обеспечено максимальное приближение к условиям случайного отбора.

При чисто механической выборке вся генеральная совокуп­ность единиц должна быть, прежде всего, представлена в виде списка единиц отбора, составленного в каком-то нейтральном по отношению к изучаемому признаку порядке, например по алфавиту. Затем список единиц отбора разбивается на столько равных частей, сколько необходимо отобрать единиц. Далее по заранее установленному правилу, не связанному с вариацией исследуемого признака, из каждой части списка отбирается одна единица. Этот вид выборки не всегда может обеспечить случайный характер отбора и полученная выборка может ока­заться смещенной. Объясняется это тем, что, во-первых, упо­рядочение единиц генеральной совокупности может иметь эле­мент неслучайного характера. Во-вторых, отбор из каждой части генеральной совокупности при неправильном установ­лении начала отсчета может также привести к ошибке смеще­ния. Однако практически легче организовать механическую выборку, чем собственно-случайную, и при проведении выборочных обследований чаще всего пользуются этим видом вы­борки. Стандартную ошибку при механической выборке опре­деляют по формуле собственно-случайной бесповторной выборки.

Типическая (районированная, стратифицированная) выборка преследует две цели:

1) обеспечить представительство соответствующих типических групп генеральной совокуп­ности в вы­борке по интересующим исследователя признакам;

2) увели­чить точность результатов выборочного обследования.

При типической выборке до начала ее формирования гене­ральная совокупность единиц разбивается на типические группы. При этом очень важным моментом является правильный выбор группировочного признака. Выделенные типические группы могут содержать одинаковое или различное число еди­ниц отбора. В первом случае выборочная совокупность форми­руется с одинаковой долей отбора из каждой группы, во вто­ром - с долей, пропорциональной ее доле в генеральной сово­купности. Если выборка формируется с равной долей отбора, по существу, она равносильна ряду собственно-случайных вы­борок из меньших генеральных совокупностей, каждая из кото­рых и есть типическая группа. Отбор из каждой группы осу­ществляется в случайном (повторном или бесповторном) либо механическом порядке. При типической выборке как с равной, так и неравной долей отбора удается устранить влияние меж­групповой вариации изучаемого признака на точность ее ре­зультатов, так как обеспечивается обязательное представитель­ство в выборочной совокупности каждой из типических групп. Стандартная ошибка выборки будет зависеть не от величины общей дисперсии , а от величины средней из групповых дисперсий . Поскольку средняя из групповых дисперсий всегда меньше общей дисперсии, постольку, при прочих равных условиях, стандартная ошибка типической выборки будет меньше стандартной ошибки собственно-случайной выборки.

При определении стандартных ошибок типической выборки применяются следующие формулы:

при повторном способе отбора:


;

при бесповторном способе отбора:


Серийная (гнездовая) выборка - это такой вид формиро­вания выборочной совокупности, когда в случайном порядке отбираются не единицы, подлежащие обследованию, а группы единиц (серии, гнезда). Внутри отобранных серий (гнезд) об­следованию подвергаются все единицы. Серийную выборку практически организовать и провести легче, чем отбор отдель­ных единиц. Однако при этом виде выборки, во-первых, не обеспечивается представительство каждой из серий и, во-вто­рых, не устраняется влияние межсерийной вариации изучае­мого признака на результаты обследования. В том случае, когда эта вариация значительна, она приведет к увеличению случайной ошибки репрезентативности. При выборе вида вы­борки исследователю необходимо учитывать это обстоятельство. Стандартная ошибка серийной выборки определяется по фор­мулам:

при повторном способе отбора:



где - межсерийная дисперсия выборочной совокупности;r - число отобранных серий;

при бесповторном способе отбора:


где R - число серий в генеральной совокупности.

на практике те или иные способы и виды выборок приме­няются в зависимости от цели и задач выборочных обследова­ний, а также возможностей их организации и проведения. Чаще всего применяется сочетание способов отбора и видов выборки. Такие выборки получили название комбинированных. Комбинирование возможно в разных сочетаниях: механической и серийной выборки, типической и механической, серийной и собственно-случайной и т. д. К комбинированной выборке при­бегают с целью обеспечить наибольшую репрезентативность с наименьшими трудовыми и денежными затратами на организацию и проведение обследования.

При комбинированной выборке величина стандартной ошибки выборки состоит из ошибок на каждой ее ступени и может быть определена как корень квадратный из суммы квад­ратов ошибок соответствующих выборок. Так, если при комби­нированной выборке в сочетании использовались механическая и типическая выборки, то стандартную ошибку можно опреде­лить по формуле:


где и- стандартные ошибки соответственно механической и типической выборок.

Особенность многоступенчатой выборки состоит в том, что выборочная совокупность формируется постепенно, по ступе­ням отбора. На первой ступени с помощью заранее определенного способа и вида отбора отбираются единицы первой сту­пени. На второй ступени из каждой единицы первой ступени, попавшей в выборку, отбираются единицы второй ступени и т. д. Число ступеней может быть и больше двух. На послед­ней ступени формируется выборочная совокупность, единицы которой подлежат обследованию. Так, например, для выбороч­ного обследования бюджетов семей граждан на первой ступени отбираются области, на второй ­районы в отобранных областях, на третьей - в каждом из рай­онов отбираются предприятия и, наконец, на четвертой сту­пени - в отобранных предприятиях отбираются семьи. Таким образом, выборочная совокупность семей формируется на по­следней, четвертой ступени. Многоступенчатая выборка более гибкая, чем другие виды, хотя в общем она дает менее точные результаты, чем выборка того же объема, но сформированная в одну ступень. Однако при этом она имеет одно важное преимущество, заключаещееся в том, что основу выборки при многоступенчатом отборе нужно строить на каждой из сту­пеней только для тех единиц, которые попали в выборку, а это очень важно, так как нередко готовой основы выборки нет.

Стандартную ошибку выборки при многоступенчатом от­боре при группах разных объемов определяют по формуле


,

где ,,… - стандартные ошибки на разных ступенях;,,. - численности выборок на соответствующих ступе­нях отбора.

В том случае, если группы неодинаковы по объему, то тео­ретически этой формулой пользоваться нельзя. Но если общая доля отбора на всех ступенях постоянна, то практически рас­чет по этой формуле не приведет к искажению величины ошибки.

Сущность многофазной выборки состоит в том, что на ос­нове первоначально сформированной выборочной совокупности образуют подвыборку, из этой подвыборки - следующую под­выборку и т. д. Первоначальная выборочная совокупность представляет собой первую фазу, подвыборка из нее - вторую и т. д. Многофазную выборку целесообразно применять в не­скольких случаях:

если для изучения различных признаков тре­буется неодинаковый объем выборки;

если колеблемость изу­чаемых признаков неодинакова и требуемая точность различна;

если в отношении всех единиц первоначальной выборочной совокупности (первая фаза) необходимо собрать одни - менее подробные сведения, а в отношении единиц каждой последую­щей фазы другие - более подробные.

Одним из несомненных достоинств многофазной выборки яв­ляется то обстоятельство, что сведениями, полученными на первой фазе, можно пользоваться как дополнительной инфор­мацией на последующих фазах, информацией второй фазы как дополнительной информацией на следующих фазах и т. д. Такое использование сведений повышает точность результатов выборочного обследования.

При организации многофазной выборки можно применять сочетание различных способов и видов отбора (типическую выборку с механической и т. д.). Многофазный отбор можно сочетать с многоступенчатым. На каждой ступени выборка мо­жет быть многофазной.

Стандартная ошибка при многофазной выборке рассчиты­вается на каждой фазе в отдельности в соответствии с форму­лами того способа отбора и вида выборки, при помощи кото­рых формировалась ее выборочная совокупность.

Взаимопроникающие выборки - это две или более незави­симые выборки из одной и той же генеральной совокупности, образованные одним и тем же способом и видом. К взаимо­проникающим выборкам целесообразно прибегать, если необходимо за короткий срок получить предварительные итоги вы­борочных обследований. Взаимопроникающие выборки эффек­тивны для оценки результатов обследования. Если в незави­симых выборках результаты одинаковы, то это свидетельствует о надежности данных выборочного обследования. Взаимопро­никающие выборки иногда можно применять для проверки работы различных исследователей, поручив каждому из них провести обследование разных выборок.

Стандартная ошибка при взаимопроникающих выборках определяется так же, как при типической пропорциональной выборке:


Взаимопроникающие выборки по сравнению с другими видами требуют больших трудовых затрат и денежных расходов. Поэтому исследователь должен учиты­вать это обстоятельство при проектировании выборочного об­следования.

На заводе с числом рабочих 12 тыс. необхо­димо установить долю рабочих, обучающихся в высших учебных заведениях, методом механического отбора.

1) Какова должна быть численность выборки, чтобы с ве­роятностью 0,997 ошибка выборки не превышала 0,08, если на основе предыдущих обследований известно, что дисперсия равна 0,16?

2) определить чис­ленность выборки при условии, что метод отбора пов­торный.

Решение:

При случайном бесповторном отборе для расчета не­обходимой численности выборки для определения доли с заданной точностью, применяется следующая формула:

Необходимая численность выборки для определения доли

t – коэффициент доверия,

ω(1 – ω) – дисперсия,

N – численность генеральной совокупности,

Δ – предельная ошибка выборочной доли.

При Р = 0,997, t = 3 другие значения t можно посмотреть в Задаче №32:

Численность выборки должна составить:

Расчёт необходимой численности выборки для определения доли

2) Если отбор производится повторным методом, то численность выборки рассчитывается по формуле:

Читайте также: