Определение необходимого объема выборки кратко

Обновлено: 05.07.2024

6.3. Определение необходимой численности выборки.

Одним из научных принципов в теории выборочного метода является обеспечение достаточного числа отобранных единиц. Теоретически необходимость соблюдения этого принципа представлена в доказательствах предельных теорем теории вероятностей, которые позволяют установить, какой объем единиц следует выбрать из генеральной совокупности, чтобы он был достаточным и обеспечивал репрезентативность выборки.

Уменьшение стандартной ошибки выборки, а следовательно, увеличение точности оценки всегда связано с увеличением объема выборки, поэтому уже на стадии организации выборочного наблюдения приходится решать вопрос о том, каков должен быть объем выборочной совокупности, чтобы была обеспечена требуемая точность результатов наблюдений. Расчет необходимого объема выборки строится с помощью формул, выведенных из формул предельных ошибок выборки (А), соответствующих тому или иному виду и способу отбора. Так, для случайного повторного объема выборки (n) имеем:

Суть этой формулы – в том, что при случайном повторном отборе необходимой численности объем выборки прямо пропорционален квадрату коэффициента доверия (t2) и дисперсии вариационного признака (?2) и обратно пропорционален квадрату предельной ошибки выборки (?2). В частности, с увеличением предельной ошибки в два раза необходимая численность выборки может быть уменьшена в четыре раза. Из трех параметров два (t и ?) задаются исследователем. При этом исследователь исходя из цели.

И задач выборочного обследования должен решить вопрос: в каком количественном сочетании лучше включить эти параметры для обеспечения оптимального варианта? В одном случае его может больше устраивать надежность полученных результатов (t), нежели мера точности (?), в другом – наоборот. Сложнее решить вопрос в отношении величины предельной ошибки выборки, так как этим показателем исследователь на стадии проектировки выборочного наблюдения не располагает, поэтому в практике принято задавать величину предельной ошибки выборки, как правило, в пределах до 10 % предполагаемого среднего уровня признака. К установлению предполагаемого среднего уровня можно подходить по разному: использовать данные подобных ранее проведенных обследований или же воспользоваться данными основы выборки и произвести небольшую пробную выборку.

Наиболее сложно установить при проектировании выборочного наблюдения третий параметр в формуле (5.2) – дисперсию выборочной совокупности. В этом случае необходимо использовать всю информацию, имеющуюся в распоряжении исследователя, полученную в ранее проведенных подобных и пробных обследованиях.

Вопрос об определении необходимой численности выборки усложняется, если выборочное обследование предполагает изучение нескольких признаков единиц отбора. В этом случае средние уровни каждого из признаков и их вариация, как правило, различны, и поэтому решить вопрос о том, дисперсии какого из признаков отдать предпочтение, возможно лишь с учетом цели и задач обследования.

При проектировании выборочного наблюдения предполагаются заранее заданная величина допустимой ошибки выборки в соответствии с задачами конкретного исследования и вероятность выводов по результатам наблюдения.

В целом формула предельной ошибки выборочной средней величины позволяет определять:

величину возможных отклонений показателей генеральной совокупности от показателей выборочной совокупности;

необходимую численность выборки, обеспечивающую требуемую точность, при которой пределы возможной ошибки не превысят некоторой заданной величины;

вероятность того, что в проведенной выборке ошибка будет иметь заданный предел.

При разработке программы выборочного наблюдения одним из наиболее сложных является вопрос о том, сколько единиц изу­чаемой совокупности необходимо исследовать, т. е. об объёме вы­борки.

При этом следует иметь в виду, что при любом способе отбора предельная ошибка выборки обратно пропорциональна числу обследованных единиц. Так как средняя ошибка выборки пропорциональна , то при увеличении численности выборки в 4 раза, ошибка уменьшится вдвое. Увеличивая n, можно свести ошибку к min. При n®N, ®0.

Повышение процента выборки ведёт к увеличению объёма исследуемой работы. В то же время, если в выборку взять недостаточное количество проб, то результаты исследования будут содержать большие погрешности. Всё это необходимо учитывать при организации выборочного обследования.

Формула предельной ошибки выборки используется не только для оценки пределов, в которых находится изучаемый признак в генеральной совокупности, но и для определения необходимого объёма выборки при заданной её ошибке. Для простой случайной повторной выборки имеем:

При проектировании выборочного наблюдения заранее задаётся величина допустимой ошибки и доверительная вероятность для определения предельной ошибки .

Если P=0,954, то (2σ).

Если P=0,997, то (3σ).

Наибольшую сложность представляет определение величины дисперсии генеральной совокупности. Для определения дисперсии признака в генеральной совокупности используются приближённые методы:

1). Можно провести несколько пробных исследований и по ним выбирать наибольшее значение дисперсии , где достаточно пробных наблюдений.

2). Можно использовать данные прошлых или аналогичных обследований.

3). Можно использовать размах вариации , если распределение нормальное, то , т. е. .

Для простой случайной бесповторной выборки расчёт объёма выборки осуществляется по формуле:

Объём выборки N Повторный отбор Бесповторный отбор
При определении среднего размера признака
При определении доли признака

В городе А с целью определения средней продолжительности поездки населения на работу предполагается провести выборочное наблюдение методом случайного повторного отбора. Определить, какой должна быть численность выборки, чтобы с вероятностью 0,954 (и 0,997) ошибка выборочной средней не превышала 5 мин. при среднем квадратическом отклонении 20 мин.

Решение:

1). Численность случайной повторной выборки (P=0,954, t=2):

2). Численность случайной повторной выборки (P=0,997, t=3):

При разработке программы выборочного наблюдения одним из наиболее сложных является вопрос о том, сколько единиц изу­чаемой совокупности необходимо исследовать, т. е. об объёме вы­борки.

При этом следует иметь в виду, что при любом способе отбора предельная ошибка выборки обратно пропорциональна числу обследованных единиц. Так как средняя ошибка выборки пропорциональна , то при увеличении численности выборки в 4 раза, ошибка уменьшится вдвое. Увеличивая n, можно свести ошибку к min. При n®N, ®0.

Повышение процента выборки ведёт к увеличению объёма исследуемой работы. В то же время, если в выборку взять недостаточное количество проб, то результаты исследования будут содержать большие погрешности. Всё это необходимо учитывать при организации выборочного обследования.

Формула предельной ошибки выборки используется не только для оценки пределов, в которых находится изучаемый признак в генеральной совокупности, но и для определения необходимого объёма выборки при заданной её ошибке. Для простой случайной повторной выборки имеем:

При проектировании выборочного наблюдения заранее задаётся величина допустимой ошибки и доверительная вероятность для определения предельной ошибки .

Если P=0,954, то (2σ).

Если P=0,997, то (3σ).

Наибольшую сложность представляет определение величины дисперсии генеральной совокупности. Для определения дисперсии признака в генеральной совокупности используются приближённые методы:

1). Можно провести несколько пробных исследований и по ним выбирать наибольшее значение дисперсии , где достаточно пробных наблюдений.




2). Можно использовать данные прошлых или аналогичных обследований.

3). Можно использовать размах вариации , если распределение нормальное, то , т. е. .

Для простой случайной бесповторной выборки расчёт объёма выборки осуществляется по формуле:

Объём выборки N Повторный отбор Бесповторный отбор
При определении среднего размера признака
При определении доли признака

В городе А с целью определения средней продолжительности поездки населения на работу предполагается провести выборочное наблюдение методом случайного повторного отбора. Определить, какой должна быть численность выборки, чтобы с вероятностью 0,954 (и 0,997) ошибка выборочной средней не превышала 5 мин. при среднем квадратическом отклонении 20 мин.

Решение:

1). Численность случайной повторной выборки (P=0,954, t=2):

2). Численность случайной повторной выборки (P=0,997, t=3):

Статистическая методология исследования массовых явлений различает, как известно, два способа наблюдения в зависимости от полноты охвата объекта: сплошное и несплошное. Разновидностью несплошного наблюдения является выборочное, которое в условиях рыночных отношений в России находит все более широкое применение. Переход статистики РФ на международные стандарты системы национального счетоводства требует более широкого применения выборки для получения и анализа показателей СНС не только в промышленности, но и в других секторах экономики.

Под выборочным наблюдением понимается несплошное наблюдение, при котором статистическому обследованию (наблюдению) подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу ‑ по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения и науч­но организованной работы по отбору единиц.

К выборочному наблюдению статистика прибегает по различным причинам. На современном этапе появилось множество субъектов хозяйствен­ной деятельности, которые характерны для рыночной экономики. Речь идет об акционерных обществах, малых и совместных предприятиях, фермерских хозяйствах и т.д. Сплошное обследование этих статистических совокупностей, состоящих из десятков и сотен тысяч единиц, потребовало бы огромных материальных, финансовых и иных затрат. Использование же выборочного обследования позволяет значительно сэкономить силы и средства, что имеет немаловажное значение.

Наряду с экономией ресурсов одной из причин превращения выборочного наблюдения в важнейший источник статистической информации является возможность значительно ускорить получение необходимых данных. Ведь при обследовании, скажем, 10% единиц совокупности будет затрачено гораздо меньше времени, а результаты могут быть представлены быстрее, и будут более актуальными. Фактор времени важен для статисти­ческого исследования особенно в условиях изменяющейся социально-экономической ситуации.

Реализация выборочного метода базируется на понятиях генеральной и выборочной совокупностей.

Генеральной совокупностью называется вся исходная изучаемая статистическая совокупность, из которой на основе отбора единиц или групп единиц формируется совокупность выборочная. Поэтому генеральную совокупность также называют основой выборки.

Отбор единиц в выборочную совокупность может быть повторным или беспо­вторным.

При повторном отборе попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Таким образом, некоторые единицы могут попадать в выборку дважды, трижды или даже большее число раз. И при изучении выборочной совокупности они будут рассматриваться как отдельные независимые наблюдения.

Отметим, что число единиц генеральной совокупности, участвующих в отборе, при таком подходе остается постоянным. Поэтому вероятность попадания в выборку для всех единиц совокупности на протяжении всего процесса отбора также не меняется.

На практике методология повторного отбора обычно используется в тех случаях, когда объем генеральной совокупности не известен и теоретически возможно повторение единиц с уже встречавшимися значениями всех регистрируемых признаков.

Например, при проведении маркетинговых исследований мы не можем сколько-нибудь точно оценить, какое число потребителей предпочитают стиральный порошок конкретной торговой марки, сколько покупателей предпочитают делать покупки именно в данном супермаркете и т.д. Поэтому возможно повторение совершенно идентичных единиц как по причине практически неограниченных объемов совокупности, так и вследствие возможной повторной регистрации. Предположим, при проведении обследования один и тот же покупатель может дважды прийти в магазин и дважды подвергнуться обследованию.

При выборочном контроле качества продукции объем генеральной совокупности также часто не определен, так как процесс производства может осуществляться постоянно, каждый день дополняя генеральную совокупность новыми единицами-изделиями. Поэтому в выборочную совокупность могут попасть два и более изделий с абсолютно одинаковыми характеристиками. Следовательно, и в этом случае при обработке результатов выборки необходимо ориентироваться на методологию, используемую при повторном отборе.

При бесповоротном отборе попавшая в выборку единица подвергается обследова­нию и в дальнейшей процедуре отбора не участвует. Такой отбор целесообразен и практически возможен в тех случаях, когда объем генеральной совокупности четко определен. Получаемые при этом результаты, как правило, являются более точными по сравнению с результатами, основанными на повторной выборке.

Как уже отмечалось выше, выборочное наблюдение всегда связано с определенны­ми ошибками получаемых характеристик. Эти ошибки называются ошибками репрезента­тивности (представительности).

Ошибки репрезентативности обусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную. Получаемые расхождения или ошибки репрезентативности позволяют заключить, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует различать систематические и случайные ошибки репре­зентативности.

Систематические ошибки репрезентативности связаны с нарушением принципов формирования выборочной совокупности. Например, вследствие каких-либо причин, связанных с организацией отбора, в выборку попали единицы, характеризующиеся несколько большими или, наоборот, несколько меньшими по сравнению с другими единицами значениями наблюдаемых признаков. В этом случае и рассчитанные выборочные характеристики будут завышенными или заниженными.

Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характе­ристики будут несколько различаться. Получаемые случайные ошибки могут быть стати­стически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.

При дальнейшем рассмотрении теории и методов выборочного наблюдения используются следующие общепринятые условные обозначения:

N ‑ объем (число единиц) генеральной совокупности;

n ‑ объем (число единиц) выборочной совокупности;

‑ генеральная средняя, т.е. среднее значение изучаемого признака по генераль­ной совокупности (средняя прибыль, средняя величина активов, средняя численность ра­ботников предприятия и т.п.);

‑ выборочная средняя,
т.е. среднее значение изучаемого признака по выборочной совокупности;

М ‑ численность единиц генеральной совокупности, обладающих определенным вариантом или вариантами изучаемого признака (численность городского населения, численность сельского населения, количество бракованных изделий, число нерентабельных предприятий и т.п.);

р ‑ генеральная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, во всей генеральной совокупности (доля городского населения в общей численности населения, доля бракованной продукции в общем выпуске, доля нерентабельных предприятий в общей численности предприятий и т.п.); определяетcя как

m численность единиц выборочной совокупности, обладающих определенным вариантом или вариантами изучаемого признака;

w ‑ выборочная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, в выборочной совокупности,

‑ средняя ошибка выборки;

‑ предельная ошибка выборки;


‑ коэффициент доверия, определяемый в зависимости от уровня вероятности.

Ошибка выборки или отклонение выборочной средней от средней генеральной находится в прямой зависимости от дисперсии изучаемого признака в генеральной совокуп­ности, и в обратной зависимости ‑ от объема выборки.

Таким образом среднюю ошибку выборки можно представить как

Формула 10.1

При проведении выборочного наблюдения дисперсия изучаемого признака в генеральной совокупности, как правило, не известна. В то же время, между генеральной дисперсией и средней из всех возможных выборочных дисперсий существует следующее соотношение:

Формула 10.2

В связи с тем, что на практике в большинстве случаев из генеральной совокупности в определенный момент времени производится только одна выборка, дисперсия изучаемого признака по этой выборке и используется при расчете ошибки.

Учитывая, что при достаточно большом объеме выборки отношение близко к 1, формула средней ошибки повторной выборки принимает следующий вид:

Где ‑ дисперсия изучаемого признака по выборочной совокупности.

При определении возможных границ значений характеристик генеральной сово­купности рассчитывается предельная ошибка выборки, которая зависит от величины ее средней ошибки и уровня вероятности, с которым гарантируется, что генеральная средняя не выйдет за указанные границы.

Согласно теореме А.М. Ляпунова, вероятность той или иной величины предельной ошибки, при достаточно большом объеме выборочной сово­купности, подчиняется нормальному закону распределения и может быть определена на основе интеграла Лапласа.

Значения интеграла Лапласа при различных величинах t табулированы и представ­лены в статистических справочниках.

При обобщении результатов выборочного наблюдения наиболее часто используются следующие уровни вероятности и соответствующие им значения t:

Таблица 10.1 ‑ . Некоторые значения t

Вероятность, рi. 0,683 0,866 0,954 0,988 0,997 0,999
Значение t 1,0 1,5 2,0 2,5 3,0 3,5

Например, если при расчете предельной ошибки выборки мы используем значение t=2, то с вероятностью 0,954 можно утверждать, что расхождение между выборочной средней и генеральной средней не превысит двукратной величины средней ошибки вы­борки.

Теоретической основой для определения границ генеральной доли, т.е. доли еди­ниц, обладающих тем или иным вариантом признака, является теорема Вернули. Согласно данной теореме вероятность получения сколь угодно малого расхождения между выборочной долей и генеральной долей при достаточно большом объеме выборки будет стремиться к единице. С учетом того, что вероятность расхождения между выборочной и генеральной долями подчиняется нормальному закону распределения, эта вероятность также определяется по функции F(t) при заданном значении t.

Процесс подготовки и проведения выборочного наблюдения включает ряд после­довательных этапов:

  1. Определение цели обследования.
  2. Установление границ генеральной совокупности.
  3. Составление программы наблюдения и программы разработки данных
  4. Определение вида выборки, процента отбора и метода отбора
  5. Отбор и регистрация наблюдаемых признаков у отобранных единиц.
  6. Насчет выборочных характеристик и их ошибок.
  7. Распространение полученных результатов на генеральную совокупность.

В зависимости от состава и структуры генеральной совокупности выбирается вид выборки или способ отбора.

К наиболее распространенным на практике видам относятся:

  • собственно-случайная (простая случайная) выборка;
  • механическая (систематическая) выборка;
  • типическая (стратифицированная, расслоенная) выборка;
  • серийная (гнездовая) выборка.

Отбор единиц из генеральной совокупности может быть комбинированным, много­ступенчатым и многофазным.

Комбинированный отбор предполагает объединение нескольких видов выборки. Так, например, можно комбинировать типическую и серийную, серийную и собственно-случайную выборки. Ошибка такой выборки определяется ступенчатостью отбора.

Многоступенчатым называется отбор, при котором из генеральной совокупности сначала извлекаются укрупненные группы, потом ‑ более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофазная выборка, в отличие от многоступенчатой, предполагает сохранение одной и той же единицы отбора на всех этапах его проведения; при этом отобранные на каждой стадии единицы подвергаются обследованию, каждый раз – по более расширенной программе.

Собственно-случайная (простая случайная) выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности.

Однако прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной сово­купности таким образом, чтобы включение или не включение в нее отдельных единиц не вызывало сомнений. Так, например, при обследовании студентов необходимо указать, будут ли приниматься во внимание лица, находящиеся в академическом отпуске, студенты негосударственных вузов, военных училищ и т.п.; при обследовании торговых предприятий важно определиться, включит ли генеральная совокупность торговые павильоны, коммерческие палатки и прочие подобные объекты.

Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел.

Расчет ошибок позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности.

Различают среднюю и предельную ошибки выборки. Эти два вида связаны следующим соотношением:

Величина средней ошибки выборки рассчитывается дифференциро­ванно в зависимости от способа отбора и процедуры выборки.

Так, при собственно-случайном повторном отборе средняя ошибка определяется по формуле:

а при расчете средней ошибки собственно-случайной бесповторной выборки:

Формула 10.6

Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности.

Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:

Формула 10.7

где и ‑ генеральная и выборочная средняя соответственно;

‑ предельная ошибка выборочной средней.

Пример.

При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 г. при среднем квадратическом отклонении 4 г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделия в генеральной совокупности.

Решение. Рассчитаем сначала предельную ошибку выборки. Так как при р = 0,997, t = 3, она равна:

Определим пределы генеральной средней:


или


Вывод: Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 г. до 30,84 г.

Пример 2.

В городе проживает 250 тыс. семей. Для определения среднего числа детей в семье была организована 2%-ная случайная бесповторная выборка семей. По ее результатам было получено следующее распре­деление семей по числу детей:

Таблица 10.2 ‑ Распределение семей по числу детей в городе N

С вероятностью 0,954 определите пределы, в которых будет находить­ся среднее число детей в генеральной совокупности.

Решение. В начале на основе имеющегося распределения семей определим выборочные среднюю и дисперсию:

Необходимый объем выборки – объем (численность) выборочной совокупности, который с определенной вероятностью обеспечит заданную точность результатов наблюдения (при проектировании выборочного наблюдения с заранее заданным значением допустимой ошибки).

Формулы для вычисления необходимого объема выборки выводятся непосредственно из формул предельных ошибок выборки путем несложных преобразований, в результате которых получаются следующие выражения для необходимых вычислений.

При повторном отборе:


– для средней количественного признака ;


– для доли (альтернативного признака) .

При бесповторном отборе:


– для средней количественного признака ;


– для доли (альтернативного признака) .

Относительно приведенных формул можно отметить следующее:

а) объем генеральной выборки в формулах должен быть выражен только в единицах, а не в тысячах или в миллионах и т.п. единицах

б) данные формулы показывают, что с увеличением предполагаемой ошибки выборки необходимый объем выборки значительно уменьшается;

в) для достижения заданной точности необходимая численность бесповторной выборки (при всех прочих равных условиях) меньше необходимой численности выборки при повторном отборе;

г) для расчета объема выборки необходимо знать дисперсию, которая может быть заимствована из проводимых ранее обследований данной или аналогичной совокупности, а при отсутствии таковых необходимо провести специальное выборочное обследование небольшого объема;


д) если дисперсия изучаемого альтернативного признака (доли) неизвестна, то можно использовать ее максимально возможное значение: =0.5(1 – 0.5) = 0.25.

е) вычисленное по формулам значение n всегда округляют в большую сторону (например, если в результате вычисления получен результат n = 86.3 ед., то для достижения желаемого результата должны быть охвачены 87 ед.).

4. Механическая (систематическая) выборка.

Механическая (систематическая) выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные интервалы (группы), производится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица (чтобы избежать систематической ошибки, отбираться должна единица, которая находится в середине каждой группы).

Таким образом, механическая выборка может быть применена в тех случаях, когда генеральная совокупность каким-либо способом упорядочена, т.е. имеется определенная последовательность в расположении единиц, например, по алфавиту, местоположению, в порядке возрастания или убывания какого-либо показателя, не связанного с изучаемым свойством, и т.д. (табельные номера работников, списки избирателей, телефонные номера респондентов, номера домов и квартир).

После упорядочения генеральной совокупности заданное число отбирают механически, через определенные равные интервалы (интервал отбора определяется как частное от деления 100% на установленный процент отбора; процент отбора есть процентное выражение пропорции отбора; пропорция отбора определяется соотнесением объемов выборочной и генеральной совокупностей; например, если из совокупности в 500000 ед. предполагается отобрать 10000 ед., то пропорция отбора составит 10000/500000 = 1/50 (проверяться будет каждая 50-я единица), т.е. процент отбора будет равняться 2%, т.о., получим 2%-ю выборку).

Опасность систематической ошибки при механической выборке может появиться вследствие случайного совпадения выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности.

Замечание. При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. Поэтому, для определения средней ошибки механической выборки, также необходимой ее численности используются формулы собственно-случайной бесповторной выборки.

Объем выборки (n), необходимый и достаточный для получения величины ошибки, допустимой для конкретного исследования, рассчитывается на стадии проектирования выборочного наблюдения. Поскольку конечная цель выборочного наблюдения состоит в оценке параметров генеральной совокупности, необходимо стремиться к формированию такой выборки, которая бы обеспечила минимальную ошибку. Как известно, величина ошибки выборки обратно пропорциональна ее объему. Однако увеличение объема выборки снижает эффективность затрат на проведение выборочного наблюдения, поэтому нужно искать компромисс между допустимой величиной ошибки и объемом выборки.

Расчет объема выборки осуществляется, исходя из формулы предельной ошибки выборки. Так:


(5.1)

где - предельная ошибка выборки; t – коэффициент доверия; - величина дисперсии; n- объем выборки.

При расчете объема выборкивеличина ошибки задается исследователем, исходя изобъекта и целей исследования, обусловливающих необходимую точность получаемых оценок. Значение коэффициента доверия зависит от устанавливаемого исследователем уровня вероятности и находится в таблице нормального распределения, если планируется выборка большого объема, или в таблице t-распределения Стьюдента, если предполагается выборка малого объема.


Правило трех сигм справедливо для нормального (симметричного) распределения. Если заведомо известно, что распределение единиц в изучаемой совокупности асимметрично (так, например, распределение населения по величине доходов всегда имеет правостороннюю асимметрию), значение дисперсии рассчитывают, исходя из того, что .

В рассматриваемой формуле расчета объема выборки ошибка выборки берется как абсолютная величина, но на практике она часто задается как относительная. Например, ошибка не должна превышать 2% или 5%. Тогда:




(5.2)


где , напомним, что V- это коэффициент вариации.

Приведенные формулы расчета объема выборки ориентированы на повторный отбор. Учитывая формулу расчета ошибки выборки для бесповторного отбора( см. Лекцию 4), расчет объема выборки при таком условии будет осуществляться несколько иначе.


Расчет объема выборки при бесповторном отборедля собственно случайной выборки:

расчет объема выборки при бесповторном отборе для стратифицированной выборки:


Если объем выборки определяется, исходя из необходимости оценки доли единиц изучаемой совокупности, обладающих тем или иным значением признака, то используются следующие формулы:


данная формула предназначена для расчета объема выборки при повторном отборе. Формула (56) учитывает бесповторный отбор:


(5.6)

При расчете объема выборки для оценки показателя доли берется максимальное значение дисперсии – 0,25, исходя из того, что доли единиц обладающих и не обладающих тем или иным признаком равны: 0,5*0,5 = 0,25.

Приведем пример расчета объема выборки.

Допустим, фирма - оператор сотовой связи разрабатывает тарифный план.В рамках этой задачиее интересует средняя продолжительность одного звонка внутри сети и доля звонков длительностью более 2-х минут. Для получения этих характеристик можно провести выборочное наблюдение. Какое число соединений необходимо охватить, чтобы предельная ошибка выборки не превышала 5% средней продолжительности звонка и 5% при определении доли звонков?По результатам прошлого аналогичного исследования коэффициент вариации продолжительности разговора составлял 60%. Рассчитаем необходимый объем выборки с вероятностью - 0,95.



Чтобы в ходе одного выборочного исследования оценить значения двух интересующих аналитика показателей, очевидно, следует сформировать выборку объемом 576 соединений.

Читайте также: