Образование групп и интервалов группировки в статистике кратко

Обновлено: 03.07.2024

Статистическая сводка– это научно организованная обработка материалов наблюдения, которая включает в себя систематизацию, группировку материалов, составление таблиц, подсчет групповых и общих итогов, расчет показателей (средних и относительных).

Задача сводки состоит в том, чтобы обобщить результаты наблюдения, выделить типы явлений, установив их взаимосвязи, определить характерные черты, т.е. получить данные, отражающие в целом всю совокупность. В результате сводки осуществляется переход от данных, характеризующих отдельные единицы совокупности, к данным, характеризующим совокупность.

Сводка осуществляется по программе, которая включает определение:

1) группировочного признака;

2) порядка формирования групп

3) системы показателей для характеристики групп и совокупности в целом;

4) макетов таблиц для представления результатов сводки.

1) Простая – это подсчет общих итогов по совокупности в целом. Например, подсчет общей численности студентов высших учебных заведений РФ путем сложения численности студентов всех высших учебных заведений РФ.

2) Сложная – включает группировку, подсчет итогов по каждой группе и по всей совокупности в целом и представление результатов в виде таблицы.

Виды сводки по техники (способу выполнения): ручная; механическая (с помощью ЭВМ).

По форме обработки материала сводка бывает:

1) Централизованной - весь первичный материал поступает в одну организацию, где проводится вся обработка материалов статистического наблюдения. Такая сводка используется при обработке данных единовременных статических обследований, в частности переписей населения.

2) Децентрализованной – обработка материалов производится последовательно – начинается в местных статистических организациях и заканчивается в Госкомстате РФ. Такая сводка используется при обработке статистической отчетности.

  1. Статистическая группировка: понятие, задачи и виды

Статистическая группировка – это деление изучаемой совокупности на группы по каким-либо признакам.

Метод группировок решает следующие задачи:

1. Выделение социально-экономических типов явлений;

2. Изучение структуры совокупности и структурных сдвигов;

3. Выявление наличия, направления и формы связи между факторным и результативным признаками.

Виды группировок в зависимости от решаемых ими задач:

1. Типологические – это разделение единиц совокупности, как правило по качественному признаку на социально-экономические типы.

2. Структурные – это разделение единиц совокупности на группы, характеризующие ее структуру.

3. Аналитические – это разделение единиц совокупности на группы по факторному признаку с целью определения наличия, направления и формы связи между факторным и результативным признаками.

Виды группировок по числу группировочных признаков:

1. Простые – деление единиц совокупности на группы проводится по одному признаку.

2. Комбинированные (сложные) – деление единиц совокупности на группы проводится по 2 и более признакам (как правило, 2-4 признака).

3. Многомерные- деление единиц совокупности на группы проводится по множеству признаков методами кластерного анализа на ЭВМ.

Особым видом группировок является классификация. Классификация– это общепринятая, нормативная группировка. Классификации узаконены, отражаются в нормативных документах, устанавливаются в определенном виде органами государственной и международной статистики и становятся общепринятыми стандартами. Примером классификаций, используемых в экономике, являются классификации отраслей, земельных угодий, основных фондов, населения по статусу занятости и т.д.

  1. Образование групп и интервалов группировки

При группировке по качественному признаку число групп равно числу градаций, видов, состояний (наименований) явления, если их число не очень велико.

При группировке по количественному признаку, который изменяется прерывно (дискретно), т.е. может принимать только некоторые – чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.

При группировке по количественному признаку, который изменяется непрерывно (принимает любые значения, например, стаж работы, возраст) количество групп зависит от целей, задач исследования, особенностей объекта, колеблемости признака (чем больше колеблемость признака, тем больше групп и наоборот), численности совокупности (чем больше совокупность, тем больше групп и наоборот).

При достаточно большой численности совокупности (200 наблюдений) и нормальном распределении единиц совокупности число групп с равными интервалами можно определить по формуле Стерджесса:

где - число единиц совокупности.

Рекомендуется брать 2-3 группы при числе наблюдений до 40, 4-5 групп, если число наблюдений будет 40-60.

а) открытые – имеется только либо верхняя, либо нижняя граница;

б) закрытые – имеются нижняя и верхняя границы.

Виды интервалов в зависимости от их величины:

а) неравные – разность между максимальным и минимальным значениями в каждом из интервалов неодинакова (подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные).

б) равные – разность между максимальным и минимальным значениями в каждом из интервалов одинакова. Данные интервалы используются в том, случае, если вариация признака не значительна, а распределение является более или менее равномерным.

Величина равного интервала определяется по формуле:

где - соответственно максимальное и минимальное значение признака в совокупности;

Величина равного интервала определяется по формуле Стерджесса (знаменатель округляем до целого числа):

Величину интервала округляют до целого (всегда больше) числа, исключение составляют, случае когда изучается малейшие колебания признака.

Способы построения группировки:

1) Способ равного интервала. Суть способа – к минимальному значению признака прибавляют найденную величину интервала , получаем верхнюю границу первой группы. Затем к верхней границы первой группы прибавляют найденную величину интервала, и получаем верхнюю границу второй группы и т.д. Для устранения неопределенности в группировках, открывают один из крайних интервалов или используют принцип единообразия – левое число включает в себя обозначение значение, а правое не включает.

2) Способ равных частот. Суть способа – изучаемая совокупность выстраивается в ранжированный ряд по значению группировочного признака. Далее совокупность расчленяется на заданное количество групп с равным количеством наблюдений в каждой группе.

Ряды распределения

Ряд распределения- это простейший вид структурной группировки, в которой отражены значения признака по группам и численность каждой группы.

Виды рядов распределения в зависимости от признака положенного в основу группировки:

1) Атрибутивные – в основу группировки положен атрибутивный признак (в порядке возрастания или убывания). Например, распределение населения по полу, занятости, национальности, профессиям.

2) Вариационные - в основу группировки положен количественный признак. Например, распределение населения по возрасту и т.д.

Виды вариационных рядов в зависимости от характера вариации:

а) Дискретные (прерывные) – признак принимает только целые значения (например, тарифный разряд рабочих, число детей в семье, число комнат в квартире).

б) Интервальные (непрерывные) - признак принимает любые значения, в том числе и дробные (например, заработная плата, объем производства).

Ряды распределения состоят из двух элементов:

1) Варианта (х) – это отдельное значение признака. Они могут быть положительными, отрицательными, абсолютными и относительными.

2) Частота (f) – это число, показывающее сколько раз встречается отдельное значение признака в ряду распределения. Сумма всех частот называется объемом совокупности. Частоты, выраженные в форме коэффициента или процента, называются частостями. Сумма частостей равна 1 или100%.

Этапы построения вариационных рядов.

1) Ранжирование первичного ряда, т.е. расположение всех вариантов возрастающем или убывающем порядке. Например, стаж работы рабочих характеризуется данными: 10; 5; 2; 1; 5; 6; 5. Ранжированный ряд: 1; 2; 5; 5; 5; 6; 10.

2) Для построение дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты (х), а затем подсчитывается частота повторения каждой варианты (f). Ряд распределения оформляется в виде таблице, состоящей из 2-х колонок или строк, в одной из которых приводятся варианты, а в другой частоты.

3) Для построения интервального ряда необходимо установить оптимальное число групп. При группировки однокачественной совокупности применяются равные интервалы, которые определяются по формуле:

где - соответственно максимальное и минимальное значение признака в совокупности;

Наглядно ряды распределения можно представить при помощи их графического изображения. Для этой цели строят полигон, гистограмму, кумулятивную кривую, огиву.

Статистическая сводка и группировка. В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.

Обобщение и систематизация первичных статистических данных – это самостоятельный этап статистического исследования, основная задача которого получить полную и всестороннюю характеристику как совокупности в целом, так и отдельных ее частей и представить полученную информацию об изучаемой совокупно­сти в наиболее удобной для пользователей форме. В статистической практике данный этап статистического исследования называют этапом сводки и группировки статистических данных.

Статистическая сводка

Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине и точности обработки материала различают простую сводку и сложную сводку.

Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.

Сложная сводка это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.

Этапы проведение сводки

  1. Выбор группировочного признака.
  2. Определение порядка формирования групп.
  3. Разработка системы статистических показателей для характеристики групп и объекта в целом
  4. Разработка макетов статистических таблиц для представления результатов сводки.

Статистическая группировка

Группировка – разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, раз­личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи­ровать связи между отдельными признаками.

Задачи, решаемые с помощью метода группировок:

  • выделение социально-экономических типов явлений;
  • изучение структуры явления и структурных сдвигов, происходящих в нем;
  • выявление взаимосвязи и взаимозависимости между явлениями.

Виды группировок. В соответствии с познавательными задачами, решаемыми в ходе построения стати­стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурная группировка – предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими.

. В статистике при изучении связей социально-экономических явлений признаки подразделяют на факторные и результативные.

Факторные признаки, под их воздействием изменяются результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного и наоборот. .

Особенности построения аналитической группировки:

  • единицы статистической совокупности группируются по факторному признаку;
  • каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простая группировка – группы образованы только по одному признаку.

Комбинационная группировка – разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь­ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.

Этапы построения статистических группировок

  1. Определение группировочного признака.
  2. Определение размаха вариации.
  3. Определение числа групп.
  4. Расчет ширины интервала группировки.
  5. Определение признаков, которые в комбинации друг с другом будут характери­зовать каждую выделенную группу.

При небольшом объеме совокупности (n

Формула 5.2.

Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса (формула 5.2): (5.2)

где n – число групп; N – число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово­купность состоит из большого числа единиц наблюдения (n>50).

Когда определено число групп, то следует определить интервалы группировки.

Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают: равные и неравные; открытые и закрытые.

Ширина равного интервала определяется по (формуле 5.3):

Формула 5.3

(5.3)

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (5.3) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (5.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлит до целого числа (15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.

Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо­димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес­сивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:hi+1=hi+а,

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500–1000, 1000–2000, 2000–3500, т.е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.

Интервалы статистической группировки

Интервалы группировок могут быть закрытыми и открытыми.

Закрытые интервалы – это интервалы, у которых есть и верхняя и нижняя границы.

Открытые интервалы – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.

Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50–100, 100–150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно­сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200–1400, 1400–1600, 1600–1800, 1800–2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. ‑ соответственно второго и третьего и т.д., т.е. верхняя граница i-го интервала равна нижней границе (i+1)-го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.

Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.

Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100–150, 151–200, 201–300.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интервалы – применяются дли выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

Пример. Далее на примере данных приведенных в табл. 5.1. произведем аналитическую группировку совокупности, включающей 30 банков.

Таблица 5.1 ‑ Совокупность 30 банков Российской Федерации

(на 01.01.19 г., цифры условные)

По данным табл.5.1 группировочным (факторным) признаком является капитал, результативным – прибыль. Группировку производим по факторному признаку. Зададим количество групп (условно) – 4, а величину интервала определим по формуле (5.3).

Обозначим границы групп:

1-я группа – 156,0-197,8;

3-я группа – 239,6-281,4;

4-я группа – 281,4-323,2.

После того, как определен группировочный признак – капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе.

Далее показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.


Оглавление

  • 1. Понятие статистики как науки
  • 2. Категории статистики
  • 3. Метод статистики
  • 4. Организация государственной статистики в России
  • 5. История развития статистики
  • 6. Статистическое измерение
  • 7. Понятие статистической сводки и ее виды
  • 8. Статистические группировки
  • 9. Виды и формы выражения статистических показателей

Приведённый ознакомительный фрагмент книги Статистика. Шпаргалка предоставлен нашим книжным партнёром — компанией ЛитРес.

8. Статистические группировки

Статистическая группировка — метод исследования массовых общественных явлений путем выделения и ограничения однородных групп, через которые раскрываются существенные черты и особенности состояния и развития всей совокупности.

Группировка является важнейшим этапом статистического исследования, соединяющим сбор первичной информации об объекте исследования и анализ этой информации на основе обобщающих статистических показателей.

Основные задачи, которые решаются с помощью группировок:

1) выделение социально-экономических типов;

2) изучение структуры социально-экономических явлений;

3) выявление связи между явлениями.

При проектировании группировок возникают следующие важнейшие проблемы:

1) определение группировочного признака (основания группировки). Группировочный признак — признак, по которому происходит включение единиц в группы. Его выбор зависит от цели группировки и сущности данного явления;

2) выделение числа групп. Число групп определяется с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц;

3) определение интервалов групп. Интервалы могут быть равными и неравными. Последние, в свою очередь, делятся на равномерно возрастающие и равномерно убывающие.

В зависимости от круга решаемых задач выделяют следующие виды группировок:

1) типологические группировки. Их задача — классификация социально-экономических явлений путем выделения однородных в качественном отношении групп;

2) структурные группировки. Их задача — изучение состава отдельных типических групп при помощи объединения единиц совокупности, близких друг к другу по величине группировочного признака;

3) аналитические группировки. Их задача — выявление связи между социально-экономическими явлениями путем оценки влияния одних признаков на другие. В основе аналитической группировки лежит признак-фактор, влияние которого на результативные признаки изучается.

Группировка, в которой группы образованы по одному признаку, называется простой. Если для характеристики явления недостаточно разбить совокупность на группы по какому-либо однородному признаку, строят сложные группировки.

Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Такие группировки дают возможность изучить структуру совокупности по нескольким признакам одновременно.

Социально-экономический анализ предполагает использование системы простых и комбинационных группировок.

Также часто прибегают к вторичной группировке-перегруппировке уже сгруппированных данных. Вторичная группировка может быть проведена методом простого укрупнения интервала.


Оглавление

  • 1. Понятие статистики как науки
  • 2. Категории статистики
  • 3. Метод статистики
  • 4. Организация государственной статистики в России
  • 5. История развития статистики
  • 6. Статистическое измерение
  • 7. Понятие статистической сводки и ее виды
  • 8. Статистические группировки
  • 9. Виды и формы выражения статистических показателей

Приведённый ознакомительный фрагмент книги Статистика. Шпаргалка предоставлен нашим книжным партнёром — компанией ЛитРес.

8. Статистические группировки

Статистическая группировка — метод исследования массовых общественных явлений путем выделения и ограничения однородных групп, через которые раскрываются существенные черты и особенности состояния и развития всей совокупности.

Группировка является важнейшим этапом статистического исследования, соединяющим сбор первичной информации об объекте исследования и анализ этой информации на основе обобщающих статистических показателей.

Основные задачи, которые решаются с помощью группировок:

1) выделение социально-экономических типов;

2) изучение структуры социально-экономических явлений;

3) выявление связи между явлениями.

При проектировании группировок возникают следующие важнейшие проблемы:

1) определение группировочного признака (основания группировки). Группировочный признак — признак, по которому происходит включение единиц в группы. Его выбор зависит от цели группировки и сущности данного явления;

2) выделение числа групп. Число групп определяется с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц;

3) определение интервалов групп. Интервалы могут быть равными и неравными. Последние, в свою очередь, делятся на равномерно возрастающие и равномерно убывающие.

В зависимости от круга решаемых задач выделяют следующие виды группировок:

1) типологические группировки. Их задача — классификация социально-экономических явлений путем выделения однородных в качественном отношении групп;

2) структурные группировки. Их задача — изучение состава отдельных типических групп при помощи объединения единиц совокупности, близких друг к другу по величине группировочного признака;

3) аналитические группировки. Их задача — выявление связи между социально-экономическими явлениями путем оценки влияния одних признаков на другие. В основе аналитической группировки лежит признак-фактор, влияние которого на результативные признаки изучается.

Группировка, в которой группы образованы по одному признаку, называется простой. Если для характеристики явления недостаточно разбить совокупность на группы по какому-либо однородному признаку, строят сложные группировки.

Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Такие группировки дают возможность изучить структуру совокупности по нескольким признакам одновременно.

Социально-экономический анализ предполагает использование системы простых и комбинационных группировок.

Также часто прибегают к вторичной группировке-перегруппировке уже сгруппированных данных. Вторичная группировка может быть проведена методом простого укрупнения интервала.

Читайте также: