Группировка статистических данных это кратко и понятно

Обновлено: 02.07.2024

Статистическая сводка– это научно организованная обработка материалов наблюдения, которая включает в себя систематизацию, группировку материалов, составление таблиц, подсчет групповых и общих итогов, расчет показателей (средних и относительных).

Задача сводки состоит в том, чтобы обобщить результаты наблюдения, выделить типы явлений, установив их взаимосвязи, определить характерные черты, т.е. получить данные, отражающие в целом всю совокупность. В результате сводки осуществляется переход от данных, характеризующих отдельные единицы совокупности, к данным, характеризующим совокупность.

Сводка осуществляется по программе, которая включает определение:

1) группировочного признака;

2) порядка формирования групп

3) системы показателей для характеристики групп и совокупности в целом;

4) макетов таблиц для представления результатов сводки.

1) Простая – это подсчет общих итогов по совокупности в целом. Например, подсчет общей численности студентов высших учебных заведений РФ путем сложения численности студентов всех высших учебных заведений РФ.

2) Сложная – включает группировку, подсчет итогов по каждой группе и по всей совокупности в целом и представление результатов в виде таблицы.

Виды сводки по техники (способу выполнения): ручная; механическая (с помощью ЭВМ).

По форме обработки материала сводка бывает:

1) Централизованной - весь первичный материал поступает в одну организацию, где проводится вся обработка материалов статистического наблюдения. Такая сводка используется при обработке данных единовременных статических обследований, в частности переписей населения.

2) Децентрализованной – обработка материалов производится последовательно – начинается в местных статистических организациях и заканчивается в Госкомстате РФ. Такая сводка используется при обработке статистической отчетности.

  1. Статистическая группировка: понятие, задачи и виды

Статистическая группировка – это деление изучаемой совокупности на группы по каким-либо признакам.

Метод группировок решает следующие задачи:

1. Выделение социально-экономических типов явлений;

2. Изучение структуры совокупности и структурных сдвигов;

3. Выявление наличия, направления и формы связи между факторным и результативным признаками.

Виды группировок в зависимости от решаемых ими задач:

1. Типологические – это разделение единиц совокупности, как правило по качественному признаку на социально-экономические типы.

2. Структурные – это разделение единиц совокупности на группы, характеризующие ее структуру.

3. Аналитические – это разделение единиц совокупности на группы по факторному признаку с целью определения наличия, направления и формы связи между факторным и результативным признаками.

Виды группировок по числу группировочных признаков:

1. Простые – деление единиц совокупности на группы проводится по одному признаку.

2. Комбинированные (сложные) – деление единиц совокупности на группы проводится по 2 и более признакам (как правило, 2-4 признака).

3. Многомерные- деление единиц совокупности на группы проводится по множеству признаков методами кластерного анализа на ЭВМ.

Особым видом группировок является классификация. Классификация– это общепринятая, нормативная группировка. Классификации узаконены, отражаются в нормативных документах, устанавливаются в определенном виде органами государственной и международной статистики и становятся общепринятыми стандартами. Примером классификаций, используемых в экономике, являются классификации отраслей, земельных угодий, основных фондов, населения по статусу занятости и т.д.

  1. Образование групп и интервалов группировки

При группировке по качественному признаку число групп равно числу градаций, видов, состояний (наименований) явления, если их число не очень велико.

При группировке по количественному признаку, который изменяется прерывно (дискретно), т.е. может принимать только некоторые – чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.

При группировке по количественному признаку, который изменяется непрерывно (принимает любые значения, например, стаж работы, возраст) количество групп зависит от целей, задач исследования, особенностей объекта, колеблемости признака (чем больше колеблемость признака, тем больше групп и наоборот), численности совокупности (чем больше совокупность, тем больше групп и наоборот).

При достаточно большой численности совокупности (200 наблюдений) и нормальном распределении единиц совокупности число групп с равными интервалами можно определить по формуле Стерджесса:

где - число единиц совокупности.

Рекомендуется брать 2-3 группы при числе наблюдений до 40, 4-5 групп, если число наблюдений будет 40-60.

а) открытые – имеется только либо верхняя, либо нижняя граница;

б) закрытые – имеются нижняя и верхняя границы.

Виды интервалов в зависимости от их величины:

а) неравные – разность между максимальным и минимальным значениями в каждом из интервалов неодинакова (подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные).

б) равные – разность между максимальным и минимальным значениями в каждом из интервалов одинакова. Данные интервалы используются в том, случае, если вариация признака не значительна, а распределение является более или менее равномерным.

Величина равного интервала определяется по формуле:

где - соответственно максимальное и минимальное значение признака в совокупности;

Величина равного интервала определяется по формуле Стерджесса (знаменатель округляем до целого числа):

Величину интервала округляют до целого (всегда больше) числа, исключение составляют, случае когда изучается малейшие колебания признака.

Способы построения группировки:

1) Способ равного интервала. Суть способа – к минимальному значению признака прибавляют найденную величину интервала , получаем верхнюю границу первой группы. Затем к верхней границы первой группы прибавляют найденную величину интервала, и получаем верхнюю границу второй группы и т.д. Для устранения неопределенности в группировках, открывают один из крайних интервалов или используют принцип единообразия – левое число включает в себя обозначение значение, а правое не включает.

2) Способ равных частот. Суть способа – изучаемая совокупность выстраивается в ранжированный ряд по значению группировочного признака. Далее совокупность расчленяется на заданное количество групп с равным количеством наблюдений в каждой группе.

Ряды распределения

Ряд распределения- это простейший вид структурной группировки, в которой отражены значения признака по группам и численность каждой группы.

Виды рядов распределения в зависимости от признака положенного в основу группировки:

1) Атрибутивные – в основу группировки положен атрибутивный признак (в порядке возрастания или убывания). Например, распределение населения по полу, занятости, национальности, профессиям.

2) Вариационные - в основу группировки положен количественный признак. Например, распределение населения по возрасту и т.д.

Виды вариационных рядов в зависимости от характера вариации:

а) Дискретные (прерывные) – признак принимает только целые значения (например, тарифный разряд рабочих, число детей в семье, число комнат в квартире).

б) Интервальные (непрерывные) - признак принимает любые значения, в том числе и дробные (например, заработная плата, объем производства).

Ряды распределения состоят из двух элементов:

1) Варианта (х) – это отдельное значение признака. Они могут быть положительными, отрицательными, абсолютными и относительными.

2) Частота (f) – это число, показывающее сколько раз встречается отдельное значение признака в ряду распределения. Сумма всех частот называется объемом совокупности. Частоты, выраженные в форме коэффициента или процента, называются частостями. Сумма частостей равна 1 или100%.

Этапы построения вариационных рядов.

1) Ранжирование первичного ряда, т.е. расположение всех вариантов возрастающем или убывающем порядке. Например, стаж работы рабочих характеризуется данными: 10; 5; 2; 1; 5; 6; 5. Ранжированный ряд: 1; 2; 5; 5; 5; 6; 10.

2) Для построение дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты (х), а затем подсчитывается частота повторения каждой варианты (f). Ряд распределения оформляется в виде таблице, состоящей из 2-х колонок или строк, в одной из которых приводятся варианты, а в другой частоты.

3) Для построения интервального ряда необходимо установить оптимальное число групп. При группировки однокачественной совокупности применяются равные интервалы, которые определяются по формуле:

где - соответственно максимальное и минимальное значение признака в совокупности;

Наглядно ряды распределения можно представить при помощи их графического изображения. Для этой цели строят полигон, гистограмму, кумулятивную кривую, огиву.

Статистическая сводка и группировка. В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.

Обобщение и систематизация первичных статистических данных – это самостоятельный этап статистического исследования, основная задача которого получить полную и всестороннюю характеристику как совокупности в целом, так и отдельных ее частей и представить полученную информацию об изучаемой совокупно­сти в наиболее удобной для пользователей форме. В статистической практике данный этап статистического исследования называют этапом сводки и группировки статистических данных.

Статистическая сводка

Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

По глубине и точности обработки материала различают простую сводку и сложную сводку.

Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.

Сложная сводка это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.

Этапы проведение сводки

  1. Выбор группировочного признака.
  2. Определение порядка формирования групп.
  3. Разработка системы статистических показателей для характеристики групп и объекта в целом
  4. Разработка макетов статистических таблиц для представления результатов сводки.

Статистическая группировка

Группировка – разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, раз­личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи­ровать связи между отдельными признаками.

Задачи, решаемые с помощью метода группировок:

  • выделение социально-экономических типов явлений;
  • изучение структуры явления и структурных сдвигов, происходящих в нем;
  • выявление взаимосвязи и взаимозависимости между явлениями.

Виды группировок. В соответствии с познавательными задачами, решаемыми в ходе построения стати­стических группировок, различают следующие их виды: типологические, структурные, аналитические.

Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурная группировка – предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими.

. В статистике при изучении связей социально-экономических явлений признаки подразделяют на факторные и результативные.

Факторные признаки, под их воздействием изменяются результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного и наоборот. .

Особенности построения аналитической группировки:

  • единицы статистической совокупности группируются по факторному признаку;
  • каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простая группировка – группы образованы только по одному признаку.

Комбинационная группировка – разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь­ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.

Этапы построения статистических группировок

  1. Определение группировочного признака.
  2. Определение размаха вариации.
  3. Определение числа групп.
  4. Расчет ширины интервала группировки.
  5. Определение признаков, которые в комбинации друг с другом будут характери­зовать каждую выделенную группу.

При небольшом объеме совокупности (n

Формула 5.2.

Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса (формула 5.2): (5.2)

где n – число групп; N – число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово­купность состоит из большого числа единиц наблюдения (n>50).

Когда определено число групп, то следует определить интервалы группировки.

Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают: равные и неравные; открытые и закрытые.

Ширина равного интервала определяется по (формуле 5.3):

Формула 5.3

(5.3)

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (5.3) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (5.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлит до целого числа (15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.

Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо­димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес­сивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:hi+1=hi+а,

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500–1000, 1000–2000, 2000–3500, т.е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.

Интервалы статистической группировки

Интервалы группировок могут быть закрытыми и открытыми.

Закрытые интервалы – это интервалы, у которых есть и верхняя и нижняя границы.

Открытые интервалы – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.

Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50–100, 100–150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно­сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200–1400, 1400–1600, 1600–1800, 1800–2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. ‑ соответственно второго и третьего и т.д., т.е. верхняя граница i-го интервала равна нижней границе (i+1)-го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.

Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.

Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100–150, 151–200, 201–300.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.

Специализированные интервалы – применяются дли выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

Пример. Далее на примере данных приведенных в табл. 5.1. произведем аналитическую группировку совокупности, включающей 30 банков.

Таблица 5.1 ‑ Совокупность 30 банков Российской Федерации

(на 01.01.19 г., цифры условные)

По данным табл.5.1 группировочным (факторным) признаком является капитал, результативным – прибыль. Группировку производим по факторному признаку. Зададим количество групп (условно) – 4, а величину интервала определим по формуле (5.3).

Обозначим границы групп:

1-я группа – 156,0-197,8;

3-я группа – 239,6-281,4;

4-я группа – 281,4-323,2.

После того, как определен группировочный признак – капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе.

Далее показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.

Статистическая сводка – систематизация единичных фактов, позволяющая перейти к обобщающим показателям, относящимся ко всей изучаемой совокупности и ее частям, и осуществлять анализ и прогнозирование изучаемых явлений и процессов.

Статистическая сводка осуществляется по программе, которая должна разрабатываться еще до сбора статистических данных, практически одновременно с составлением плана и программы статистического наблюдения.

Основой статистической сводки является выделение однородных в социально-экономическом отношении групп статистических показателей, т.е. группировка исходных данных.

Группировка – процесс образования однородных групп на основе расчленения статистической совокупности на части по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы по каким-либо признакам.

Устойчивое разграничение объектов выражается классификацией. Классификация – это как бы стандарт, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Классификация основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов и т. д.). Таким образом, классификация – это узаконенная, общепринятая, нормативная группировка.

Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков. При этом последние могут носить как атрибутивный, так и количественный характер. Следует иметь в виду, что в ряде случаев классификация, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервалы бывают:

равные, когда разность между максимальными и минимальными значениями в каждом из них одинакова;

неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

открытые, когда имеется только либо верхняя, либо нижняя граница;

закрытые, когда имеются и верхняя и нижняя границы.

Различают три основных вида группировок:

1. Типологические - предназначены для выявления основных социально-экономических типов. Таки группировки также называют перечневыми.

Сводка и группировка статистических данных

Статистическая наука предполагает ряд последовательных действий, с целью изучения своего предметна. Ночная все с наблюдения продолжается процесс исследования обработкой собранных данных, а уже после этого данные анализируются при помощи различных обобщающих показателях. Понятие статистического наблюдение было рассмотрено ранее. Теперь же поговорим о сводке и группировке статистических данных.

Сводка – это научно организованная обработка результатов наблюдения, включающая в себя контроль, систематизацию, группировку, составление таблиц и подведение итогов. По сути, сводка это общий процесс обработки данных. Данные СВОДЯТСЯ, отсюда и название сводка!

Составным процессом сводки является группировка данных.
Группировка это разбиение совокупности на группы, однородные по какому-либо признаку, например мужчины и женщины – группируем по полу а групп получается две.

Процесс группировок основывается на двух основополагающих элементах:
— группировочный признак – это признак, по которому происходит объединение отдельных единиц в группы.
— интервал (для количественных признаков) – очерчивает количественные границы групп.

Интервалы бывают
— равные – расстояние между верхней и нижней границей во всех интервалах одинаковое – например интервалы 3-6, 6-9, 9-12 будут равными, потому что во всех расстояние 3.
— неравные – в таких интервалах расстояние между границами может быть различным – 1-10, 10- 100, 100-500.
— закрытые – такие интервалы имеют две границы нижнюю и верхнюю – например интервал 5-10 закрытый, нижняя граница у него 5 а 10 это уже верхняя граница.
— открытые – интервалы не имеют либо нижней, либо верхней границы, в статистике открытые интервалы выглядят так – до 100 в этом интервале нет нижнего предела но есть верхний 100, или 50 и более в этом интервале нижний предел есть 50, а вот верхнего нет, поэтому он является открытым.

Виды группировок.

В статистике при обработке данных могут использоваться разные виды и способы группировки данных, в зависимости от конечных целей исследования.

Структурная группировка – используется для изучения структуры или долей явления, путем объединения элементов в близкие по смыслу группы

Аналитическая группировка – используется для выявления влияния одних факторов на другие, позволяет выявлять связи между явлениями

Типологическая группировка – группируется явление по социальным явлениям или социальным отношениям, принятым в обществе, классы, группы и так далее.

Ряды распределения

В результате сводки образуются ряды величин, характеризующие явление по одному признаку, такие ряды называют рядами распределения.

Ряды распределения бывают двух видов

атрибутивные – это ряды, образованные по качественному признаку – в основу группировки положен качественный признак, например пол, профессия территория.

Численность, человек (f)

вариационные – ряды, образованные по количественному признаку, в основу группировки таких рядов положен количественный признак, причем изучаться он может как в отдельных данных, так и в интервалах.

Вариационные ряды бывают

дискретные – в таких рядах признак носит прерывный характер, указывается одним числом

Число студентов, человек (f)

интервальные – в таких рядах признак расположен в интервале от и до, не прерывается.

Средняя зарплата за месяц, рублей (х)

Число работников, человек (f)

Как видно из примеров каждый ряд распределения имеет два элемента или две колонки. Элементы ряда, в не зависимости интервальный ряд или дискретный, всегда имеют одно и тоже название:

варианта – это определенные значения варьирующегося признака, в атрибутивных рядах качественный признак, в вариационных количественный. Обозначается варианта буквой х. Варианта всегда первая колонка (подлежащее таблицы).

частота – показывает как часто (или сколько раз) встречается данная варианта — обозначается буквой (f). Частота как правило вторая колонка, она характеризует число появлений изучаемых вариант.

Читайте также: