Число как количественная характеристика совокупностей кратко

Обновлено: 02.07.2024

Под совокупностью понимается множество (собрание, набор, сумма) некоторых объектов. Объекты, которые образуют совокупность (множество) называется элементами этого множества или совокупности.

Примерами совокупности (множеств) являются: количество студентов данного вуза, множество предприятий некоторой отрасли производства, множество людей данной отрасли, национальности, множество натуральных чисел и т.д. и т.п.

Множество (совокупность) обозначается прописной буквой, а их элементы строчными. Если а есть элемент совокупности (множества) А то в математике используется запись "а"А. Если "в" не является элементом совокупности А, то пишут "в"А.

Возьмем пример совокупности пяти предприятий (№ 1 - 5), имеются данные по вертикале:

I. число рабочих;

II. основные фонды (млн. руб.);

III. продукция (млн. руб.);

тогда располагая предприятия построчно по горизонтали согласно их номеру, а показатели - в указанном порядке по столбцам вертикали в соответствии с предлагаемым содержанием, всю совокупность 15 чисел можно представить в следующем виде матрицы:

Из данной матрицы мы видим, что на предприятии №2 (подчеркнуто нами) работает 844 рабочих, имеется на 8,0 млн. руб. основных фондов с общим объемом выпускаемой продукции на 10 млн. рублей.

Элементы, множество которых образует изучаемую статистикой совокупность, называют ее единицами. В данной матрице единицами являются предприятия № 1 - 5. Сами же единицы совокупности характеризуются разного рода качественными и количественными признаками.

Качественными признаками (атрибутивными признаками) в данной матрице - таблице является: число рабочих, основные фонды, выпуск продукции по каждому предприятию (единицы совокупности), а хозяйственными признаками являются числа, характеризующие конкретное предприятие по указанным качественным показателям (рабочие, фонды, выпуск продукции).

2. Классификация объектов и содержание понятия статистической группировки

Содержание понятия совокупности тесно связано с вопросом о классификации и группировках. Классификации и группировки означают распределение объектов некоторой совокупности по группам на основании их сходства и различия. Под классификацией понимается устойчивое разграничение объектов по соответствующим группам обладающих одинаковыми признаками. Так группируют отрасли промышленного производства исходя из особенностей соответствующей отрасли (металлургия черная, цветная). Распределение отраслей промышленности по соответствующим группам представляет собой процесс классификации, т.е. отнесение той или иной отрасли к определенному классу на основе соответствующих критериев или параметров. Установленная классификации не может быть вечной, но до определенного времени установления классификация может служить основой для статистики промышленности во всех исследованиях, а также формировании экономической информации о развитии, состоянии, проблемах тех или иных экономических структур относящихся к промышленности.

Метод группировок в статистике является основным методом и средством обобщения и анализа статистической информации о социально-экономических процессах в жизни общества. Сущность метода группировок, как мы видели, состоит в расчленении исследуемых совокупностей единиц (фактов, событий, явлений) на части (группы) по соответствующим характерным признакам, например, населения по месту проживания; промышленные предприятия по размеру реализованной продукции, численности рабочих, величине основных фондов и т.д.

Применение метода группировок в практической деятельности вызвано особенностями и сложными переплетениями общественных, экономических и социальных отношений. Эти сложные и разнообразные отношения могут быть глубоко и всесторонне выявлены и изучены при расчленении множества (совокупности) на части с определенными признаками представляющими интерес для соответствующих служб, экономических или научно-исследовательских структур. Соответствующие группировки фактов и явлений, процессов позволяют на основе массовой достоверной статистической информации выявить социально-экономические типы хозяйств и дать им количественную характеристику.

С помощью метода группировок решаются следующие основные вопросы: выбор признаков как научных оснований для выявления групп, количество и границы образуемых групп. Для построения групп в статистике используются в основном два вида признаков: качественные (атрибутивные) и количественные (численные). Так, при группировке населения по месту проживания выделяются две группы: городское и сельское население. Число возможных групп статистических данных может быть ограничено соответствующими признаками (атрибутами) как пол, возраст, образование, классовая принадлежность и т.п. Однако группировки могут формироваться по множеству других признаков и не только в статике на определенную дату, но и в динамике, т.е. на протяжении каких-то лет взятых в определенном интервале.

Поскольку единицы совокупностей подвергаемых группировке, обладают многими признаками, то группы могут быть образованы по одному или нескольким признакам взятым в определенной комбинации. Группировка по одному признаку называются простыми, группировки по двум и более признакам, взятым в сочетании с другом называется комбинационными.

Примером комбинационных группировок может быть следующая таблица.

Численность городского и сельского населения в нашей стране по данным переписи 1970 г.

Указанные в таблице группировки населения по признаку городское и сельское население представлено не только в динамике, т.е. в процессе исторического развития страны с 1913 по 1970 годы, но и раскрывают этот процесс в абсолютных и относительных числах.

Количественная характеристика наблюдаемых совокупностей явлений дает наглядное представление о направлениях и тенденциях развития изучаемых нами процессов.

Статистическая совокупность может быть раскрыта с помощью многих показателей, каждый из которых отражает определенное ее свойство. Все множество показателей, характеризующих определенные свойства совокупностей, важные с точки зрения цели ее изучения, должно составлять систему взаимосвязей элементов.

По статистической структуре показатели, входящие в систему, можно условно разделить на три группы: абсолютные (объемные) величины, относительные величины и средние величины.

Раздел: Статистика
Количество знаков с пробелами: 201108
Количество таблиц: 11
Количество изображений: 0

Основные статистические категории

Понятие статистики мы уже рассмотрели в прошлом уроке, и поняли, что она знает многое, кто не понял, забыл или прошел мимо, может перейти по ссылке и освежить свои знания)). Но в теории статистики есть еще одно очень интересное изречение. В мире есть три вида лжи – ложь, наглая ложь и… СТАТИСТИКА.

Совершенно противоречивое утверждение другое – статистика знает все. Но отчасти в нем есть доля правды. Все дело в данных, которые были собраны для обработки.

Но об этом поговорим позже…

категории статистики

Однако вернемся к статистическим категориям. Категории или основные статистические термины важная часть науки. И дело здесь в том, что эти термины регулярно употребляются в процессе обработки и анализа данных. Именно в этом кроется их такая важность для статистической науки.

Статистическая совокупность – это группа социально-экономических объектов или явлений общественной жизни объединенных общей связью, но отличающихся друг от друга отдельными признаками. Это наиболее часто встречающее определение совокупности. Включает в себя ее особенности, и что очень важно и другие статистические категории. Попытаемся упростить или понять, что же такое совокупность на примере.
Совокупность это некоторое объединение элементов или явлений или людей и т.п. Мало того что в совокупности как правило много частей или элементом (всегда больше одного), так еще все они в чем-то похожи. Так вот эта похожесть и есть признак, по которому объединили эти элементы. Общее у элементов одно, и масса других характеристик отличающихся.

статистика категории 1


Вот небольшой такой пример. На картинке у нас изображены условно люди. Это совокупность людей – по этому признаку их и объединили в совокупность. Однако все мы разные и у нас масса признаков, которые отличают нас друг от друга – пол, возраст, образование, семейное положение, уровень доходов, место жительства и так далее.
Вообще в совокупность можно объединить разные элементы, лишь бы было что изучать:
— совокупность школьников – общее учатся в школе, а различия пол, возраст, класс, место учебы и многое другое;
— совокупность деревьев в лесу – общее это деревья, различия возраст, разновидность дерева, высота и т.п.;
— совокупность предприятий – общее предприятия, различия, отрасль, число работников, объем выпуска, объем прибыли и др.
И таких примеров можно привести огромное количество.

Задание. Предположим на картинке представлена совокупность студентов. Опишите ее, почему она является совокупностью, какие есть признаки у студентов. Нет ли на картинке лишних элементов, не относящихся к данной совокупности?

Единица статистической совокупности – это первичный элемент статистической совокупности, являющийся носителем признаков подлежащих регистрации.
И снова упростим это определение. Единица совокупности это то, из чего состоит наша совокупность, но в единственном числе, то на что она делится. Значит единица это один единственный элемент совокупности. Если вернуться к нашей совокупности людей, единице совокупности будет один человек, допустим, что это красный человечек!
В других наших примерах единицей совокупности будет:
— совокупность школьников – один школьник;
— совокупность деревьев в лесу – одно дерево;
— совокупность предприятий – одно предприятие.

Признак единицы статистической совокупности – это качественная или количественная особенность, которая может быть изучена. О признаках упоминалась в двух предыдущих определениях и примеры мы уже привели. Однако действительно признак это то, что мы изучаем у каждой единицы совокупности.

Задание. Приведите примеры признаков, которые могут быть интересны для статистического изучения для следующих единиц совокупности – ребенок, собака, дом, машина, яблоко.

Статистический показатель – это количественная (чаще) или качественная (реже) характеристика признака статистической совокупности.
По сути, статистические показатели это те данные, которые мы собираем или то результаты исследования, которые мы получаем. И недаром он имеет название ПОКАЗАТЕЛЬ – показывает он нам что-то.
Можно говорить, что показатель бывает индивидуальным, это когда мы собрали данные по одной единице совокупности, или расчетным (что вернее) он получается после обработки данных (суммирование, усреднение и т.п.)
Качественная сторона статистического показателя определяется признаком, который подлежит изучению и отражается в названии показателя, количественная сторона — в численном значении показателя.
Еще одной особенностью статистических показателей является то, что они всегда привязаны к конкретным обстоятельствам места и времени.
Например, мы узнали возраст 4 человек – 24, 38, 28, 19. Можно сказать, что для каждого человека из обследованных это будет индивидуальный показатель возраста. Из этих данных мы можем получить и расчетный показатель среднего возраста – 27 лет. Вот 27 нам показывает, что средний возраст обследованной группы людей 27 лет.

виды статистических показателей

И последний очень важный термин вариация!
Вариация – это колебания признака статистической совокупности. В статистике говорят – признак колеблется или ВАРЬИРУЕТСЯ.
Вариация признака это основа статистической науке. Не было бы вариации, не было бы статистики. Именно потому что признаки изменяются и происходит их изучении. Если не было бы изменений и отличий и все было одинаковым, то изучать было бы нечего и статистики не было.

вариация

А дальше мы перейдем к статистическому наблюдению. Но прежде домашние задания.

Контрольное задание. Приведите примеры двух трех совокупностей, выделите в них единицы совокупности и охарактеризуйте их признаками. Приведите пример статистических показателей и вариации признака.

Генеральная совокупность - множество всех объектов, относительно которых предполагается делать выводы при изучении конкретной задачи.

Выборка - часть генеральной совокупности, которая охватывается экспериментом.

Репрезентативная выборка - выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности.

Унимодальное распределение - распределение, имеющее только одну моду (пример: нормальное распределение)


Способы формирования репрезентативной выборки:

Простая случайная выборка (simple random sample)

Стратифицированная выборка (stratified sample)

Групповая выборка (cluster sample)

Типы переменных:

непрерывные (рост в мм)

дискретные (количество публикаций у учёного)

Ранговые (успеваемость студентов)

Гистограмма частот:

Позволяет сделать первое впечатление о форме распределения некоторого количественного признака.


Описательные статистики:

Меры центральной тенденции (узкий диапазон, высокие значения признака):

Мода (mode) - значение во множестве наблюдений, которое встречается наиболее часто.

Медиана (median) - значение признака, которое делит упорядоченное множество пополам.

Среднее значение (mean, среднее арифметическое) - сумма всех значений измеренного признака, делённая на количество измеренных значений.

( используется для среднего значения из выборки, а для генеральной совокупности латинская буква )

Свойства среднего:

Если к каждому значению выборки прибавить определённое число, то и среднее значение увеличится на это число.

Если каждое значение выборки умножить на определённое число, то и среднее значение увеличится в это число раз.

Если для каждого значения выборки, рассчитать такой показатель как его отклонение от среднего арифметического, то сумма этих отклонений будет равняться нулю.

Меры изменчивости (широкий диапазон, вариативность признака):

Размах (range) - разность максимального и минимального значения.

При добавлении сильно отличающегося значения данные меняются сильно и могут быть некорректные.

Дисперсия (variance) - средний квадрат отклонений индивидуальных значений признака от их средней величины.

Дисперсия генеральной совокупности:

(среднеквадратическое отклонение генеральной совокупности)

(среднеквадратическое отклонение выборки)

Свойства дисперсии:

Квартили распределения и график box-plot

Квартили - три точки (значения признака), которые делят упорядоченное множество данных на четыре равные части.

Box-plot - такой вид диаграммы в удобной форме показывает медиану (или, если нужно, среднее), нижний и верхний квартили, минимальное и максимальное значение выборки и выбросы.



Нормальное распределение

Отклонения наблюдений от среднего подчиняются определённому вероятностному закону.

Стандартизация

Стандартизация или z-преобразование - преобразование полученных данных в стандартную Z-шкалу (Z-scores) со средним и


Правило "двух" и "трёх" сигм

Центральная предельная теорема

Центральная предельная теорема - класс теорем в теории вероятностей, утверждающих, что сумма большого количества независимых случайных величин имеет распределение близкое к нормальному. Так как многие случайные величины в приложениях являются суммами нескольких случайных факторов, центральные предельные теоремы обосновывают популярность нормального распределения.


Есть признак, распределенный КАК УГОДНО* с некоторым средним и некоторым стандартным отклонением. Тогда, если выбирать из этой совокупности выборки объема n, то их средние тоже будут распределены нормально со средним равным среднему признака в ГС и стандартным отклонением .

Стандартная ошибка среднего - теоретическое стандартное отклонение всех средних выборки размера , извлекаемое из совокупности.

Доверительные интервалы для среднего


Доверительный интервал является показателем точности измерений. Это также показатель того, насколько стабильна полученная величина, то есть насколько близкую величину (к первоначальной величине) вы получите при повторении измерений (эксперимента).

Идея статистического вывода


P-значение (P-value) - величина, используемая при тестировании статистических гипотез. Фактически это вероятность ошибки при отклонении нулевой гипотезы (ошибки первого рода).


2. Сравнение средних

T-распределение

Если число наблюдений невелико и \sigma неизвестно (почти всегда), используется распределение Стьюдента (t-distribution).

Унимодально и симметрично, но: наблюдения с большей вероятностью попадают за пределы от


"Форма" распределения определяется числом степеней свободы ().

С увеличением числа распределение стремится к нормальному.

t-распределение используется не потому что у нас маленькие выборки, а потому что мы не знаем стандартное отклонение в генеральной совокупности.

Сравнение двух средних; t-критерий Стьюдента

Критерий, который позволяет сравнивать средние значения двух выборок между собой, называется t-критерий Стьюдента.

Условия для корректности использования t-критерия Стьюдента:

Две независимые группы

Формула стандартной ошибки среднего:

Формула числа степеней свободы:

Формула t-критерия Стьюдента:

Переход к p-критерию:

Проверка распределения на нормальность, QQ-Plot


Однофакторный дисперсионный анализ

Часто в исследованиях необходимо сравнить несколько групп между собой. В таком случае применятся однофакторный дисперсионный анализ.

Незвисимая переменная - номинативная перменная с нескольким градациями, разделяющая наблюдения на группы.

Зависимая перемнная - количественная переменная, по степени выраженности которой сравниваются группы.

Читайте также: