Меры центральной тенденции кратко

Обновлено: 07.07.2024

Меры центральной тенденции (МЦТ) –это число, характеризующее выборку по уровню выраженности измеренного признака; это величины, вокруг которых группируются остальные данные.

Среднее арифметическое (выборочное среднее, М) –это частное от деления всех значений (Х) на их количество (N):

Свойства среднего:

а) если к каждому значению переменной прибавить одно и то же число С, то среднее увеличится на это число (уменьшится на это число, если оно отрицательное): М(xj+c) = Мx +с

б) если каждое значение переменной умножить на одно и то же число С, то среднее

увеличится в С раз: М(xj·c) = Мx ×с

в) отклонение от среднего – сумма всех отклонений от среднего равна нулю: Σ(xj-

Медиана (Ме) –это значение, которое делит упорядоченное (ранжированное) множе-

ство данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая больше. При этом количество отличающихся значений ниже и выше медианы одина- ково. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию (убыванию). Далее медиана определяется следующим образом:

а) если данные содержат нечетное число значений (8, 9, 10, 13, 15), то медиана есть центральное значение, т.е. Ме=10;

б) если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посредине между двумя центральными значениями, т. е. Ме=(8+9)/2=8,5.

Мода (Мо) –это значение, наиболее часто встречающееся в выборке, т.е. значение с наибольшей частотой. Мода – это значение признака, а не его частота. Особенности:

а) если график распределения частот имеет одну вершину, то такое распределение называют унимодальным; например: среди 8 значений признака (3, 7, 3. 5, 7, 8, 7, 6) Мо=7 как наиболее часто встречающееся значение;

б) если два соседних значения имеют одинаковую частоту и они больше частоты лю- бого другого значения, мода есть среднее этих двух значений; например: в ряду значений (1, 2, 2, 2, 4, 4, 4, 5, 5, 7) Мо=3;

в) если то же самое относится к двум не смежным значениям, то существует две мо- ды, а группа оценок является бимодальной; например: в ряду значений (0, 1, 1, 1, 2, 3, 4, 4, 4,

г) если все значения встречаются в группе одинаково часто, то считается, что моды нет; например: 1, 1, 3, 3, 7, 7.

Правила выбора мер центральной тенденции.

1. Для номинативных данных единственной подходящей мерой ЦТ является Мо, или модальная категория – та градация номинативной переменной, которая встречается наиболее часто.

2. Для порядковых метрических переменных, распределение которых унимодальное и симметричное, мода, медиана и среднее совпадают. Чем больше отклонение от симметрич- ности, тем больше расхождение между значениями этих МЦТ. По этому расхождению мож- но судить о том, насколько симметрично или асимметрично распределение.

6. Мода используется тогда, когда не нужна высокая точность, но важна быстрота распределения МЦТ.

Помимо МЦТ в психологии широко используются меры положения, которые называ- ются квантилями распределения.

Квантиль –это точка на числовой оси измеренного признака, которая делит всю со- вокупность упорядоченных измерений на две группы с известным соотношением их числен- ности.

Виды квантилей:

Медиана (Ме)– значение признака, которое делит всю совокупность измерений на две группы с равной численностью;

Процентиль– (Р) – это 99 точек значений признака (Р1, …….Р99), которые делят упо- рядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Определение конкретного значения процентиля аналогично определению медианы. Напри- мер: при определении 1- процентиля, Р10, сначала все значения признака упорядочиваются по возрастанию. Затем отсчитывается 10% испытуемых, имеющих наименьшую выражен- ность признака. Р10 будет соответствовать тому значению признака, который отделяет эти 10% испытуемых от остальных 90%;

Квартиль –это 3 точки – значения признака (Р25, Р50, Р75), которые делят упорядо- ченное (по возрастанию) множество наблюдений на 4 равные по численности части. Первый квартиль соответствует 25-му процентилю, второй – 50-му процентилю или медиане, третий квартиль – 75-му процентилю.

Процентили и квартили используются для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака или для выделения подгрупп и отдель- ных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.

Меры изменчивости

Меры изменчивости– статистические показатели, характеризующие различия меж- ду отдельными значениями выборки. Они позволяют судить о степени однородности полу- ченного множества, о его компактности, а косвенно – и о надежности полученных данных и вытекающих из них результатов. Если меры центральной тенденции отражают уровень вы- раженности измеренного признака, то меры изменчивости, отражающие индивидуальные различия испытуемых по измеренному признаку, применяются в психологии для численного выражения величины межиндивидуальной вариации признака.

Наиболее используемые в психологических исследованиях результаты: размах, сред- нее отклонение, дисперсия, стандартное отклонение, полуквартильное отклонение.

Размах (R) –интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных.

Среднее отклонение (МД) –это среднеарифметическое разницы (по абсолютной ве- личине) между каждым значением в выборке и её средним. МД показывает скученность дан- ных вокруг среднего:

где d= (Х-М); М – среднее выборки, Х – конкретное значение, N – число значений.

Дисперсия (Д) –(от лат. рассыпанный) – мера изменчивости для метрических дан- ных, пропорциональная сумме квадратов отклонений измеренных значений от их арифмети- ческого среднего. Дисперсия – величина, название которой в науке является синонимом из- менчивости:

D=Σd2/N, для больших выборок; где d= (Х-М); D=Σd2/(N-1), для малых выборок; где d= (Х-М);

Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии.

Свойства дисперсии:

а) если значения измеренного признака не отличаются друг от друга (равны между собой) – дисперсия равна нулю;

б) прибавление одного и того же числа к каждому значению переменной не меняет дисперсию;

в) прибавление константы к каждому значению переменной изменяет среднее (М), но дисперсия при этом остается неизменной;

г) умножение каждого значения переменной на константу С изменяет дисперсию в С2 раз: Dх×c = Dх С2

Стандартное отклонение (σ) –положительное значение квадратного корня из дис- персии.

Из-за возведения в квадрат отдельных отклонений d при вычислении дисперсии полу- чается величина, далекая от самих отклонений. Чтобы этого избежать и получить характери- стику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень. Его положительное значение и при- нимается за меру изменчивости, именуемую среднеквадратическим или стандартным откло- нением.

Меры центральной тенденции (measures of central tendency) — способы осмысления центральной или средней позиции множества наблюдений, оценок, группы чисел и т.д.

На практике существуют большое разнообразие мер центральной тенденции (например, взвешенное, винсоризованное, гармоническое, геометрическое средние, среднее Колмогорова и др), но чаще всего встречаются:

  • мода;
  • среднее арифметическое;
  • медиана.

Мода — типичность — максимальная частота — наиболее часто встречающееся значение в совокупности наблюдений. Применяется, например, для определения размера одежды, обуви, калибра патронов, пользующихся популярностью у покупателей, анализа технических экспериментов, а также определение часто встречающегося значения среди данных, имеющих не числовую природу происхождения (например, цвета: синий, красный, желтый, синий, зеленый…).

Мода и среднее арифметическое

Давайте найдем моду — максимально встречающееся значение в данной совокупности:

Совокупность значений

Рассчитаем значение моды в Excel

Формула расчета моды в Excel

У нас получилось 13. Т.е. максимально часто встречающееся значение в данной совокупности является значение 13.

Но если построить график, то получается такая картина

График количества значений

Видим, что на анализируемый показатель влияет 2 значения: это значения показателей 6, который встречается 16 раз и 13, встречающийся 17 раз. Например, такая ситуация может возникнуть при выборе кандидата в президенты: первая вершина — отданные голоса городского населения, вторая — сельского. Такой эффект называется мультимодальностью и, как правило, указывает что набор данных не подчиняется нормальному распределению.

Среднее арифметическое

Среднее арифметическое — сумма всех чисел, деленное на их количество, зависимое от разброса наблюдений.

Фомула нахождения среднего арифметического

Отщепенцы влияющее на среднее

Чтобы уяснить эту концепцию представьте 3-х мужчин, сидящих за барной стойкой.

Пример искажения среднего

Пример искажения среднего

Предположим, что у каждого из мужчин годовой доход составляет 42 000 долларов. Но тут, с попугаем на плече, к ним подсаживается Роман Абрамович, с годовым доходом 955 000 000 долларов.

Если подсчитать средний доход 4-х сидящих мужчин за барной стойкой (т.е. с Романом Абрамовичем), то мы ошибочно будем полагать что он составляет 238 781 500 долларов. Что на самом деле не соответствует действительности.

Медиана

Медиана — середина — уровень показателя, который делит набор данных на 2 равные половины (50/50). Она не присваивает наблюдениям весовые коэффициенты исходя из того, на сколько они отдалены от средней точки, а лишь оценивает их в зависимости от расположения.

Развивая мысль можно также делить медиану на четверти — квартили:

  • 0,25 квантиль — первый (нижний) квартиль;
  • 0,5 квантиль — медиана — второй квартиль;
  • 0,75 квантиль — третий (верхний) квартиль.

Еще один вариант разделить на децили, каждый из которых включает в себя 10% наблюдений. Например, если ваш расход топлива бензинового двигателя автомобиля в верхнем дециле общего распределения расходов топлива всех бензиновых двигателей, то это означает, ваш двигатель сжигает топлива больше, чем 90% остальных двигателей.

Разбив распределение на сотые доли получим процентили — 1% распределения: первый процентиль представляет нижний 1% данного распределения, а 99-й — его верхний 1%.

Рассмотрим набор нормально распределенных случайных чисел.

Медиана в наборе нормально распределенных чисел

В данном примере видим идеальную ситуацию когда медиана, среднее арифметическое и мода совпадают. Но, если рассмотреть ассиметричное распределение, которое может возникать при проведении технических замеров, например, скорости, может сложиться такая ситуация

Медиана и среднее арифметическое

Вывод

Окончательный выбор меры центральной тенденции всегда лежит за исследователем.

В статистике меры центральной тенденции служат для локализации множества значений вокруг одного единственного числа. При существующем многообразии мер центральной тенденции окончательный выбор меры всегда остается за исследователем.

В самых простых случаях (и наиболее часто) в качестве меры центральной тенденции применяется среднее арифметическое, предложенное, наряду со средним геометрическим и средним гармоническим еще пифогорейцами. Поэтому эти три перечисленные меры так же называют Пифагорейскими средними (Pythagorean means) [1] .

В реальных исследованиях получаемая совокупность значений редко описываются нормальным распределением и, кроме того, она может содержать так называемые "выбросы" (или аутлайеры). Поэтому при выборе той или иной меры центральной тенденции важно учитывать устойчивость (робастность) выбранной меры центральной тенденции применяемой в каждом конкретном случае.

Основные меры центральной тенденции

Арифметическое среднее – сумма всех наблюденных значений, деленная на их количество

Взвешенное среднее – среднее значение, учитывающее весовые коэффициенты для каждого значения

Винсоризованное среднее – среднее арифметическое, при расчете которого все исключенные (в соответствии с установленным исследователем процентом) наибольшие и наименьшие значения заменяются на наибольшее и наименьшее "оставшиеся" значения соответственно

Гармоническое среднее – количество наблюдений, деленное на сумму инвертированных значений наблюдений

Геометрическое среднее – корень степени количества значений из общего произведения всех значений

Медиана – значение, которое делит упорядоченные по возрастанию (убыванию) наблюдения пополам

Мода – наиболее часто встречающееся значение

Среднее Колмогорова – частный случай среднего по Коши. Общий вид системы аксиом (требований к средним величинам) приводящий к так называемым ассоциативным средним

Усеченное среднее - арифметическое среднее после удаления установленного (исследователем) процента наибольших и наименьших значений

Примечания

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Меры центральной тенденции" в других словарях:

МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ — (measures of central tendency) различные способы осмысления центральной или средней позиции группы наблюдений, чисел и т.д. Имеются три меры: мода, медиана и среднее. Мода наиболее частое значение. Медиана значение, занимающее центральное… … Большой толковый социологический словарь

МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ — – характеристики совокупности переменных (признаков), указывающие на наиболее типичный, репрезентативный для изучаемой выборки результат. Если предположить, что множество результатов исследования расположено на числовой прямой, то центральная… … Современный образовательный процесс: основные понятия и термины

Меры центральной тенденции — характеристики выборки или генеральной совокупности, предназначенные для описания центра распределения (мода, медиана, среднее арифметическое) … Социологический словарь Socium

Меры центральной тенденции — обобщенные характеристики распределения некоторого признака в данной совокупности индивидов. Их называют также средними, оперируя которыми, мы теряем часть информации, но отражаем типичное для изучаемой совокупности в определенных условиях. Чтобы … Социологический справочник

Меры вариации — показатели колеблемости значений некоторого признака у индивидов данной совокупности. Одна из простейших мер вариационный размах, равный разности крайних (наибольшего и наименьшего) значений признака в данной совокупности. Важнейшим показателем… … Социологический справочник

МЕРЫ ДИСПЕРСИИ — (measures of dispersion) различные способы вычисления степени, в которой совокупность индивидуальных величин наблюдений, чисел и т.д. группируется вокруг митральной точки. Меры дисперсии, тесно связанные с мерами центральной тенденции,… … Большой толковый социологический словарь

МЕРЫ ИЗМЕНЧИВОСТИ — – статистические показатели вариации (разброса) признака (переменной) относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения; позволяют судить о достоверности и однородности полученной эмпирически … Современный образовательный процесс: основные понятия и термины

ЦЕНТРАЛЬНАЯ ТЕНДЕНЦИЯ — (CENTRAL TENDENCY) При анализе данных всегда полезно иметь единый суммарный показатель центрального или наиболее типичного значения. При анализе социологических данных обычно используются две меры центральной тенденции. Самой распространенной… … Социологический словарь

Мера центральной тенденции - это число, характеризующее выборку по уровню выраженности измеренного признака. Они показывают, вокруг каких значений группируется большинство экспериментальных данных.

Существует три способа определения "центральной тенденции", каждому из которых соответствует своя мера: мода, медиана, выборочное среднее.

Мода (Mo) - это такое значение из множества измерений, которое встречается наиболее часто. Моде, или модальному интервалу признака, соответствует наибольший подъем (вершина) графика распределения частот. Если график распределения частот имеет одну вершину, то такое распределение называется унимодальным.

Когда два соседних значений встречаются одинаково часто и чаще чем любое другое значение, мода есть среднее этих двух значений.

Распределение может и не иметь моду. Когда все значения встречаются одинаково часто, принято считать, что такое распределение не имеет моды.

Или у нас есть другой ряд <4,3,1,8,9,0,6,1,9>. В нем два числа встречаются одинаковое количество раз - это 1 и 9. Тогда мода этой выборки будет 5, потому, что это среднее значение между числами 1 и 9.

Медиана

Медиана (Me) - это такое значение признака, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений меньше медианы, а другая - больше. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом:

  • если данные содержат нечетное число значений, то медиана - это центральное значение;
  • если данные содержат четное число значений, то медиана - это точка, посредине между двумя центральными значениями.

Допустим у нас есть ряд значений с нечетным количеством элементов <1,7,3,9,2,6,0>, чтобы узнать медиану нам нужно сначала упорядочить значения по возрастанию или убыванию. Например, вот так - . Теперь наглядно видно, что мода равна 3, потому что это центральное значение выборки.

Или, допустим, у нас есть ряд с четным количеством элементов <5,9,2,7,7,4,0,1>. Упорядочиваем значения . Медиана этого ряда находиться между значениями 4 и 5. Значит, нам нужно рассчитать среднее для этих значений. Получаем 4,5.

Выборочное среднее

Т.к. в психологических исследованиях мы исследуем выборки, нам и среднее надо расчитывать по выборке или - выборочное среднее. Выборочное среднее (эмпирическое среднее), является частным случаем среднего арифметического и определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений.

\( \bar=\frac\sum_^nX_i \)

Пример: допустим у нас есть выборка значений . Подставляем эти значений в формулу, где n это количество значений и для нашей выборки оно равно 5, мы получим:

\( \bar=\frac=\frac=5 \)

Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, то есть среднее арифметическое подвержено сильному влиянию "больших отклонений". Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию "среднего", а значения среднего из робастной статистики, например, медиана, может лучше описывать центральную тенденцию.

Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. "Средний" доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Но этот "средний" доход является выше, чем доходы большинства людей, так как очень высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического. В отличие от этого, средний доход по медиане "сопротивляется" такому перекосу. Однако этот "средний" доход ничего не говорит о количестве людей вблизи медианного дохода и не говорит ничего о количестве людей вблизи модального дохода. Тем не менее если легкомысленно отнестись к понятиям "среднего" и "большинства", то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например: рассмотрим выборку . Среднее арифметическое равно 3.17. Но ведь пять значений из шести ниже этого среднего.

У симметричного одномерного унимодального распределения выборочное среднее, медиана и мода одинаковы.

Читайте также: