Коэффициент джини это кратко

Обновлено: 02.07.2024

Многие путаются в коэффициентах Джини, не понимают, что они бывают разные и для разных задач (и названия у них разные — просто в русском переводе, как всегда, многое схлопывается в один термин).

Есть коэффициент/индекс Джини (Gini coefficient), который используют при оценке качества классификации и регрессии. На русской странице Wiki не очень информативно, но вот на английской всё подробно: изначально это был статистический показатель степени расслоения общества данной страны или региона по отношению к какому-либо изучаемому признаку. Вычисляется как отношение площади фигуры, образованной кривой Лоренца и кривой равенства, к площади треугольника, образованного кривыми равенства и неравенства. Сейчас поясню.

Допустим, в компании работают 4 человека с суммарным доходом 8000$. Равномерное распределение дохода — это 2000$+2000$+2000$+2000$, неравномерное — 0$+0$+0$+8000$. А как оценить неравномерность, скажем, для случая 1000$+1000$+2000$+4000$? Упорядочим сотрудников по возрастанию дохода. Построим кривую (Лоренца) в координатах [процент населения, процент дохода этого населения] — идём по всем сотрудникам и откладывает точки. Для первого — [25%, 12.5%] — это сколько он составляет процентов от всего штата и сколько процентов составляет его доход, для первого и второго — [50%, 25%] — это сколько они составляют процентов и сколько процентов их доход, для первых трёх — [75%, 50%], для всех — [100%, 100%].

gini

Рис. 1. Вычисление gini с помощью кривой Лоренца

На. Рис. 1. построенная кривая Лоренца показана красным цветом. Кривая Лоренца, которая соответствует равномерному распределению дохода, — синяя диагональ (т.н. кривая равенства). Кривая Лоренца, которая соответствует неравномерному распределению, — зелёная (т.н. кривая неравенства). Вот площадь A, делённая на A+B=0.5, и есть коэффициент Gini.

При оценке качества классификации GINI = 2*AUCROC-1. Про AUCROC я уже как-то писал. Почему это они так связаны нигде подробно не описано. Я нашёл упоминание в работе Supervised Classification and AUC. Там всё логично: если в задаче классификации на два класса 0 и 1 интерпретировать эти числа как доходы. Но чтобы связь была именно GINI = 2*AUCROC-1, должно быть что-то типа рис. 2 (но ROC-кривая и кривая Лоренца это не одно и то же), кстати в презентации Credit Scoring and the Optimization concerning Area under the curve такая же картинка.

gini

Рис.2. Связь AUCROC и GINI.

fgini

Индекс Джини по распределению национального дохода стран мира в 2018 году, согласно данным Всемирного банка[1]

Коэффициент Джини — статистический показатель степени расслоения общества данной страны или региона по какому-либо изучаемому признаку. Используется для оценки экономического неравенства.

Коэффициент Джини изменяется от 0 до 1. Чем больше его значение отклоняется от нуля и приближается к единице, тем в большей степени доходы сконцентрированы в руках отдельных групп населения.

Индекс Джини — процентное представление этого коэффициента.

Наиболее часто в современных экономических расчётах в качестве изучаемого признака берётся уровень годового дохода. Коэффициент Джини можно определить как макроэкономический показатель, характеризующий дифференциацию денежных доходов населения в виде степени отклонения фактического распределения доходов от абсолютно равного их распределения между жителями страны [2] .

Иногда коэффициент Джини (как и кривую Лоренца) используют также и для выявления уровня неравенства по накопленному богатству, однако в таком случае необходимым условием становится неотрицательность чистых активов домохозяйства.

Также коэффициент Джини применяется в машинном обучении для предсказания непрерывных величин. Смысл его — погрешность должна быть настолько равномерной, насколько возможно [ источник не указан 1194 дня ] .

Содержание статьи:

Что такое коэффициент / индекс Джини?

Индекс Джини, или коэффициент Джини, представляет собой меру распределения доходов среди населения, разработанный итальянским статистиком Коррадо Джини в 1912 году. Он часто используется в качестве индикатора экономического неравенства, измерения распределения доходов или, реже, распределения богатства. среди населения. Коэффициент варьируется от 0 (или 0%) до 1 (или 100%), где 0 означает полное равенство, а 1 — полное неравенство. Значения больше 1 теоретически возможны из-за отрицательного дохода или богатства.

Суть коэффициента Джини

В стране, в которой каждый житель имеет одинаковый доход, коэффициент Джини дохода будет равен 0. Страна, в которой один резидент получил весь доход, а все остальные ничего не заработал, будет иметь коэффициент Джини дохода, равный 1.

Коэффициент Джини — важный инструмент для анализа распределения доходов или богатства в стране или регионе, но его не следует принимать за абсолютное измерение дохода или богатства. По данным ОЭСР, в стране с высоким и низким уровнем доходов может быть один и тот же коэффициент Джини, если доходы распределяются одинаково внутри каждой из них: в Турции и США в 2016 году коэффициенты Джини по доходам составляли около 0,39-0,40. Однако, ВВП Турции на душу населения был менее половины ВВП США (в долларовом выражении 2010 года).

Графическое представление индекса Джини

Индекс Джини часто представляется графически через кривую Лоренца, которая показывает распределение доходов (или богатства) путем нанесения процентиля населения по доходу на горизонтальную ось и совокупного дохода на вертикальной оси. Коэффициент Джини равен площади под линией полного равенства (0,5 по определению) за вычетом площади под кривой Лоренца, деленной на площадь под линией полного равенства. Другими словами, это вдвое больше площади между кривой Лоренца и линией полного равенства.

На приведенном ниже графике 47-й процентиль соответствует 10,46% в Гаити и 17,42% в Боливии, что означает, что нижние 47% гаитян получают 10,46% от общего дохода своей страны, а нижние 47% боливийцев получают 17,42% их дохода. Прямая линия представляет гипотетически равноправное по доходам общество: нижние 47% граждан получают 47% национального дохода.

Чтобы оценить коэффициент Джини дохода для Гаити в 2012 году, мы найдем площадь под кривой Лоренца: около 0,2. Вычитая это число из 0,5 (площадь под линией равенства), мы получаем 0,3, которое затем делим на 0,5. Это дает приблизительный коэффициент Джини 0,6 или 60%. Данные Всемирного Банка дают фактический коэффициент Джини для Гаити в 2012 году как 60,8%. Эта цифра представляет собой чрезвычайно высокое неравенство. По данным ЦРУ, только Микронезия, Центральноафриканская Республика (ЦАР), Южная Африка и Лесото имеют еще большее неравенство.

Другой способ восприятия коэффициента Джини — это показатель отклонения от идеального равенства. Чем дальше кривая Лоренца отклоняется от идеально равной прямой линии (которая представляет собой коэффициент Джини, равный 0), тем выше коэффициент Джини и тем меньше равноправия в обществе. В приведенном выше примере Гаити более неравное, чем Боливия.

Коэффициент Джини в мире

Глобальный Джини

По оценкам Кристофа Лакнера из Всемирного банка и Бранко Милановича из Городского университета Нью-Йорка, коэффициент Джини для глобального дохода составлял 0,705 в 2008 году по сравнению с 0,722 в 1988 году. Однако цифры значительно различаются. По оценкам экономистов DELTA Франсуа Бургиньон и Кристиан Морриссон, этот показатель составлял 0,657 как в 1980, так и в 1992 году. Работа Бургиньона и Морриссона показывает устойчивый рост неравенства с 1820 года, когда глобальный коэффициент Джини составлял 0,500. Книга Лакнера и Милановича показывает снижение неравенства примерно в начале 21 века, как и книга Бургиньона 2015 года:

Экономический рост в Латинской Америке, Азии и Восточной Европе во многом стал причиной недавнего снижения неравенства доходов. В то время как неравенство между странами в последние десятилетия снизилось, неравенство внутри стран возросло.

Коэффициент Джини для стран мира

Ниже приведены коэффициенты Джини дохода для каждой страны, данные по которой представлены Всемирным Банком:

Некоторые из беднейших стран мира (Центральноафриканская Республика) имеют одни из самых высоких в мире коэффициентов Джини (61,3), в то время как многие из самых богатых (Дания) имеют одни из самых низких (28,8). Однако взаимосвязь между неравенством доходов и ВВП на душу населения не является идеальной отрицательной корреляцией, и эта взаимосвязь менялась с течением времени.

Михаил Моатсос из Утрехтского университета и Джоэри Батен из Тюбингенского университета показывают, что с 1820 по 1929 год неравенство несколько увеличивалось, а затем постепенно уменьшалось по мере увеличения ВВП на душу населения. С 1950 по 1970 год неравенство имело тенденцию к снижению, поскольку ВВП на душу населения превышал определенный порог. С 1980 по 2000 год неравенство снизилось с ростом ВВП на душу населения, а затем резко сократилось.

Недостатки коэффициента Джини

Хотя коэффициент Джини полезен для анализа экономического неравенства, он имеет некоторые недостатки. Точность показателя зависит от достоверных данных о ВВП и доходах. Теневая экономика и неформальная экономическая деятельность присутствуют в каждой стране. Неформальная экономическая деятельность, как правило, составляет большую часть реального экономического производства в развивающихся странах и находится на нижнем уровне распределения доходов внутри стран. В обоих случаях это означает, что индекс измеренных доходов Джини будет завышать истинное неравенство доходов. Получить точные данные о богатстве еще труднее из-за популярности налоговых убежищ (офшорных зон).

Хотя использование кривой Лоренца в качестве дополнения может предоставить больше информации в этом отношении, она также не показывает демографические различия между подгруппами внутри распределения, например распределение доходов по возрасту, расе или социальным группам. В этом ключе понимание демографии может быть важным для понимания того, что представляет данный коэффициент Джини. Например, большая часть пенсионеров повышает индекс Джини.

Резюме

  • Индекс Джини - это показатель распределения доходов населения.
  • Более высокий индекс Джини указывает на большее неравенство, когда люди с высоким доходом получают гораздо больший процент от общего дохода населения.
  • Глобальное неравенство, измеряемое индексом Джини, увеличивалось в XIX и XX веках, но снизилось в последние годы.
  • Из-за данных и других ограничений индекс Джини может завышать неравенство доходов и может скрывать важную информацию о распределении доходов.

А на этом сегодня все про коэффициент (индекс) Джини. Надеюсь статья оказалась для вас полезной. Делитесь статьей в социальных сетях и мессенджерах и добавляйте сайт в закладки. Успехов и до новых встреч на страницах проекта Тюлягин!

Индекс Джини, или коэффициент Джини, – это показатель распределения доходов среди населения, разработанный итальянским статистиком Коррадо Джини в 1912 году. Он часто используется в качестве индикатора экономического неравенства , измерения распределения доходов или, реже, распределения богатства. среди населения. Коэффициент варьируется от 0 (или 0%) до 1 (или 100%), где 0 представляет полное равенство, а 1 представляет полное неравенство. Значения больше 1 теоретически возможны из-за отрицательного дохода или богатства.

Ключевые моменты

  • Индекс Джини – это показатель распределения доходов среди населения.
  • Более высокий индекс Джини указывает на большее неравенство, когда люди с высоким доходом получают гораздо больший процент от общего дохода населения.
  • Глобальное неравенство, измеряемое индексом Джини, увеличивалось в XIX и XX веках, но в последние годы снизилось.
  • Из-за данных и других ограничений индекс Джини может завышать неравенство доходов и может скрывать важную информацию о распределении доходов.

Понимание индекса Джини

В стране, где каждый житель имеет одинаковый доход, коэффициент Джини дохода будет равен 0. Страна, в которой один резидент получил весь доход, а все остальные ничего не заработал, будет иметь коэффициент Джини дохода 1.

Коэффициент Джини – важный инструмент для анализа распределения доходов или богатства в стране или регионе, но его не следует принимать за абсолютное измерение дохода или богатства. По данным ОЭСР , в стране с высоким и низким уровнем доходов может быть один и тот же коэффициент Джини, если доходы распределяются одинаково внутри каждой из них: в Турции и США в 2016 году коэффициенты Джини по доходам составляли около 0,39-0,40. ВВП Турции на душу населения был менее половины ВВП США (в долларовом выражении 2010 года).

Графическое представление индекса Джини

Индекс Джини часто представлен графически через кривую Лоренца , которая показывает распределение доходов (или богатства) путем нанесения процентиля населения по доходу на горизонтальную ось и совокупного дохода на вертикальной оси. Коэффициент Джини равен площади под линией полного равенства (0,5 по определению) за вычетом площади под кривой Лоренца, деленной на площадь под линией абсолютного равенства. Другими словами, это вдвое больше площади между кривой Лоренца и линией полного равенства.

На приведенном ниже графике 47-й процентиль соответствует 10,46% в Гаити и 17,42% в Боливии, что означает, что нижние 47% гаитян получают 10,46% от общего дохода своей страны, а нижние 47% боливийцев получают 17,42% их дохода. . Прямая линия представляет собой гипотетически равное общество: нижние 47% получают 47% национального дохода.

Чтобы оценить коэффициент Джини дохода для Гаити в 2012 году, мы найдем площадь под кривой Лоренца: около 0,2. Вычитая это число из 0,5 (площадь под линией равенства), мы получаем 0,3, которое затем делим на 0,5. Это дает приблизительный коэффициент Джини 0,6 или 60%. ЦРУ дает фактический коэффициент Джини для Гаити в 2012 году как 60,8% (см. Ниже). Эта цифра представляет собой чрезвычайно высокое неравенство; По данным ЦРУ, только Микронезия, Центральноафриканская Республика, Южная Африка и Лесото более неравны.

Другой способ восприятия коэффициента Джини – это показатель отклонения от идеального равенства. Чем дальше кривая Лоренца отклоняется от идеально равной прямой линии (которая представляет собой коэффициент Джини, равный 0), тем выше коэффициент Джини и тем менее равным является общество. В приведенном выше примере Гаити более неравное, чем Боливия.

Индекс Джини во всем мире

Глобальный Джини

По оценкам Кристофа Лакнера из Всемирного банка и Бранко Милановича из Городского университета Нью-Йорка , коэффициент Джини для глобального дохода составлял 0,705 в 2008 году по сравнению с 0,722 в 1988 году. Однако цифры значительно различаются. По оценкам экономистов DELTA Франсуа Бургиньон и Кристиан Морриссон , этот показатель составлял 0,657 как в 1980, так и в 1992 году. Работа Бургиньона и Морриссона показывает устойчивый рост неравенства с 1820 года, когда глобальный коэффициент Джини составлял 0,500. Лакнер и Миланович показывают снижение неравенства примерно в начале 21 века, как и книга Бургиньона 2015 года:

Источник: Всемирный банк .

Экономический рост в Латинской Америке, Азии и Восточной Европе во многом стал причиной недавнего снижения неравенства доходов. В то время как неравенство между странами в последние десятилетия снизилось, неравенство внутри стран возросло.

Джини внутри стран

Ниже приведены коэффициенты Джини дохода для каждой страны, по которой в CIA World Factbook представлены данные:

Некоторые из беднейших стран мира (Центральноафриканская Республика) имеют одни из самых высоких в мире коэффициентов Джини (61,3), тогда как многие из самых богатых стран (Дания) имеют одни из самых низких (28,8). Однако взаимосвязь между неравенством доходов и показывают, что с 1820 по 1929 год неравенство несколько увеличивалось, а затем постепенно уменьшалось по мере увеличения ВВП на душу населения. С 1950 по 1970 год неравенство, как правило, уменьшалось, поскольку ВВП на душу населения превышал определенный порог. С 1980 по 2000 год неравенство снизилось с ростом ВВП на душу населения, а затем резко увеличилось.

Корреляция между коэффициентами Джини и ВВП на душу населения за три периода времени. Источник: Моатсос и Батен .

Недостатки

Хотя коэффициент Джини полезен для анализа экономического неравенства, он имеет некоторые недостатки. Точность показателя зависит от достоверных данных о ВВП и доходах. Теневая экономика и неформальная экономическая деятельность присутствуют в каждой стране. Неформальная экономическая деятельность, как правило, составляет большую часть истинного экономического производства в развивающихся странах и находится на нижнем уровне распределения доходов внутри стран. В обоих случаях это означает, что индекс измеренных доходов Джини будет завышать истинное неравенство доходов. Получить точные данные о богатстве еще труднее из-за популярности налоговых убежищ .

Читайте также: