Модели бинарного выбора реферат

Обновлено: 05.07.2024

Моделью бинарного выбора называется модель регрессии, в которой результативная переменная может принимать только узкий круг заранее заданных значений Если стоит задача построения модели регрессии, включающей результативную бинарную переменную, то прогнозные значения yi прогноз, полученные с помощью данной модели, будут выходить за пределы интервала и не будут поддаваться интерпретации. В этом… Читать ещё >

Модели дискретного выбора. Бинарные модели ( реферат , курсовая , диплом , контрольная )

Модели дискретного выбора (иначе называемые моделями качественного отклика — определяют вероятностное распределение дискретных зависимых переменных как функцию независимых переменных и неизвестных параметров. Их применение в эконометрике определяется тем, что решение экономического субъекта часто включает дискретный выбор (напр., решение поступать на работу или не поступать, выбор занятия, выбор маршрута перевозки груза и т. п. ). В каком-то смысле эти модели противоположны агрегированным макроэкономическим моделям, которые описывают массовые, а не индивидуальные факты. В разных постановках М. д. в. в качестве математического аппарата применяются цепи Маркова (см. Марковские процессы), модели с бинарными переменными, многомерные модели (совместное распределение вероятностей для двух или большего числа дискретных зависимых переменных), случайные выборки и др.

Модели бинарного выбора Результативная переменная у в нормальной линейной модели регрессии является непрерывной величиной, способной принимать любые значения из заданного множества. Но помимо нормальных линейных моделей регрессии существуют модели регрессии, в которых переменная у должна принимать определённый узкий круг заранее заданных значений.

Моделью бинарного выбора называется модель регрессии, в которой результативная переменная может принимать только узкий круг заранее заданных значений Если стоит задача построения модели регрессии, включающей результативную бинарную переменную, то прогнозные значения yi прогноз, полученные с помощью данной модели, будут выходить за пределы интервала [0;+1] и не будут поддаваться интерпретации. В этом случае задача построения модели регрессии формулируется не как предсказание конкретных значений бинарной переменной, а как предсказание непрерывной переменной, значения которой заключаются в интервале [0;+1].

Решением данной задачи будет являться кривая, удовлетворяющая следующим трём свойствам:

Данным трём свойствам удовлетворяет функция распределения вероятности.

Модель парной регрессии с результативной бинарной переменной с помощью функции распределения вероятности можно представить в следующем виде:

где prob (yi=1) — это вероятность того, что результативная переменная yi примет значение, равное единице.

Модель бинарного выбора может быть представлена с помощью скрытой или латентной переменной следующим образом:

Модели дискретного выбора. Бинарные модели.

Векторная форма модели бинарного выбора с латентной переменной:

Модели дискретного выбора. Бинарные модели.

В данном случае результативная бинарная переменная yi принимает значения в зависимости от латентной переменной yi*:

Модели дискретного выбора. Бинарные модели.

Модель бинарного выбора называется пробит-моделью или пробит-регрессией (probit regression), если она удовлетворяет двум условиям:

  • 1) остатки модели бинарного выбора ?i являются случайными нормально распределёнными величинами;
  • 2) функция распределения вероятностей является нормальной вероятностной функцией.

Пробит-регрессия может быть представлена с помощью выражения:

где NP — это нормальная вероятность (normal probability).

Модель бинарного выбора называется логит-моделью или логит-регрессией (logit regression), если случайные остатки ?iподчиняются логистическому закону распределения.

Логит-регрессия может быть представлена с помощью выражения:

Модели дискретного выбора. Бинарные модели.

Данная модель логит-регрессии характеризуется тем, что при любых значениях факторных переменных и коэффициентов регрессии, значения результативной переменной yi будут всегда лежать в интервале [0;+1].

Обобщённый вид модели логит-регрессии:

Модели дискретного выбора. Бинарные модели.

Достоинством данной модели является то, что результативная переменная yi может произвольно меняться внутри заданного числового интервала (не только от нуля до плюс единицы).

Логит-регрессия относится к классу функций, которые можно привести к линейному виду. Это осуществляется с помощью преобразования, носящего название логистического или логит преобразования, которое можно проиллюстрировать на примере преобразования обычной вероятности р:

Модели дискретного выбора. Бинарные модели.

Качество построенной логит-регрессии или пробит-регрессии характеризуется с помощью псевдо коэффициента детерминации, который рассчитывается по формуле:

Модели дискретного выбора. Бинарные модели.

Если значение данного коэффициента близко к единице, то модель регрессии считается адекватной реальным данным.

Предметом контрольной работы являются эконометрические модели.
Цель работы рассмотреть и раскрыть теоретические аспекты эконометрических моделей бинарного выбора. Формулировка темы обусловила постановку следующей задачи:
– рассмотреть модели с бинарной переменной (логит и пробит).

Прикрепленные файлы: 1 файл

КР Эконометрика.docx

Министерство образования и науки РФ

Федеральное государственное бюджетное образовательное

Учреждение высшего профессионального образования

«Сибирская государственная автомобильно-дорожная

Введение

Модель бинарного выбора — применяемая в эконометрике модель зависимости бинарной переменной (принимающей всего два значения — 0 и 1) от совокупности факторов. Построение обычной линейной регрессии для таких переменных теоретически некорректно, так как условное математическое ожидание таких переменных равно вероятности того, что зависимая переменная примет значение 1, а линейная регрессия допускает и отрицательные значения и значения выше 1. Поэтому обычно используются некоторые интегральные функции распределения. Чаще всего используются нормальное распределение (пробит), логист ическое распределение (логит), распределение Гомперца (гомпит).

Probit и logit модели применяются для оценки качественных переменных, где применение линейного оценивания затруднено рядом причин. Другими словами, если мы хотим спрогнозировать некоторую величину, причем эта величина бинарная, т.е. может принимать только два значения, то логит - и пробит модели могут оказать нам незаменимую услугу.

Предметом контрольной работы являются эконометрические модели.

Цель работы рассмотреть и раскрыть теоретические аспекты эконометрических моделей бинарного выбора. Формулировка темы обусловила постановку следующей задачи:

– рассмотреть модели с бинарной переменной (логит и пробит).

1. Сущность модели

Пусть переменная Y является бинарной, то есть может принимать только два значения, которые для упрощения предполагаются равными 1 и 0. Например, Y может означать наличие /отсутствие, каких либо условий, успех или провал чего-либо, ответ да/нет в опросе и т. д. Пусть также имеется вектор регрессоров (факторов) X, которые оказывают влияние на Y.

Регрессионная модель имеет дело с условным по факторам математическим ожиданием зависимой переменной, которая в данном случае равна вероятности того, что зависимая переменная равна 1. В самом деле, по определению математического ожидания и с учетом всего двух возможных значений имеем1:

В связи с этим применение, например, стандартной модели линейной регрессии теоретически некорректно хотя бы потому, что вероятность по определению принимает ограниченные значения от 0 до 1. В связи с этим разумно моделировать p(x) через интегральные функции тех или иных распределений.

Обычно предполагается, что имеется некая скрытая (не наблюдаемая) "обычная" переменная Y*, в зависимости, от значений которой наблюдаемая переменная Y принимает значение 0 или единица:

Предполагается, что скрытая переменная зависит от факторов X в смысле обычной линейной регрессии , где случайная ошибка имеет распределение F. Тогда:

Если распределение симметричное, то можно записать:

Экономическая интерпретация

Ещё одно обоснование заключается в использовании понятия полезности альтернатив — не наблюдаемой функции , то есть фактически двух функций и соответственно для двух альтернатив. Логично предположить, что если при заданных значениях факторов полезность одной альтернативы больше полезности другой, то выбирается первая и наоборот. В связи с этим разумно рассмотреть функцию разности полезностей альтернатив:

Если она больше нуля, то выбирается первая альтернатива, если меньше или равна нулю — то вторая. Таким образом, функция разности полезностей альтернатив здесь выполняет роль той самой скрытой переменной. Наличие случайной ошибки в моделях полезностей позволяет учесть не абсолютную детерминированность выбора (по крайней мене не детерминированность данным набором факторов, хотя элемент случайности выбора есть при любом наборе факторов).

Модели по видам распределений

Пробит. В пробит - модели в качестве F используется интегральная функция стандартного нормального распределения Ф:

Логит. В логит - модели используется CDF логистического распределения:

Гомпит. Используется распределение экстремальных значений - распределение Гомперца:

Оценка параметров

Оценка обычно производится методом максимального правдоподобия. Пусть имеется выборка объёма n факторов X и зависимой переменной Y. Для данного номера наблюдения используем индекс t. Вероятность получения в наблюдении t значения yt можно смоделировать следующим образом:

В самом деле, если , то второй множитель очевидно равен 1, а первый как раз , если же , то первый множитель равен единице, а второй — . Предполагается, что данные независимы. Поэтому функцию правдоподобия можно получить как произведение вышеуказанных вероятностей:

Соответственно логарифмическая функция правдоподобия имеет вид:

Максимизация данной функции по неизвестным параметрам позволяет получить состоятельные, асимпт отически эффективные и асимптотически нормальные оценки параметров. Последнее означает, что:

где — асимптотическая ковариационная матрица оценок параметров, которая определяется стандартным для метода максимального правдоподобия способом (через гессиан или градиент ло гарифмической функции правдоподобия в оптимальной точке).

2. Показатели качества и тестирование модели

Предлагается два вида моделей выбора, которые могли бы порождать интересующее нас распределение зависимой переменной: пороговая модель и модель, основанная на полезности альтернатив. Идея пороговой модели уже обрисована выше. Предполагается, что в основе выбора лежит ненаблюдаемая переменная Y, математическое ожидание которой является линейной комбинацией набора регрессоров X: Y = bX + e. Наблюдается только дискретная величина Y, которая связана с Y следующим образом: если Y больше некоторой пороговой величины C, то Y = 1, если меньше, то Y = 0. Как обычно предполагается, что ошибки e i имеют нулевое математическое ожидание, одинаково распределены и независимы. Величину C можно принять равной нулю2.

Другая модель предполагает, что выбор осуществляется на основе ненаблюдаемой полезности альтернатив u(Y, X). Если u(1, X) > u(0, X), то выбираем 1, если u(0, X) 0 Þ 1). Поэтому наглядно о качестве модели можно судить по диаграмме соответствующих точек по Y: чем лучше разделены две группы точек, тем более качественна модель. О качестве модели можно судить также по графику оценки E (Y) по . Этот график в случае “хорошей” модели должен быть "крутой" в нуле. (См. Рис. 4)

На этих двух графиках слева внизу и справа вверху расположены правильно предсказанные точки, а слева вверху и справа внизу — неправильно. То же самое можно представить таблицей:


Понятно, что "хорошая" модель должна давать высокий процент правильных предсказаний.

Для проверки набора ограничений на параметры удобно использовать статистику отношения правдоподобия LR = 2 (l (b) – l (b R)), где


- логарифмическая функция правдоподобия,
b — оценка методом максимума правдоподобия без ограничений,
bR — оценка при ограничениях.

Эту же статистику можно использовать для построения показателя качества модели, аналогичного F-статистике для линейной регрессии. Это статистика для проверки гипотезы о том, что коэффициенты при всех регрессорах, кроме константы, равны одновременно нулю. Соответствующая статистика отношения правдоподобия равна LR0 = 2(ℓ(b) – ℓ0) , где ℓ 0 – максимум логарифмической функции правдоподобия для константы. Она распределена асимптотически как X2 с k–1 степенями свободы, где k – количество параметров в исходной модели, включая константу. Величина l получается следующим образом. Пусть N – общее количество наблюдений, n0 – количество наблюдений, для которых Yi = 0, n1 – количество наблюдений, для которых Yi = 1. Тогда предсказанная вероятность появления Yi = 1 в модели с одной константой будет равна для всех наблюдений n1 /N . Отсюда ℓ0 = n0 ℓnn0 + n1 ln n1 – N ln N. Еще один показатель качества модели, основанный на максимуме функции правдоподобия — информационный критерий Акаике3:

Для моделей с бинарной зависимой переменной можно сконструировать и некий аналог коэффициента детерминации — псевдо-R2:

где Y— среднее Yi , s 2 — дисперсия ошибки e, которая равна 1 для пробита и для логита.

Результативная переменная у в нормальной линейной модели регрессии является непрерывной величиной, способной принимать любые значения из заданного множества. Но помимо нормальных линейных моделей регрессии существуют модели регрессии, в которых переменная у должна принимать определённый узкий круг заранее заданных значений.

Моделью бинарного выбора называется модель регрессии, в которой результативная переменная может принимать только узкий круг заранее заданных значений.

В качестве примеров бинарных результативных переменных можно привести:

Ответы на экзаменационные билеты по эконометрике

Приведенные в качестве примеров бинарные переменные являются дискретными величинами. Бинарная непрерывная величина задаётся следующим образом:

Если стоит задача построения модели регрессии, включающей результативную бинарную переменную, то прогнозные значения уiпрогноз, полученные с помощью данной модели, будут выходить за пределы интервала [0;+1] и не будут поддаваться интерпретации. В этом случае задача построения модели регрессии формулируется не как предсказание конкретных значений бинарной переменной, а как предсказание непрерывной переменной, значения которой заключаются в интервале [0;+1].

Решением данной задачи будет являться кривая, удовлетворяющая следующим трём свойствам:

Данным трём свойствам удовлетворяет функция распределения вероятности.

Модель парной регрессии с результативной бинарной переменной с помощью функции распределения вероятности можно представить в следующем виде:

Где рrоb(уi=1) – это вероятность того, что результативная переменная уi примет значение, равное единице.

В этом случае прогнозные значения уiпрогноз, полученные с помощью данной модели, будут лежать в пределах интервала [0;+1].

Модель бинарного выбора может быть представлена с помощью скрытой или латентной переменной следующим образом:

Ответы на экзаменационные билеты по эконометрике

Векторная форма модели бинарного выбора с латентной переменной:

В данном случае результативная бинарная переменная уi принимает значения в зависимости от латентной переменной уi*:

Модель бинарного выбора называется пробит-моделью или пробит-регрессией (рrоbit rеgrеssiоn), если она удовлетворяет двум условиям:

1) остатки модели бинарного выбора εi являются случайными нормально распределёнными величинами;

2) функция распределения вероятностей является нормальной вероятностной функцией.

Пробит-регрессия может быть представлена с помощью выражения:

Где – это нормальная вероятность (nоrmаl рrоbаbilitу).

Модель бинарного выбора называется логит-моделью или логит-регрессией (lоgit rеgrеssiоn), если случайные остатки εi подчиняются логистическому закону распределения.

Логит-регрессия может быть представлена с помощью выражения:

Ответы на экзаменационные билеты по эконометрике

Данная модель логит-регрессии характеризуется тем, что при любых значениях факторных переменных и коэффициентов регрессии, значения результативной переменной уi будут всегда лежать в интервале [0;+1].

Обобщённый вид модели логит-регрессии:

Ответы на экзаменационные билеты по эконометрике

Достоинством данной модели является то, что результативная переменная уi может произвольно меняться внутри заданного числового интервала (не только от нуля до плюс единицы).

Логит-регрессия относится к классу функций, которые можно привести к линейному виду. Это осуществляется с помощью преобразования, носящего название логистического или логит преобразования, которое можно проиллюстрировать на примере преобразования обычной вероятности р:

Качество построенной логит-регрессии или пробит-регрессии характеризуется с помощью псевдо коэффициента детерминации, который рассчитывается по формуле:

Ответы на экзаменационные билеты по эконометрике

Если значение данного коэффициента близко к единице, то модель регрессии считается адекватной реальным данным.


В работе представлен эконометрический анализ дефолта российских банков в период с 2006 – 2011 гг. Целью исследования является выявление показателей деятельности банков, которые могут оказывать влияние на подверженность банка риску банкротства. В работе построены эконометрические модели бинарного выбора, на основе балансовых отчетов банков, оценивающие вероятность банкротства кредитной организации с временным горизонтом 2 года. Модельные вероятности могут быть использованы для мониторинга текущей надежности банков и использованы для создания системы раннего предупреждения.

Ключевые слов а: банки, дефолт, оценка риска, эконометрические модели.

Введение. Проблема оценки и управления рисками присутствует во всех секторах экономики, особенно актуальной она является для банковского сектора, играющего значительную роль в развитии страны и обеспечении экономического роста. Задача оценки банковских рисков особенно важна для стран с переходной экономикой, в связи с тем, что и банки и надзорные органы не имеют опыта функционирования в условиях рыночной экономики.

Дистанционный анализ, основанный на анализе банковской деятельности по ежеквартальным и годовым отчетам, позволяет установить проблемные банки, чье финансовое состояние является нестабильным. Дистанционные методы не дают однозначной характеристики надежности того или иного банка, но могут существенно сократить затраты надзорных органов и повысить эффективность их работы. Это связано с тем, что в первую очередь могут проверяться потенциально ненадежные банки, чтобы предупредить их несостоятельность, а затем остальные, что повышает стабильность функционирования банковской системы в целом. Дистанционные методы активно используется регуляторами США и европейских стран, опыт которых подтверждает эффективность и необходимость дистанционного мониторинга.

Подобные методы могут применяться и самими банками в качестве системы внутренних рейтингов для оценки надежности контрагента, также дистанционные методы анализа могут использоваться крупными компаниями для мониторинга финансового состояния банка-партнера.

Теоретическое описание моделей бинарного выбора. Для создания моделей эффективных моделей банкротства и рейтингов необходим высокоточный и гибкий инструментарий. Эконометрические методы с положительной стороны зарекомендовали себя в современных условиях и на практике доказали свое превосходство над другими методами. Для нас будут интересны два типа моделей: выбор из двух альтернатив (для модели банкротства) и выбор из нескольких альтернатив (для модели рейтингов). Когда существует всего две альтернативы, то результат наблюдения описывается переменной, принимающей два значения (обычно 0 или 1), такая переменная называется бинарной. В случае, когда имеется больше возможностей, чем две, каждую существующую альтернативу можно представить в виде переменной, принимающей значения 1,…. i (при наличии i альтернатив соответственно). В случаях, когда переменные не могут быть упорядочены естественным образом, они называются номинальными и нумеруются произвольно. Если альтернативы упорядочены, то выбор является ранжированным, а зависимая переменная называется ранговой.

Необходимо отметить, что метод наименьших квадратов хоть и может быть применен к моделям с дискретной переменной, не приводит к получению содержательных результатов, как в случае с линейной регрессией, где зависимая переменная может принимать любые значения.

В случае, когда зависимая переменная является дискретной, оценки пол ученные методом наименьших квадратов не поддаются интерпретации, т.к. переход от альтернативы к альтернативе не всегда эквивалентен друг другу. Если зависимая переменная является номинальной, то результаты оценивания становятся и вовсе бессмысленными, т.к. альтернативы пронумерованы произвольно. Стандартная регрессионная схема не применима в случаях изучения номинальных эндогенных переменных.

Перейдем к непосредственному описанию моделей, необходимо отметить, что м одели множественного выбора могут быть сведены к моделям бинарного выбора или исследованы аналогичными методами.

Изучим модель бинарного выбора на примере, который будет исследован в данной работе. Пусть зависимая переменная live может принимать два значения: 0 или 1. Будем считать, что когда банк является банкротом на момент времени t , переменная live равна 0, в случае, если банк продолжает функционировать, переменной live присваивается значение равное 1. На вероятность банкротства такого сложного финансового института, как банк оказывает значение множество факторов, как на микро-, так и на макро-уровне. Все эти факторы имеют количественную характеристику, соответственно набор этих характеристик можно представить в качестве многомерного вектора х=(х 1 ,х 2 ……,х k )' .

Разумеется, мы не можем учесть все факторы, влияющие на деятельность банка, поэтому на вероятность банкротства будут оказывать влияние и неучтенные факторы.

Первый класс моделей, которые будут рассмотрены – линейные модели вероятности.

Рассмотрим линейную модель регрессии:

Где, t – номер наблюдения, β=(β 1 ,β 2 ,…β k ) ' – набор неизвестных коэффициентов, ε t – случайная ошибка, таким образом, мы имеем:

Модель ( 1) можно переписать в виде:

Полученная нами модель, называется линейной моделью вероятности. Она обладает рядом особенностей, которые не позволяют применять метод наименьших квадратов для прогнозирования и оценивания коэффициентов β . Из формулы (1) мы видим, что ошибка в каждом наблюдении может принимать два значения: с вероятностью и с вероятностью 1- . Данный факт не позволяет считать ошибку нормально распределенной величиной, соответственно дисперсия ошибки равна и зависит от x t , что указывает на гетероскедастичность модели. Основным недостатком линейной модели является то, что прогнозные значения вероятностей могут лежать вне отрезка [0;1], что не поддается разумному объяснению и логической интерпретации. Соответственно практическая применимость линейных моделей значительно ограничена. Недостаток линейной модели выражается в линейной зависимости между вероятностью и коэффициентом β , данная проблема решается в реализации logit - и probit -моделей. Проблема зависимости от β можно решить следующим образом: , (3)

где F ( z ) – функция, область значений которой лежит на отрезке [0;1], при этом в качестве F ( z ) можно использовать функцию распределения некоторой случайной величины.

Уравнение ( 3) можно переписать следующим образом:

где ошибки независимы и одинаково распределены с нулевым математическим ожиданием и дисперсией . Пусть F ( z ) – функция распределения нормированной случайной ошибки . Решение о том, является ли значение либо 0, принимается на основании заранее установленного порогового значения. Так, например, если вероятность банкротства банка равна 40%, при установленном пороговом значении 30%, то банк будет отнесен к банкротам и значение переменной будет равно 0.

В качестве функции F ( z ) в основном используются два типа функций:

функция нормального распределения:

, тогда модель называется probit -моделью;

функция логистического распределения:

, тогда модель называется logit -моделью.

Для оценивания параметров β модели (3) используется метод максимального правдоподобия. При предположении, что оцениваемые наблюдения независимы и могут принимать всего два значения 0 и 1, тогда функция правдоподобия имеет следующий вид: (5)

Откуда следует, что , логарифмируя полученное, получаем: . (6)

Дифференцируя ( 6) по β переходим к векторному уравнению правдоподобия:

где p ( z ) – плотность функции распределения F ( z ) , для логистического распределения уравнение (7) принимает вид:

Функция правдоподобия l дает оценку правдоподобия набора параметров β . При оценивании качества модели необходимо обращать, прежде всего, внимание на значимость коэффициентов, также на статистические критерии (Акаике, Шварца), логарифм функции правдоподобия и в последнюю очередь на R 2 Макфаддена ( McFudden R 2 ), который не достигает таких высоких значений, как при обычной линейной регрессии. Это связано с тем, что объясняемая переменная live принимает всего два значения 0 и 1, а в качестве оценки мы получаем вероятность, которая лежит на промежутке [0;1].

Обзор научных работ по моделированию риска дефолта. В данном разделе будут рассмотрены и классифицированы различные направления работ по дистанционному анализу предприятий для оценки кредитного риска.

Можно выделить четыре основных подхода:

1. Построение эконометрической модели надежности (прогноза дефолта);

2. Построение эконометрической модели рейтингов;

3. Построение эконометрической модели процентных ставок;

4. Построение эконометрической модели оценки эффективности по издержкам.

Среди вышеперечисленных направлений нас будут интересовать модели прогноза дефолта . Это связано с тем, что данные построения моделей процентных ставок и моделей эффективности не могут быть систематизированы в короткий период времени, что уменьшает практическую применимость моделей. Перейдем к рассмотрению работ, посвященных моделированию дефолта и рейтинга.

Призвание эконометрического подхода в оценке вероятности дефолта – создание систем раннего предупреждения ( Early Warning Systems , EWS ). EWS необходимы для предупреждения о потенциальных проблемах, которые могут возникнуть в будущем, на основе анализа текущего положения предприятия.

Легко заметить, что метод дискриминантного анализа практически не применяется последние годы. Преимущества эконометрических моделей над моделями дискриминантного анализа в том, что они не предполагают нормального распределения финансовых индикаторов, входящих в модель, и, что является очень важным, дают ответ в виде оценки вероятности, а не бинарный ответ (дефолт/не дефолт, вероятность мала/вероятность высока).

Также есть работы, посвященные сравнению моделей дискриминантного анализа и бинарного выбора, к сожалению, не дающие однозначный ответ о превосходстве того или иного метода, так, например, Альтман ( Altman , 1994) и Ягтиани ( Jagtiani ,2003) не находят существенного различия между подходами, в то время как Леннокс ( Lennox ,1999) приходит к выводу об однозначном превосходстве моделей бинарного выбора.

Также существуют работы, использующие нестатистические методы, например, нейросети ( Coast ,1993), ( Fan ,1993), ( Jagtiani , Kollari , Shin ,2003) или рекурсивное разбиение ( Lin ,2009), ( Espahbodi ,2003). Тем не менее, при сравнении разного типа моделей на реальных данных, нестатистические методы значительно уступают эконометрическим в прогнозной силе ( Jagtiani , Kollari , Shin ,2003), ( Lin ,2009).

Помимо научных работ, которые, несомненно, имеют высокую практическую значимость, представляется целесообразным рассмотреть системы, которые были внедрены в банковскую систему для выполнения надзорных функций. Одной из таких систем является система CAMELS , которая в настоящий момент работает дистанционно. Система оценивает большое количество параметров банковской деятельности и сравнивает их значениями, которые установлены как базовые. Важным фактом является то, что система не является прогнозной, а идентифицирует банки, которые требуют немедленного вмешательства и проверок. Система использует 6 факторов: капитал, качество активов, доходы, качество управления, уровень ликвидности и чувствительность к рыночным рискам ( Capital , Assets , Management , Earnings , Liquidity , Sensitivity ), по которым выставляются оценки по пятибалльной шкале в обратном порядке, т.е. оценка 1 является лучшей, а 5 – худшей. Рейтинг является агрегированной оценкой текущей деятельности банка, в каждый фактор входит набор показателей, для каждого из которых существуют нормативные значения, с которыми и производятся сравнения.

Подобного рода система принята Банком Англии ( RATE ), цель которой – определять проблемные точки в банке, также как и в CAMEL , по набору критериев выставляются баллы, а затем банки разбиваются на группы, требующие или не требующие вмешательства.

В США существуют и активно используются две статистических модели : SEER (System of Estimating Examination Ratings) и SCOR (Statistical CAMELS Off-site Rating). Система SCOR появилась в конце 1990-х, как ответ на волну дефолтов банков США после 1989 года. Целью создателей было разбиение банков на группы благополучных и требующих вмешательства. Точность прогнозов системы оценивалась через вероятность ошибок 1и 2 рода (ошибка 1 рода – ситуация, при которой проблемный банк ошибочно принимается за благополучный, ошибка 2 рода – иначе). Начальный набор показателей определялся после агрегирования рекомендаций экспертов, затем показатели оценивались статистически и только при условии их значимости попадали в модель.

Система SEER работает по схожему принципу, однако совмещает в себе две эконометрических модели: модель упорядоченного выбора для прогноза значения рейтинга по системе С AMELS и модель бинарного выбора для прогнозирования снижения рейтинга по системе CAMELS с 1 и 2 уровня до 3-5 уровней.

Проблемой мешающей повсеместному внедрению эконометрических моделей является недостаток данных о дефолтах, а в ряде развитых стран (европейских странах, Канаде и др.) и вовсе нет достаточного количества банков для оценки параметров модели.

Построение ЭКМ моделей оценки дефолта. Статистическим источником для создания базы данных по дефолтам, по которой строилась модель, является Банк России, с официального сайта которого производился сбор данных. Как уже говорилось выше, построение эконометрических моделей дефолта – серьезно проработанная тема, в которою непросто привнести что-то новое. Кроме того, исследователи Российской Экономической Школы ( NES ) посвятили целый цикл статей данной теме (Пересецкий, Головань, 2004,2007,2008,2009), постоянно дорабатывали ранее полученные модели, также им удалось учесть макроэкономические переменные для объяснения влияния окружения на деятельность банков. Тем не менее, все вышеназванные работы направлены на изучение структуры капитала банков, нормативов ликвидности и резервирования. Данная работа ставит вопрос о возможности прогнозирования дефолта банков по анализу структуры их доходов и расходов (форма №102), также в работе будет использован ряд показателей не задействованных ранее.

Также чрезвычайной важностью обладает вопрос о возможности создании системы внутренних рейтингов для заемщиков-компаний основанной на моделировании существующих рейтингов. Для построения модели будет использован статистический пакет Eviews 6.0

Основой для исследования является модель бинарного выбора, с зависимой переменной Live , которой присваивается значение 1, если банк не является банкротом, и 0, если банк является банкротом (оценивается logit -модель).

Лицензия банка была отозвана в двухлетний период от даты отсчета,

Необходимо отметить, что из выборки были исключены ряд банков: Сбербанк, Банк Москвы, Россельхозбанк, Газпромбанк, Внешторгбанк и Внешэкономбанк, т.к. эти банки заведомо не могут обанкротиться: их поддержит государство.

На основе данных за 2005, 2006, 2007, 2008 годы будет построена устойчивая модель, на данных за 2009 год будет дан ретроспективный прогноз на 2010 и 2011 годы, который будет проверен, а на данных за 2010 год будет дан теоретический прогноз на 2011и 2012 годы.

Изначально по каждому банку имелось более 300 характеристик (от 356 до 410 в зависимости от года). На основе первичного анализа количество объясняющих переменных было сокращено до 236 (не учитывались переменные, у которых медиана либо среднее было равно нулю). Затем, с помощью процедуры пошагового отбора переменных 3 , были отобраны показатели банков, представленные в таблице 1.1 (Приложение 1). Все статьи доходов были взвешены по коду 10000 (Всего доходов), а расходы по коду 20000 (всего расходов), чтобы сравнение банков было корректным.

Читайте также: