реферат бесплатно, курсовые работы
 

Анализ кредитоспособности физических лиц на примере ЗАО "Банк Русский Стандарт"

Данные приложения 7 и диаграммы на рис.6 показывают, что основную долю в ссудной задолженности занимают обесцененные кредиты.

Рисунок 9 - Последовательность прохождения анкеты заемщика через службы банка

В ряде случаев предпочтительно создание хранилища данных, в котором содержатся консолидированная информация по заявкам с анкетами заемщиков и истории принятия решений по выданным кредитам и погашениям кредитов. Это позволит сосредоточить информацию о потребительском кредитовании в едином источнике и снизить нагрузку на оперативную базу данных.

Рисуно 10 - Схема работы с хранилищем данных

Как вариант, в хранилище данных может накапливаться статистическая информация макроэкономического характера об уровне жизни в регионе, средней заработной плате, прожиточном минимуме и т.д. с целью повышения качества скоринговых моделей.

Кейс комплектуется встроенным хранилищем данных Deductor Warehouse на базе свободно распространяемой клиент-серверной СУБД Firebird. Таким образом, как показано на рисунке 11 минимальная структура хранилища данных будет состоять из трех процессов (кубов): Заявки, Статусы, Погашения.

Рисунок 11 - Структура хранилища данных

Базовый генератор представляет собой генератор кредитных историй - специальный модуль, формирующий набор примеров с различными анкетными портретами заемщиков. Генерация производится по специальным алгоритмам математической статистики с учетом заданных распределений случайных величин. В качестве распределений могут использоваться как статистические данные по стране, так и экспертные суждения о том, у какого типа заемщиков будет пользоваться популярностью кредитная программа [20, c. 89].

Искусственная кредитная история необходима в случае, когда реальной кредитной истории не существует, либо ее объем незначителен. Это возникает в случаях, когда:

1) Банк впервые выходит на рынок потребительского кредитования;

2) Банк открывает новую кредитную программу с условиями, отличающимися от прежних программ (сумма кредита, требования поручительства и т.п.). В этом случае могут появиться или исчезнуть часть входных факторов, и ранее построенная скоринговая модель окажется неприменимой в новых условиях.

Для генерации кредитных историй используется структура анкеты заемщика. В результате работы базового генератора формирует таблицу со столбцами - входными факторами из анкеты заемщика, влияющих на принятие решения о выдаче кредита. Гипотеза о влиянии тех или иных факторов выдвигается, как правило, экспертами банка.

Рисунок 12 - Генерация кредитных историй

После генерации кредитной истории эксперты банка проставляют в графу "Давать кредит" свое решение. Минимальное количество прецедентов в кредитной истории, которые должны обработать специалисты банка во многом зависит от числа столбцов, специфики кредитной программы, но в среднем оно составляет от 500 до 1000 примеров [36, c. 11].

Использование подхода с искусственной кредитной историей в кейсе имеет как плюсы, так и минусы.

Плюсы:

1) Возможность быстрого построения полноценной скоринговой модели с использованием технологий Data Mining;

2) Экспертные оценки по искусственной кредитной истории аккумулируют в себе меру риска, на который готов пойти банк при выдаче кредита;

3) Формат искусственной кредитной истории совпадает с форматом реальной кредитной истории, поэтому никаких перенастроек при запуске кредитной программы в действие не требуется.

Недостатком является субъективность оценок при классификации заемщиков экспертами банка. По мере появления реальных данных по выдаваемым кредитам скоринговые модели будут перестраиваться, и субъективность снизится.

После формирования кредитной истории начинается построение скоринг - моделей. Этот процесс носит итеративный характер, в ходе которого устраняются противоречия, корректируются правила (в случае модели в виде дерева решений), в результате чего скоринговая модель утверждается.

Для построения скоринговых моделей используются самообучающиеся методы на основе технологии извлечения знаний Data Mining. Эти технологии используют последние мировые достижения в области интеллектуальной обработки информации, что в несколько раз эффективнее использования классических балльных скоринговых методик [37, c. 15].

Рисунок 13 - Процесс построения скоринговых моделей

Нейронные сети являются мощным инструментом для выявления нелинейных зависимостей между входными и выходными факторами и позволяют дополнить скоринг моделью оценки вероятности возврата кредита тем или иным заемщиком.

В конечном итоге это позволяет:

1) Отделить работу эксперта от массового использования построенных моделей;

2) Снизить требования к персоналу;

3) Формализовать работу при принятии решений;

4) Уменьшить зависимость от персонала;

5) Повысить качество работы.

Как было отмечено выше, система позволяет изменить или расширить базовую схему прохождения анкеты. Рассмотрим несколько стандартных вариантов схем прохождения анкет.

В первой, наиболее простой схеме, анкета последовательно проходит через все службы банка: служба безопасности, скоринговая модель, кредитный отдел, как показано на рисунке 14.

Рисунок 14 - Схема работы - последовательная обработка анкет

Из плюсов у данной схемы можно отметить простоту. Однако простота влечет за собой определенные недостатки:

1) Служба безопасности выполняет лишнюю работу, проверяя потенциальных заемщиков, которые изначально не "проходят" по скорингу.

2) Кредитный отдел всегда подтверждает скоринг-модель, поэтому автоматическая оценка риска как таковая отсутствует. Как правило, это делается, когда доверие к скоринг-модели невысокое.

Второй вариант схемы избавлен от вышеназванных недостатков. Во-первых, служба безопасности проверяет только тех заемщиков, которые успешно прошли автоматический скоринг. Во-вторых, для снижения нагрузки на кредитный отдел и частичной автоматизации принятия решений в схеме вводится "коэффициент доверия" Kd - некоторый числовой параметр, характеризующий степень доверия к скоринг-модели. Анкеты, удовлетворяющие этому критерию, не попадают на рассмотрение в кредитный отдел [41].

Рисунок 15 - Схема работы - улучшенный вариант обработки анкет

Раскроем сущность коэффициента доверия на примере скоринг-модели дерева решений. Как известно, каждое правило в дереве решений характеризуется двумя параметрами - поддержкой и достоверностью.

1) Поддержка - общее количество примеров, классифицированных данным узлом дерева.

2) Достоверность - количество правильно классифицированных, данным узлом примеров.

Например, для правила, если Доход личный > 5820 тогда давать кредит = «Да» значение поддержки равно 20%, достоверности - 94%. Это трактуется следующим образом: в обучающем множестве кредитной истории было 20% примеров, удовлетворяющих данному правилу (т.е. Доход личный больше 5820), и в 94% случаев заемщику было вынесено положительное решение о выдаче кредита.

Разделим все правила дерева решений по поддержке и достоверности на некоторые классы ("низкая", "средняя", "высокая" и т.д.) согласно специальной экспертной шкале. Конкретная экспертная шкала сильно зависит от количества обучающих примеров и узлов дерева решений и собственно аккумулирует в себе коэффициент доверия. Тогда поступающие заявки на получение кредита, имеющие, как вариант, среднюю и высокую категорию поддержки и достоверности правила скоринг-модели, не будут получать дополнительное подтверждение в кредитном отделе (такие правила обведены в таблице красным).

Такой вариант схемы более предпочтителен, поскольку позволит максимально разгрузить службу безопасности и кредитные отделы, частично автоматизировать оценку анкет заемщиков, сократить сроки рассмотрения заявок.

Модуль интеграции с автоматизированной банковской системой (АБС) необходим для полной автоматизации выдачи потребительских кредитов. Из оперативной базы данных в АБС передается необходимая информация для заведения нового физического лица, формирования кредитной заявки и кредитного договора [42].

Рисунок 16 - Значимость правил

Практически сразу после появления первых данных о выдаваемых кредитах становится доступным проводить анализ на основе OLAP-отчетности. Базовая отчетность включает 4 группы отчетов:

1) Динамика потребительского кредитования;

2) Социально-экономические портреты лиц, обратившихся за кредитами;

3) Анализ длительности рассмотрения заявок;

4) Ретроспективный анализ погашений кредитов.

Отчетность представляет собой набор многомерных таблиц, кросс-диаграмм и графиков. Для ее просмотра используется Deductor Viewer.

Динамика потребительского кредитования позволяет проанализировать суммы выданных кредитов в разрезе дней и торговых отделов, пики обращений по часам и дням недели, процент отказов службы безопасности и кредитного отдела и другое, что показано на рисунках 17,18,19.

Рисунок 17 - Аналитическая отчетность

Рисунок 18 - Распределение по времени (рисунок переделать в ексель)

Рисунок 19 - Распределение по дням недели

Рисунок 20 - Причины отказа в выдаче (переделать в ексель)

Отчеты "Социально-экономические портреты лиц, обратившихся за кредитами" позволяют получить ответы на следующие вопросы:

1) Какие размеры ссуд пользуются наибольшим спросом?

2) С каким личным доходом чаще обращаются за кредитом?

3) Распределение по полу, возрасту, социальному статусу, образованию и т.д.

А так же выявить размер кредита который чаще всего запрашивают заемщики, как и показано на рисунке 21.

Рисунок 21 - Распределение по размеру кредита

Отчеты "Анализ длительности рассмотрения анкет" позволяют осуществлять мониторинг эффективности работы подразделений банка, участвующих в принятии решений о выдаче кредитов, находить "узкие" места в цепочке прохождения заявок.

Ретроспективный анализ погашений кредитов необходим для регулярной перенастройки скоринговых моделей. Для этой цели по определенной шкале заемщики делятся на несколько классов, как правило 2-3 класса, в зависимости от того, выплачен ли кредит и не было ли просрочек. Отчет по ретроспективному анализу может представлять собой динамику изменения некоторого показателя, выражающего агрегированную величину уровня просрочек на заданную дату. Ретроспективный анализ не заменяет, а дополняет оперативный анализ погашений кредитов, доступный в АБС [39, c. 18].

В заключение подчеркнем основные преимущества описанного решения:

1) Возможность комбинировать любые механизмы анализа от простых бальных коэффициентов до самых современных алгоритмов оценки рисков.

2) Возможность построения различных сценариев обработки для разных категорий клиентов.

3) Гибкость. Система включает в себя специальный конструктор анкет, позволяющий на базе единой системы создавать различные кредитные продукты: потребительское кредитование, автокретитование, ипотечное кредитование и прочее.

Серьезная методическая поддержка. C кейсом поставляется большой набор методических материалов, руководств, учебных курсов. В методических материалах даются подробные описания всех аспектов работ, связанных с анализом данных, от сбора и подготовки данных и используемого математического аппарата до способов тиражирования полученных знаний.

Быстрый запуск. "Пилотный" проект с возможностью реального использования выполняется в течение нескольких (5-7) недель. Первые результаты демонстрируются через 3-4 недели после начала работ.

Возможность запуска системы при отсутствии реальной кредитной истории. Предлагается методика, позволяющая строить модели на сгенерированных данных с последующей автоматической адаптацией моделей при получении реальных данных по выданным кредитам.

Доступная цена. Никакие ежегодные отчисления не предусмотрены [38, c. 30].

Для адаптации скоринговой модели оценки кредитоспособности физических лиц специалисту необходимо проделывать путь, подобный тому, что проделал Дюран, т. е. специалисты, которые будут заниматься такой адаптацией, должны быть высоко квалифицированными, а значит и очень высокооплачиваемые, быть в состоянии оценить текущую ситуацию на рынке.

Итак, основные недостатки скоринговой системы оценки кредитоспособности физических лиц - это:

1. Высокая стоимость адаптации используемой модели под текущее положение дел;

2. Большая вероятность ошибки модели при определении кредитоспособности потенциального заемщика, обусловленная субъективным мнением специалиста.

Для решения проблем скоринговой системы предлагаю дальше рассмотреть деревья решений, которые помогут устранить некоторые недостатки скоринговой системы.

3.2 Деревья решений как вариант устранения недостатков скоринговой системы

Одним из способов решить проблемы скоринговой системы в ЗАО «Банк Русский Стандарт» это деревья решений, которые строят скоринг-модель в виде правил, и модель получается интуитивно понятной и прозрачной. При этом дерево решений способно перестраиваться при добавлении новых примеров, игнорировать несущественные признаки. Кроме того, предусмотрена ручная корректировка правил для исправления противоречий. Можно привести давно всем известную цепочку связанных событий: чем меньше рискует банк при предоставлении кредита, тем меньше процентная ставка, предлагаемая этим банком; чем меньше процентная ставка, тем больше клиентов обратится именно в этот банк; чем больше клиентов обратится в банк, тем большую прибыль получит банк, а это одна из основных целей коммерческой деятельности. Риск, связанный с не возвратом суммы основного долга и процентов, можно значительно снизить, оценивая вероятность возврата заемщиком кредита [41].

При кредитовании физических лиц характерны небольшие размеры ссуд, что порождает большой объем работы по их оформлению и достаточно дорогостоящая процедура оценки кредитоспособности относительно получаемой в результате прибыли. Для оценки кредитоспособности физических лиц банку необходимо оценить как финансовое положение заемщика, так и его личные качества. При этом кредитный риск складывается из риска не возврата основной суммы долга и процентов по этой сумме. Сейчас для оценки риска кредитования заемщика используется скоринг кредитование. Сущность этой методики состоит в том, что каждый фактор, характеризующий заемщика, имеет свою количественную оценку. Суммируя полученные баллы, можно получить оценку кредитоспособности физического лица. Каждый параметр имеет максимально возможный порог, который выше для важных вопросов и ниже для второстепенных. На сегодняшний день известно достаточно много методик кредитного скоринга. Одной из самых известных является модель Дюрана. Дюран выявил группы факторов, позволяющих максимально определить степень кредитного риска. Также он определил коэффициенты для различных факторов, характеризующих кредитоспособность физического лица:

1. Пол: женский (0.40), мужской (0)

2. Возраст: 0.1 балл за каждый год свыше 20 лет, но не более чем 0.30

3. Срок проживания в данной местности: 0.042 за каждый год, но не более чем 0.42

4. Профессия: 0.55 - за профессию с низким риском; 0 - за профессию с высоким риском; 0.16 - другие профессии

5. Финансовые показатели: наличие банковского счета - 0.45; наличие недвижимости - 0.35; наличие полиса по страхованию - 0.19

6. Работа: 0.21 - предприятия в общественной отрасли, 0 - другие

7. Занятость: 0.059 - за каждый год работы на данном предприятии

Также он определил порог, перейдя который, человек считался кредитоспособным. Этот порог равен 1.25, т. е. если набранная сумма баллов больше или равна 1.25, то потенциальному заемщику выдается испрашиваемая им сумма [31, c. 3].

Одним из вариантов решения выше поставленной задачи является применение алгоритмов, решающих задачи классификации. Задача классификации - это задача отнесения какого-либо объекта (потенциальный заемщик) к одному из заранее известных классов (Давать/Не давать кредит). Такого рода задачи с большим успехом решаются одним из методов Data Mining - при помощи деревьев решений. Деревья решений - один из методов автоматического анализа данных. Получаемая модель - это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение. Пример дерева приведен на рисунке 22

Рисунок 22 - Пример дерева решений

Сущность этого метода заключается в следующем:

1. На основе данных за прошлые периоды строится дерево. При этом класс каждой из ситуаций, на основе которых строится дерево, заранее известен. В нашем случае должно быть известно, была ли возвращена основная сумма долга и проценты, и не было ли просрочек в платежах. При построении дерева все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам, которые в свою очередь также могут быть разбиты на дочерние узлы. Критерий разбиения - это различные значения какого-либо входного фактора. Для определения поля, по которому будет происходить разбиение, используется показатель, называемый энтропия - мера неопределенности. Выбирается то поле, при разбиении по которому устраняется больше неопределенности. Неопределенность тем выше, чем больше примесей (объектов, относящихся к различным классам) находятся в одном узле. Энтропия равна нулю, если в узле будут находиться объекты, относящиеся к одному классу.

2. Полученную модель используют при определении класса (Давать/Не давать кредит) вновь возникших ситуаций (поступила заявка на получение кредита).

3. При существенном изменении текущей ситуации на рынке, дерево можно перестроить, т.е. адаптировать к существующей обстановке.

Практический пример:

Для демонстрации подобной технологии в качестве исходных данных была взята выборка, состоящая из 1000 записей, где каждая запись - это описание характеристик заемщика и параметр, описывающий его поведение во время погашения ссуды. При обучении дерева использовались следующие факторы, определяющие заемщика: "N Паспорта"; "ФИО"; "Адрес"; "Размер ссуды"; "Срок ссуды"; "Цель ссуды"; "Среднемесячный доход"; "Среднемесячный расход"; "Основное направление расходов"; "Наличие недвижимости"; "Наличие автотранспорта"; "Наличие банковского счета"; "Наличие страховки"; "Название организации"; "Отраслевая принадлежность предприятия"; "Срок работы на данном предприятии"; "Направление деятельности заемщика"; "Срок работы на данном направлении"; "Пол"; "Семейное положение"; "Количество лет"; "Количество иждивенцев"; "Срок проживания в данной местности"; "Обеспеченность займа"; "Давать кредит". При этом поля: "N Паспорта", "ФИО", "Адрес", "Название организации" определены алгоритмом уже до начала построения дерева решений как непригодные по причине практической уникальности каждого из значений.

Целевым полем является поле "Давать кредит", принимающий значения "Да" и "Нет". Эти значения можно интерпретировать следующим образом: "Нет" - плотильщик либо сильно просрочил с платежами, либо не вернул часть денег, "Да" - противоположность "Нет"

Анализируя полученное дерево решений, можно сказать следующее:

1. При помощи дерева решений можно проводить анализ значащих факторов. Такое возможно благодаря тому, что при определении параметра на каждом уровне иерархии, по которому происходит разделение на дочерние узлы, используется критерий наибольшего устранения неопределенности. Таким образом, более значимые факторы, по которым проводится классификация, находятся на более близком расстоянии (глубине) от корня дерева, чем менее значимые. Например, фактор "Обеспеченность займа" более значим, чем фактор "Срок проживания в данной местности". А фактор "Основное направление расходов" значим только в сочетании с другими факторами. Еще одним интересным примером значимости различных факторов служит отсутствие в построенном дереве параметра "Наличие автотранспорта", что говорит о том, что на сегодняшний день это наличие не является определяющим при оценке кредитоспособности физического лица.

2. Можно заметить, что такие показатели как "Размер ссуды", "Срок ссуды", "Среднемесячный доход" и "Среднемесячный расход" вообще отсутствуют в полученном дереве. Данный факт можно объяснить тем, что в исходных данных присутствует такой показатель как "Обеспеченность займа", и т.к. этот фактор является точным обобщением 4 вышеописанных показателей, алгоритм построения дерева решений выбрал именно его.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11


ИНТЕРЕСНОЕ



© 2009 Все права защищены.