5.1. Описание бизнес-задачи
Технологии скоринга – автоматической оценке кредитоспособности физического лица – в банковской среде традиционно уделяется повышенное внимание. Сегодня можно сказать, что экспертные методы уходят в прошлое, и все чаще при разработке скоринговых моделей обращаются к алгоритмам Data Mining. Классическую скоринговую карту можно построить при помощи логистической регрессии на основе накопленной кредитной истории, применив к ней ROC-анализ для управления рисками.
Постановка задачи. В коммерческом банке имеется продукт «Нецелевой потребительский кредит»: займы предоставляются на любые цели с принятием решения за один день. В настоящее время решение о выдаче кредита принимается на основе скоринговой карты, построенной экспертным способом, с процентом отказа, равным 55%, при этом объем просроченной задолженности велик. Накоплена статистическая информация о заемщиках и качестве обслуживания ими долга за несколько месяцев. Руководство банка, понимая, что высокий уровень отказов препятствует расширению розничного бизнеса в области потребительского кредитования, поставило перед отделом розничных рисков задачу разработать новую скоринговую карту, которая позволила бы значительно сократить число отказов в выдаче и снизить сумму просроченной задолженности.
Исходные данные. Вообще говоря, информация о заемщиках – физических лицах и кредитных договорах хранится в банковской информационной системе. Там же содержатся графики и даты погашений кредита, сведения о просрочках, об их суммах, о процентах и т.д. Получить для построения скоринговой модели таблицу с параметрами заемщиков и информацию о наличии просрочек – отдельная задача. Будем считать, что она уже выполнена и результат представлен в виде текстового файла.
Важным также является вопрос о том, что понимать под параметрами заемщика. Здесь уместно обратиться к методическим аспектам подготовки и сбора данных для анализа, и вспомнить, что на этом этапе требуется активное взаимодействие с экспертами: они с высоты своего опыта ограничат круг входных переменных, которые потенциально могут влиять на кредитоспособность будущего заемщика. Кроме того, следует учитывать аспекты бизнеса и технические вопросы (например, сложно проверить в короткий срок достоверность признака «Сфера деятельности компании», а потому полагаться на него не стоит).
Скоринговые карты часто строятся на категориальных переменных, и для этого непрерывные признаки квантуются при помощи ручного выбора точек разрыва (или полуручного, см., например, «Тест Чоу»). Скажем, переменная Стаж работы разбивается на три категории: «до 1 года», «от 1 до 3 лет», «свыше 3 лет». Такую модель легче интерпретировать, но она менее гибкая при моделировании связей: горизонтальные «ступени» дают плохую аппроксимацию при наличии частых крутых «склонов».
В банковской практике перед скорингом заемщик, как правило, проходит процедуру андеррайтинга – проверку на удовлетворение жестким требованиям: соответствие возрасту, отсутствие криминального прошлого и, конечно, наличие определенного дохода. При этом выдвигаются требования к минимальному уровню дохода, и рассчитывается возможный лимит кредита. При его расчете участвует один из двух коэффициентов – П/Д либо О/Д.
Коэффициент «Платеж/Доход» (П/Д) – отношение ежемесячных платежей по кредиту заемщика к его доходу за тот же период. Считается, что значительная величина этого коэффициента (свыше 40%) свидетельствует о повышенном риске как для кредитора, так и для заемщика.
Коэффициент «Обязательства/Доход» (О/Д) – отношение ежемесячных обязательств заемщика к его доходу за тот же период с учетом удержаний налогов. В обязательства включаются расходы, связанные с выплатой планируемого кредита, а также имеющиеся другие долгосрочные обязательства (выплаты по иным кредитам, на содержание иждивенцев, семьи, алиментов, обязательные налоговые платежи и пр.). Считается, что размер ежемесячных обязательств заемщика не должен превышать 50-60% его совокупного чистого дохода.
Заявки клиентов, не прошедшие андеррайтинг, получат отказ и даже не попадут на скоринг. Поэтому на вход скоринговой процедуры выгоднее подавать не доход клиента, а отношение О/Д или П/Д.
В нашей задаче представлено 2709 кредитов (файл loans.txt) с известными исходами платежей на протяжении нескольких месяцев после выдачи кредита.
В табл. 5.1 отображены структура и описание полей текстового файла с кредитными историями.
Таблица 5.1. Данные по заемщикам и качеству обслуживания ими долга
Поле | Описание | Тип |
Код | Служебный код заявки | Целый |
Дата | Дата выдачи кредита | Дата/время |
О/Д, % | Коэффициент О/Д («Обязательства/Доход») в % | Вещественный |
Возраст | Возраст заемщика (полных лет) на момент принятия решения о выдаче кредита | Целый |
Проживание | Основание для проживания: собственник; муниципальное жилье; аренда | Строковый |
Срок проживания в регионе | Менее 1 года; от 1 года до 5 лет; свыше 5 лет | Строковый |
Семейное положение | Холост/не замужем; женат/замужем; разведена/вдовство; другое | Строковый |
Образование | Среднее; среднее специальное; высшее | Строковый |
Стаж работы на последнем месте | Менее 1 года; от 1 года до 3 лет; свыше 3 лет | Строковый |
Уровень должности | Сотрудник; руководитель среднего звена; руководитель высшего звена | Строковый |
Кредитная история | Информация берется из бюро кредитных историй. Если имеется негативная информация о клиенте (просрочки по прошлым кредитам), то ему присваивается категория «отрицательная» | Строковый |
- 1. Аналитическая платформа Deductor
- 1.1. Развитие и назначение Deductor
- 1.2. Общие сведения о Deductor
- 1.3. Категории пользователей Deductor
- 1.4. Аналитические технологии, реализованные в Deductor
- 1.5. Установка Deductor
- 2. Консолидация данных и отчетность аптечной сети
- 2.1. Описание бизнес-задачи
- 2.2. Deductor Warehouse
- 2.3. Проектирование хранилища «Фармация»
- 2.4. Создание хранилища
- 2.5. Наполнение хранилища данных
- 2.6. Срезы из хранилища данных и olap-кубы
- 3. Ассоциативные правила в стимулировании розничных продаж
- 3.1. Описание бизнес-задачи
- 3.2. Выявление ассоциаций
- 3.3. Интерпретация ассоциативных правил
- 4. Сегментация клиентов телекоммуникационной компании
- 4.1. Описание бизнес-задачи
- 4.2. Решение задачи
- 5. Скоринговая карта для оценки кредитоспособности заемщиков
- 5.1. Описание бизнес-задачи
- 5.2. Решение задачи