Внешние данные для скоринга, эффективность которых подтверждена ведущими МФО

Volodymyr Lozovyi
2 min readApr 22, 2020

--

В мире есть ряд МФО и fintech компаний, которые добились значительных результатов в построении скоринговых моделей на базе альтернативных (внешних) данных о заемщиках. Я регулярно изучаю успешный опыт таких компаний и хочу поделиться последними инсайтами. В статье расскажу об опыте: Tala, Branch, LenddoEFL и CredoLab. Эти компании работают в странах Юго-Восточной Азии, Африки, Латинской Америки, а также в России и Грузии, что делает их опыт весьма актуальным и для Украины.

В Tala анализируют более 10 тыс. переменных, в Branch — более 2 тыс. переменных, а в LenddoEFL — более 12 тыс. переменных из десятков различных источников. Ниже я выделяю те из них, которые стабильно показывают высокую эффективность.

ПРИМЕРЫ ЭФФЕКТИВНЫХ ВНЕШНИХ ДАННЫХ

  • Человек, записывающий контакты по имени и фамилии в своем смартфоне, отдаст кредит с вероятностью в 16 (!) раз выше, чем владелец хаотичной контактной книги. Эту информацию подтверждают в Tala и Branch.
  • SMS-сообщения от других МФО позволяют понять каким был предыдущий кредитный опыт заемщика, а также пытается ли он взять сейчас кредит в других компаниях.
  • Другие значимые данные смартфона: регулярность звонков по одним и тем же контактам; места, где человек делает покупки (GPS); тип установленных игр и приложений.
  • Сырые данные из соцсетей (кол-во лайков, друзей, возраст) дают прирост Джини до 5 п.п., более эффективными являются агрегированные переменные. Из своего опыта могу подтвердить, что это верно и для Украины.
  • Большинство компаний использует сырые данные на этапе скрининга заявки, что позволяет отсеять заемщиков, указавших о себе недостоверную информацию. Значительную пользу дает сравнение фото заемщика с его аватаром из соцсетей (с помощью алгоритмов распознавания лица).
  • Стоит учесть кол-во друзей заемщика из соцсетей, которые вышли на просрочку. По информации Branch, данный показатель является одним из самых сильных предикторов среди всех. Более детально об этом инструменте можно прочитать в моей статье.
  • Телекомы, госреестры и платежные сервисы могут предоставлять информацию о своевременности оплаты коммунальных и телеком услуг. Данный предиктор также является одним из наиболее эффективных, о чем заявляют все вышеперечисленные компании.

Если вы еще не используете какие-либо из этих переменных в своих скоринговых моделях — уже самое время начать, так как со временем на рынке останутся только самые технологичные и эффективные компании.

Хотите следить за моими статьями?
Подписывайтесь: TG (Big data future), FB, LI.

--

--

Volodymyr Lozovyi
Volodymyr Lozovyi

Written by Volodymyr Lozovyi

Inventor, founder @Artellence. Top topics: artificial intelligence, big data, open data, fintech, public sector, politics, technologies of the future.

No responses yet