История о том, как мы создавали свою технологию распознавания лиц для МФО

В последние несколько месяцев и без того нескучная жизнь МФО стала еще веселее — теперь, при выдаче онлайн кредита, необходимо проводить фотоверификацию: сопоставлять селфи заемщика с его паспортом. Стандартных моделей, которые автоматически распознают и сверяют лица на фото, существует довольно много, однако и работать они обучены со “стандартными” фотографиями. Это не позволяет моделям учитывать особенности фото потенциальных заемщиков украинских МФО, что прямо влияет на их точность.

Создавая в Artellence свою технология распознавания лиц, таких особенностей мы обнаружили довольно много. Ниже расскажу о самых важных из них, а также поделюсь нашими решениями.

[1] КАЧЕСТВО ФОТОГРАФИЙ

Фрод, конечно, на фотографиях присутствует: заемщики загружают скан-копии чужих паспортов (чаще), делают селфи не со своими паспортами (реже) и даже присылают случайные фото вместо паспорта.

Однако, большинство подводных камней, которые влияют на точность алгоритмов распознавания лиц, лежат в двух других плоскостях:

  • заемщики делают фотографии низкого качества, с бликами, засветами, непропорционально маленьким фото паспорта на селфи;
  • также они часто показывают первый разворот паспорта, на котором им… 14-16 лет! А сравнивать внешность тинейджера и то, как она изменилась к 40 годам — та еще задача.

[2] ПОСТРОЕНИЕ МОДЕЛЕЙ

Выделить и сравнить между собой лица на качественных фотографиях — задача довольно простая и для нее уже разработано много готовых решений. Но существуют несколько важных проблем, которые популярные модели обычно не учитывают:

  • заемщики могут присылать фотографии, повернутые как горизонтально, так и вертикально, что снижает хит-рейт стандартных моделей на 40%. Чтобы повысить охват, мы создали свой алгоритм поворота фото под нужным углом;
  • блики и засветы на фотографиях (проблема чаще встречается с ламинированными id-карточками), которые “съедают” еще 10% покрытия. С этой проблемой сложно бороться на этапе обучения модели, так как данные уже потеряны, значительно проще — во время создания фото.

Решив эти проблемы, у нас получилось добиться точности алгоритмов сравнения селфи человека с паспортом в 99.7% при покрытии в 90%.

Чтобы максимизировать точность своих моделей, просите у заемщиков фото высокого разрешения; без бликов и засветов; чтобы паспорт был ближе к камере, чем лицо человека; а также открыт на развороте с наиболее актуальным фото.

[3] ПЛАНЫ ПО РАЗВИТИЮ ТЕХНОЛОГИИ

Но на этом мы не останавливаемся, ведь сравнение селфи и паспорта решает только половину задачи и никак не идентифицирует паспорта с поддельными фото. Следующей задачей, над решением которой мы в Artellence уже работаем, будет сравнение паспорта с соцсетями — ведь жизнь человека подделать намного сложнее, чем одно фото в паспорте.

С технической точки зрения, задача намного сложнее предыдущей. Хоть фотографии в соцсетях и качественные, но сделаны они в произвольных ракурсах, часто с очками или гримасами на лице.

Решение для этой проблемы, которое мы сейчас тестируем, состоит в том, чтобы сравнивать лица только по значимым для нашей задачи признакам. Например, давать “баллы сходства” за одинаковую форму носа на двух фотографиях, но не давать такие баллы, если на двух фото случайных людей широко открыт рот.

Хотите следить за моими статьями?
Подписывайтесь: TG (Big data future), FB, LI.

Inventor, founder @Artellence. Top topics: artificial intelligence, big data, open data, fintech, public sector, politics, technologies of the future.

Inventor, founder @Artellence. Top topics: artificial intelligence, big data, open data, fintech, public sector, politics, technologies of the future.