Как устроена работа новой Cambridge Analytica — Hawkfish изнутри

Volodymyr Lozovyi
4 min readMar 1, 2020

В канун католического Рождества CNBC опубликовала информацию о ранее неизвестной для широкой общественности компании Hawkfish, которую в 2019 году основал Майкл Блумберг — потенциальный кандидат в президенты США от Демократов. Эта компания, на первый взгляд, очень похожа на Cambridge Analytica. Hawkfish занимается двумя вещами: (1) анализирует данные из соцсетей и других источников об избирателях и (2) на базе этих данных строит стратегию взаимодействия с избирателями, создает контент и запускает рекламу. По словам пресс-секретаря Джулии Вуд, в своей избирательной кампании 2020 Блумберг делает основную ставку именно на ее усилия.

Начиная с ноября, Блумберг вложил в развитие Hawkfish $25 млн. Более $1 млн. в день компания тратит на рекламные сообщения только в Facebook, также используя рекламу в Google, Instagram, на телевидении и других каналах. В 2019 году Hawkfish уже успешно работала на выборах в Вирджинии (первая победа Демократов в штате за 20 лет) и Кентуки (на предыдущих выборах штат поддержал Трампа с перевесом в 30 процентов).

Суммы тратятся впечатляющие, превосходя даже траты Трампа в президентской кампании 2016 — сейчас Hawkfish один из главных инвесторов в развитие аналитики open data в мире. Но не смотря на такой размах, информация о деятельности компании практически отсутствует — на первых 10 страницах Google только поверхностные сведения. Я решил детальнее разобраться в этом вопросе. По мере появления информации — буду добавлять ее в эту статью.

АПДЕЙТ ОТ 01.03

На данный момент я нашел 3 ключевых аспекта о деятельности компании.

(1) Изучение вакансий на сайте кампании Блумберга и профилей Linkedin 73 сотрудников Hawkfish дает нам следующую информацию:

  • многие сотрудники компании — data scientists и data engineers; также есть люди, ответственные за покупку внешних данных. Из соотношения позиций сотрудников можно сделать вывод, что основная деятельность компании — именно аналитика данных, а создание и запуск рекламных креативов — вторичная;
  • в описании вакансии data engineer основной акцент сделан на объединении информации из различных источников, в описании вакансии full stack engineer указана работа с CRM, а в описании вакансий state data director и state deputy data director указана работа с софтом по менеджменту избирателей (в полях, через SMS, digital каналах итп.).

Стоит пояснить, что в сфере анализа данных из соцсетей и других источников, есть, по сути, только одна задача по мэтчингу данных и она очень большая относительно других задач (поэтому в описании вакансии на ней и сделан акцент). Это нечеткий мэтчинг данных из различных источников об одном человеке по имени, фамилии, городу, дате рождения, фото, списку друзей и другим признакам. Сложность задачи заключается в том, что в каждом из источников поля немного отличаются и не идеально заполнены. В одном источнике не будет даты рождения, а во втором — фамилия будет написана с ошибкой. Задача нечеткого мэтчинга — по неполному набору данных понять, что перед нами один и тот же человек.

Соответственно, можно с большой долей вероятности предположить, что работа Hawkfish выглядит следующим образом:

1. Компания парсит данные обо всех жителях США из различных соцсетей (в первую очередь — Facebook, Instagram, также вероятно Twitter) и покупает из многочисленных других источников (в штате сразу несколько человек, которые занимаются только покупкой данных). Данные из соцсетей нужны для менеджмента отклика людей на рекламные кампании в digital каналах, так как рекламные кабинеты не предоставляют информацию в разрезе по каждому человеку отдельно (конечно, можно записывать в CRM усредненную информацию по группе людей, но в таком случае заметно нивелируется польза остальных данных по конкретному человеку и теряется смысл тратить столько финансовых ресурсов). Также данные из соцсетей необходимы для персонализации рекламных кампаний в Facebook и оптимального выбора микро инфлюенсеров в Instagram, о которых поговорим в следующих пунктах. Дополнительными источниками информации могут быть данные онлайн сервисов, ритейлеров итд.

2. Дальше Hawkfish мэтчит все данные об одном человеке — и это огромная техническая задача. После этого — записывает все данные в специальную CRM, настроенную для работы с избирателями.

3. Компания персонально взаимодействует с каждым избирателем и записывает всю историю контактов и откликов для дальнейшего анализа. Записывается история оффлайн коммуникации с человеком, его комментарии и лайки в соцсетях под рекламными постами, отправленные SMS итп.

(2) Ежедневно Hawkfish тратит на рекламу в Facebook более $1 млн. При этом кол-во уникальных запускаемых объявлений довольно велико: так, например, за неделю с 12 по 18 февраля было запущено 47 тыс. уникальных объявлений. Среднее кол-во показов одного рекламного объявления — 12 тыс. раз.

Большое кол-во уникальных рекламных объявлений и небольшой охват каждого из них позволяет предположить 3 сценария как выглядит процесс создания и запуска рекламы:

  • автоматизированно создается много версий одного и того же рекламного объявления, а затем с помощью тестов выбирается оптимальный вариант;
  • используется высокий уровень персонализации объявлений и микротаргетирование;
  • тестирование и микротаргетирование используются одновременно.

Какой из этих подходов использует компания — пока открытый вопрос, который стоит изучить детальнее.

(3) Также компания активно работает с лидерами мнений в Instagram: как с крупными, так и с микро инфлюенсерами. Крупные аккаунты распространяют мэмы, а микро инфлюенсеры создают посты в поддержку Блумберга и приводят свои уникальные доводы, написанные простым языком. Цель таких действий — влиять на лидеров мнений, и с помощью такого влияния создавать эффект «все об этом говорят».

В статье на Medium я рассказывал как открытые данные помогают прогнозировать наиболее эффективных лидеров мнений для заданной целевой аудитории. Вероятно, Hawkfish использует схожий подход. С появлением дополнительно информации расскажу о данном пункте детальнее.

Пока сходство с Cambridge Analytica очень высокое! Ждем дальнейших новостей.

АПДЕЙТ ОТ 13.03

После “супервторника” Майкл Блумберг выбыл из президентской гонки. Однако это никак не скажется на работе Hawkfish — теперь финансовые ресурсы Блумберга и технические возможности компании будут направлены на помощь Джо Байдену.

Хотите следить за моими статьями?
Подписывайтесь: TG (Big data future), FB, LI.

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

Volodymyr Lozovyi
Volodymyr Lozovyi

Written by Volodymyr Lozovyi

Inventor, founder @Artellence. Top topics: artificial intelligence, big data, open data, fintech, public sector, politics, technologies of the future.

No responses yet

Write a response