Как устроена работа новой Cambridge Analytica — Hawkfish изнутри
В канун католического Рождества CNBC опубликовала информацию о ранее неизвестной для широкой общественности компании Hawkfish, которую в 2019 году основал Майкл Блумберг — потенциальный кандидат в президенты США от Демократов. Эта компания, на первый взгляд, очень похожа на Cambridge Analytica. Hawkfish занимается двумя вещами: (1) анализирует данные из соцсетей и других источников об избирателях и (2) на базе этих данных строит стратегию взаимодействия с избирателями, создает контент и запускает рекламу. По словам пресс-секретаря Джулии Вуд, в своей избирательной кампании 2020 Блумберг делает основную ставку именно на ее усилия.

Начиная с ноября, Блумберг вложил в развитие Hawkfish $25 млн. Более $1 млн. в день компания тратит на рекламные сообщения только в Facebook, также используя рекламу в Google, Instagram, на телевидении и других каналах. В 2019 году Hawkfish уже успешно работала на выборах в Вирджинии (первая победа Демократов в штате за 20 лет) и Кентуки (на предыдущих выборах штат поддержал Трампа с перевесом в 30 процентов).
Суммы тратятся впечатляющие, превосходя даже траты Трампа в президентской кампании 2016 — сейчас Hawkfish один из главных инвесторов в развитие аналитики open data в мире. Но не смотря на такой размах, информация о деятельности компании практически отсутствует — на первых 10 страницах Google только поверхностные сведения. Я решил детальнее разобраться в этом вопросе. По мере появления информации — буду добавлять ее в эту статью.
АПДЕЙТ ОТ 01.03
На данный момент я нашел 3 ключевых аспекта о деятельности компании.
(1) Изучение вакансий на сайте кампании Блумберга и профилей Linkedin 73 сотрудников Hawkfish дает нам следующую информацию:
- многие сотрудники компании — data scientists и data engineers; также есть люди, ответственные за покупку внешних данных. Из соотношения позиций сотрудников можно сделать вывод, что основная деятельность компании — именно аналитика данных, а создание и запуск рекламных креативов — вторичная;
- в описании вакансии data engineer основной акцент сделан на объединении информации из различных источников, в описании вакансии full stack engineer указана работа с CRM, а в описании вакансий state data director и state deputy data director указана работа с софтом по менеджменту избирателей (в полях, через SMS, digital каналах итп.).
Стоит пояснить, что в сфере анализа данных из соцсетей и других источников, есть, по сути, только одна задача по мэтчингу данных и она очень большая относительно других задач (поэтому в описании вакансии на ней и сделан акцент). Это нечеткий мэтчинг данных из различных источников об одном человеке по имени, фамилии, городу, дате рождения, фото, списку друзей и другим признакам. Сложность задачи заключается в том, что в каждом из источников поля немного отличаются и не идеально заполнены. В одном источнике не будет даты рождения, а во втором — фамилия будет написана с ошибкой. Задача нечеткого мэтчинга — по неполному набору данных понять, что перед нами один и тот же человек.
Соответственно, можно с большой долей вероятности предположить, что работа Hawkfish выглядит следующим образом:
1. Компания парсит данные обо всех жителях США из различных соцсетей (в первую очередь — Facebook, Instagram, также вероятно Twitter) и покупает из многочисленных других источников (в штате сразу несколько человек, которые занимаются только покупкой данных). Данные из соцсетей нужны для менеджмента отклика людей на рекламные кампании в digital каналах, так как рекламные кабинеты не предоставляют информацию в разрезе по каждому человеку отдельно (конечно, можно записывать в CRM усредненную информацию по группе людей, но в таком случае заметно нивелируется польза остальных данных по конкретному человеку и теряется смысл тратить столько финансовых ресурсов). Также данные из соцсетей необходимы для персонализации рекламных кампаний в Facebook и оптимального выбора микро инфлюенсеров в Instagram, о которых поговорим в следующих пунктах. Дополнительными источниками информации могут быть данные онлайн сервисов, ритейлеров итд.
2. Дальше Hawkfish мэтчит все данные об одном человеке — и это огромная техническая задача. После этого — записывает все данные в специальную CRM, настроенную для работы с избирателями.
3. Компания персонально взаимодействует с каждым избирателем и записывает всю историю контактов и откликов для дальнейшего анализа. Записывается история оффлайн коммуникации с человеком, его комментарии и лайки в соцсетях под рекламными постами, отправленные SMS итп.
(2) Ежедневно Hawkfish тратит на рекламу в Facebook более $1 млн. При этом кол-во уникальных запускаемых объявлений довольно велико: так, например, за неделю с 12 по 18 февраля было запущено 47 тыс. уникальных объявлений. Среднее кол-во показов одного рекламного объявления — 12 тыс. раз.

Большое кол-во уникальных рекламных объявлений и небольшой охват каждого из них позволяет предположить 3 сценария как выглядит процесс создания и запуска рекламы:
- автоматизированно создается много версий одного и того же рекламного объявления, а затем с помощью тестов выбирается оптимальный вариант;
- используется высокий уровень персонализации объявлений и микротаргетирование;
- тестирование и микротаргетирование используются одновременно.
Какой из этих подходов использует компания — пока открытый вопрос, который стоит изучить детальнее.
(3) Также компания активно работает с лидерами мнений в Instagram: как с крупными, так и с микро инфлюенсерами. Крупные аккаунты распространяют мэмы, а микро инфлюенсеры создают посты в поддержку Блумберга и приводят свои уникальные доводы, написанные простым языком. Цель таких действий — влиять на лидеров мнений, и с помощью такого влияния создавать эффект «все об этом говорят».
В статье на Medium я рассказывал как открытые данные помогают прогнозировать наиболее эффективных лидеров мнений для заданной целевой аудитории. Вероятно, Hawkfish использует схожий подход. С появлением дополнительно информации расскажу о данном пункте детальнее.
Пока сходство с Cambridge Analytica очень высокое! Ждем дальнейших новостей.
АПДЕЙТ ОТ 13.03
После “супервторника” Майкл Блумберг выбыл из президентской гонки. Однако это никак не скажется на работе Hawkfish — теперь финансовые ресурсы Блумберга и технические возможности компании будут направлены на помощь Джо Байдену.