Как устроена работа новой Cambridge Analytica — Hawkfish изнутри

Volodymyr Lozovyi
4 min readMar 1, 2020

--

В канун католического Рождества CNBC опубликовала информацию о ранее неизвестной для широкой общественности компании Hawkfish, которую в 2019 году основал Майкл Блумберг — потенциальный кандидат в президенты США от Демократов. Эта компания, на первый взгляд, очень похожа на Cambridge Analytica. Hawkfish занимается двумя вещами: (1) анализирует данные из соцсетей и других источников об избирателях и (2) на базе этих данных строит стратегию взаимодействия с избирателями, создает контент и запускает рекламу. По словам пресс-секретаря Джулии Вуд, в своей избирательной кампании 2020 Блумберг делает основную ставку именно на ее усилия.

Начиная с ноября, Блумберг вложил в развитие Hawkfish $25 млн. Более $1 млн. в день компания тратит на рекламные сообщения только в Facebook, также используя рекламу в Google, Instagram, на телевидении и других каналах. В 2019 году Hawkfish уже успешно работала на выборах в Вирджинии (первая победа Демократов в штате за 20 лет) и Кентуки (на предыдущих выборах штат поддержал Трампа с перевесом в 30 процентов).

Суммы тратятся впечатляющие, превосходя даже траты Трампа в президентской кампании 2016 — сейчас Hawkfish один из главных инвесторов в развитие аналитики open data в мире. Но не смотря на такой размах, информация о деятельности компании практически отсутствует — на первых 10 страницах Google только поверхностные сведения. Я решил детальнее разобраться в этом вопросе. По мере появления информации — буду добавлять ее в эту статью.

АПДЕЙТ ОТ 01.03

На данный момент я нашел 3 ключевых аспекта о деятельности компании.

(1) Изучение вакансий на сайте кампании Блумберга и профилей Linkedin 73 сотрудников Hawkfish дает нам следующую информацию:

  • многие сотрудники компании — data scientists и data engineers; также есть люди, ответственные за покупку внешних данных. Из соотношения позиций сотрудников можно сделать вывод, что основная деятельность компании — именно аналитика данных, а создание и запуск рекламных креативов — вторичная;
  • в описании вакансии data engineer основной акцент сделан на объединении информации из различных источников, в описании вакансии full stack engineer указана работа с CRM, а в описании вакансий state data director и state deputy data director указана работа с софтом по менеджменту избирателей (в полях, через SMS, digital каналах итп.).

Стоит пояснить, что в сфере анализа данных из соцсетей и других источников, есть, по сути, только одна задача по мэтчингу данных и она очень большая относительно других задач (поэтому в описании вакансии на ней и сделан акцент). Это нечеткий мэтчинг данных из различных источников об одном человеке по имени, фамилии, городу, дате рождения, фото, списку друзей и другим признакам. Сложность задачи заключается в том, что в каждом из источников поля немного отличаются и не идеально заполнены. В одном источнике не будет даты рождения, а во втором — фамилия будет написана с ошибкой. Задача нечеткого мэтчинга — по неполному набору данных понять, что перед нами один и тот же человек.

Соответственно, можно с большой долей вероятности предположить, что работа Hawkfish выглядит следующим образом:

1. Компания парсит данные обо всех жителях США из различных соцсетей (в первую очередь — Facebook, Instagram, также вероятно Twitter) и покупает из многочисленных других источников (в штате сразу несколько человек, которые занимаются только покупкой данных). Данные из соцсетей нужны для менеджмента отклика людей на рекламные кампании в digital каналах, так как рекламные кабинеты не предоставляют информацию в разрезе по каждому человеку отдельно (конечно, можно записывать в CRM усредненную информацию по группе людей, но в таком случае заметно нивелируется польза остальных данных по конкретному человеку и теряется смысл тратить столько финансовых ресурсов). Также данные из соцсетей необходимы для персонализации рекламных кампаний в Facebook и оптимального выбора микро инфлюенсеров в Instagram, о которых поговорим в следующих пунктах. Дополнительными источниками информации могут быть данные онлайн сервисов, ритейлеров итд.

2. Дальше Hawkfish мэтчит все данные об одном человеке — и это огромная техническая задача. После этого — записывает все данные в специальную CRM, настроенную для работы с избирателями.

3. Компания персонально взаимодействует с каждым избирателем и записывает всю историю контактов и откликов для дальнейшего анализа. Записывается история оффлайн коммуникации с человеком, его комментарии и лайки в соцсетях под рекламными постами, отправленные SMS итп.

(2) Ежедневно Hawkfish тратит на рекламу в Facebook более $1 млн. При этом кол-во уникальных запускаемых объявлений довольно велико: так, например, за неделю с 12 по 18 февраля было запущено 47 тыс. уникальных объявлений. Среднее кол-во показов одного рекламного объявления — 12 тыс. раз.

Большое кол-во уникальных рекламных объявлений и небольшой охват каждого из них позволяет предположить 3 сценария как выглядит процесс создания и запуска рекламы:

  • автоматизированно создается много версий одного и того же рекламного объявления, а затем с помощью тестов выбирается оптимальный вариант;
  • используется высокий уровень персонализации объявлений и микротаргетирование;
  • тестирование и микротаргетирование используются одновременно.

Какой из этих подходов использует компания — пока открытый вопрос, который стоит изучить детальнее.

(3) Также компания активно работает с лидерами мнений в Instagram: как с крупными, так и с микро инфлюенсерами. Крупные аккаунты распространяют мэмы, а микро инфлюенсеры создают посты в поддержку Блумберга и приводят свои уникальные доводы, написанные простым языком. Цель таких действий — влиять на лидеров мнений, и с помощью такого влияния создавать эффект «все об этом говорят».

В статье на Medium я рассказывал как открытые данные помогают прогнозировать наиболее эффективных лидеров мнений для заданной целевой аудитории. Вероятно, Hawkfish использует схожий подход. С появлением дополнительно информации расскажу о данном пункте детальнее.

Пока сходство с Cambridge Analytica очень высокое! Ждем дальнейших новостей.

АПДЕЙТ ОТ 13.03

После “супервторника” Майкл Блумберг выбыл из президентской гонки. Однако это никак не скажется на работе Hawkfish — теперь финансовые ресурсы Блумберга и технические возможности компании будут направлены на помощь Джо Байдену.

Хотите следить за моими статьями?
Подписывайтесь: TG (Big data future), FB, LI.

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Volodymyr Lozovyi
Volodymyr Lozovyi

Written by Volodymyr Lozovyi

Inventor, founder @Artellence. Top topics: artificial intelligence, big data, open data, fintech, public sector, politics, technologies of the future.

No responses yet

Write a response