Взгляд через призму цифровой безопасности
Мы привыкли думать о рекламе как о баннере, который «почему-то» показали именно нам. Иногда это вызывает удивление, иногда - раздражение, а иногда - ощущение, что система знает слишком много.
Но внутри рекламной инфраструктуры нет отдельно сидящего человека. Там нет имени, фотографий или прямого досье. Там есть набор технических следов и журнал действий, из которых со временем собирается вероятностный профиль поведения: что человеку может быть интересно, где он находится примерно, с каких устройств он заходит и насколько вероятно, что он кликнет или совершит покупку.
Самое важное, что стоит понять в самом начале:
Рекламный профиль почти никогда не выглядит как досье. Он выглядит как карточка наблюдений:
какое устройство -> какие сигналы -> какая статистика поведения.
Именно поэтому он одновременно безличный - и при этом пугающе подробный.
Что именно собирается: реальные данные и их человеческий вид
Ниже перечислено не абстрактными терминами, а так, как эти данные могли бы выглядеть, если бы их увидел человек. Это те категории данных, которые прямо указываются в рекламных политиках и технических описаниях рекламных экосистем.
Сетевые данные - откуда ты пришел
Это: IP-адрес и параметры подключения.
IP: 178 . XXX . XXX . XXX
Регион: Город/Регион (оценочно)
Тип сети: WiFI/Мобильная сеть
По IP редко определяется точный адрес, но регион и тип подключения - всегда.
Данные устройства - какое железо
Это: тип устройства (смартфон, компьютер); версия операционной системы и браузера; внутренний идентификатор устройства.
Геоданные
Что это: Координаты (широта/долгота)
Важно понимать: Это не всегда и не у всех. Такие данные появляются, если приложение их запрашивает.
Данные мобильной сети - страна и оператор
Все MCC можно изучить здесь.
Cookies и браузерные идентификаторы
Что это: Cookies - небольшие метки в браузере, чтобы отличать один браузер от другого.
Рекламные идентификаторы устройства
Это то, что называют GAID/IDFA/IDFV
По сути - номер устройства для рекламы, а не данные о человеке
Этот идентификатор не содержит имени, не содержит номер телефона. Может быть сброшен или ограничен пользователем.
Идентификаторы сторонних рекламных систем
В рекламной цепочке участвуют разные компании, у каждой свой номер пользователя
Это не паспорт и не профиль личности. Это способ разных систем понять, что речь идёт об одном и том же устройстве.
Откуда приходят эти данные
Рекламная система получает сигналы не из всего телефона, а из конкретных источников.
Сайты и приложения рекламодателей
Если сайт или приложение использует рекламу или аналитику, то оно передаёт:
Площадки, где показывается реклама
Другие партнёры рекламной цепочки
Измерения, аналитика, антифрод (предотвращение мошенничества) - все они обмениваются сигналами.
Что значит "собирают из приложений"
Данные собираются далеко не из каждого приложения/сайта, которые мы используем.
Данные приходят из тех приложений и сайтов, где встроены рекламные или аналитические инструменты, либо которые участвуют в партнёрских рекламных интеграциях.
Если приложение не подключено к рекламной инфраструктуре - данных оттуда не будет.
Зачем вообще нужны рекламные идентификаторы
Идентификатор = ключ. Он нужен, чтобы система понимала:
В самом идентификаторе почти нет информации. Смысл появляется только тогда, когда к нему накапливаются события.
Какие данные в итоге лежат в профиле
Если разложить рекламный профиль по слоям, внутри обычно есть:
Идентификаторы - чтобы связать события
Техническая карточка устройства
Геосигналы
Журнал действий
Вероятностные выводы и оценки
Это не досье, но это очень точная модель поведения.
Как профиль растёт со временем
Читает статьи про ремонт
Ищет цены
Кликает рекламу
Возвращается к теме
Профиль отвечает не на вопрос кто ты, а на вопрос что ты, скорее всего, делаешь или планируешь.
Про микрофон и эффект "я сказал - мне показали"
Массовой прослушки разговоров ради рекламы не подтверждено. Но важно другое.
Некоторые приложения имеют доступ к микрофону. Если такое приложение:
То техническая возможность есть.
В индустрии существовали технологии аудио-маяков и ультразвуковых сигналов. Это не норма, но это реальный риск-класс, о котором важно знать.
Чаще же всего эффект объясняется проще: меняется поведение, контент, окружение - система реагирует на эти сигналы.
Самая честная формулировка всего вышеописанного
Рекламная система не хранит человека как личность. Она хранит источник сигналов и связанные с ним действия. А затем превращает их в вероятности, сегменты и прогнозы.
Как выглядит рекламный профиль, если бы мы смогли его распечатать
Ниже - обобщённая "распечатка" профиля случайного активного пользователя, если перевести машинные записи в человеческий язык.
Рекламный профиль пользователя
История взаимодействия (обобщённо):
23 января 19:21 открыл статью про места для досуга в Москве
23 января 20:01 кликнул на рекламу велосипеда
23 января 21:10 открыл видео по ремонту ванной
23 января 21:12 открыл сайт по продаже инструментов для ремонта
23 января 21:40 открыл статью про велотуризм
Спорт: высокий
Ремонт: высокий
Досуг: низкий
Вероятность клика: выше средней
Вероятность покупки: низкая
Чувствительность к вечерним предложениям: высокая
Иногда продолжаю такие темы в Telegram — в виде коротких заметок и наблюдений.