Индекс атрибутивности данных
Актуальность материала: 17.02.2026
Актуальная редакция материала размещена в "Альманахе" Privacy Advocates
🔸Атрибутивность – это свойство данных выступать признаком/характеристикой (атрибутом) человека.
🔸Индекс атрибутивности данных – это оценка вероятности того, что совокупность данных позволит нам узнать конкретного человека (определить его) и/или уменьшить степень неизвестности в отношении этого человека.
🔸Формула расчета Индекса атрибутивности – это сумма свойств каждого типа данных (насколько они уникальны, неизменны и т.д.) из рассматриваемого сценария обработки, умноженная на мультипликатор контекста, т.е. сценарий использования данных: есть ли у нас техническая возможность и юридическая цель связать эти данные с реальной личностью. Иначе говоря, свойства данных (их «масса») умножаются на потребность в определении человека (контекст).
🔸Индекс помогает провести итоговую черту в спорных ситуациях:
- Зеленая зона (низкий индекс) – мы обрабатываем данные, но не знаем людей. Закон (152-ФЗ) нас почти не касается.
- Желтая зона (средний индекс) – мы не знаем имен, но можем «вычислить» человека или его устройство. Закон начинает быть применим к нам.
- Красная зона (высокий индекс) – мы точно знаем, чьи персональные данные обрабатываем. Включаются все требования закона.
🔸Стимул к «цифровой осознанности» (Data Minimization). Индекс работает как счетчик калорий: каждое лишнее поле в базе данных (даже «безобидное») увеличивает итоговый балл риска. Это наглядно показывает заинтересованным сторонам (маркетингу, HR), что сбор данных «про запас и на всякий пожарный» — это не бесплатно, а юридически дорого. Подход мотивирует удалять избыточные данные или применять различные методики снижения атрибутивности данных (например, вместо точного возраста указывать его диапазон), чтобы остаться в безопасной «зеленой зоне» регулирования.
🔸Справедливость к контексту (Privacy by Design). Индекс защищает бизнес от избыточных требований. Он математически доказывает, что уникальность данных ≠ персональные данные, обработка которых регулируется законодательством о ПД. Даже если вы храните супер-уникальные идентификаторы (например, сложные хеши или GUID сессий), но используете их исключительно для техподдержки, а не для определения человека, то итоговый риск остается низким. Это позволяет не тратить бюджет на защиту технических логов так же строго, как кадровую базу.
