Анонимные демографические данные могут все еще использоваться, чтобы идентифицировать Вас

Профиль человека, лицо которого имеет опознаваемую информацию о нем.


Если вы один из немногих, кто читает условия обслуживания, вы можете найти в политиках конфиденциальности различных компаний пункт, в котором говорится, что они могут собирать и продавать ваши данные третьим сторонам..

Данные, по их словам, анонимны, но новое исследование опубликовано в Связи природы демонстрирует, что, в зависимости от того, что вы делитесь, все еще может быть возможность повторно идентифицировать вас с удивительной точностью. Исследователи из Имперского колледжа Лондона и Университета Лувена в Бельгии создали модель машинного обучения, которая может идентифицировать лиц по анонимным наборам данных, даже по «сильно неполным наборам данных».

Такие откровения происходят в то время, когда все больше людей настороженно относятся к компаниям, продающим свои данные третьим сторонам, и имеют пагубные последствия для конфиденциальности для сохраняемых (и совместно используемых) анонимных данных, которые многие компании и академические учреждения собирают и используют.

Как работает анонимизация данных?

Если вы не полностью отключены от сети, вы регулярно производите много персональных данных – от покупок в Интернете и маршрутов бега до дополнительных персональных данных, таких как медицинские записи..

Такие хранилища данных – золотая пыль для рекламодателей, которые хотят улучшить свои таргетинги (читай: Cambridge Analytica), и для исследователей, которые ищут тенденции в общественном здравоохранении и обучают искусственному интеллекту распознавание лиц..

Для защиты идентификаторов данных общие «передовые практики» заключаются в удалении явно идентифицирующей информации, такой как имена, адреса электронной почты, номера телефонов и номеров социального страхования..

[Хотите узнать больше о конфиденциальности и безопасности? Подпишитесь на новостную рассылку блога ExpressVPN.]

Устаревшие методы анонимизации

Многие из популярных методов анонимизации остались неизменными с 1990-х годов, так как не приняли более сложные методы анонимизации в ответ на взрыв данных в Интернете с тех пор.

Было несколько случаев, начиная с 2000 года, предположительно анонимных наборов данных, которые были выпущены и впоследствии повторно идентифицированы.

В 2017 году журналисты успешно «повторно идентифицировали политиков в анонимном наборе данных истории 3 миллионов граждан Германии, раскрывая их медицинскую информацию и их сексуальные предпочтения».

Новое исследование также указывает на предыдущую работу, в которой исследователи смогли «однозначно идентифицировать лиц на анонимных маршрутах такси в Нью-Йорке, поездках на велосипедах в Лондоне, данных метро в Риге и наборах данных мобильных телефонов и кредитных карт».

Несколько точек данных, необходимых для повторной идентификации вас

Исследователи, участвовавшие в исследовании, создали онлайн-форму, в которой вы можете проверить свои шансы быть идентифицированными (только для жителей США и Великобритании) в гипотетической медицинской страховой компании, используя всего три точки данных: ваш пол, дату рождения и почтовый индекс..

Например, если вы были мужчиной США, родившимся 12 ноября 1990 года и в настоящее время живущим с почтовым индексом 02139, есть 54% шанс, что ваш работодатель или сосед может вас идентифицировать.

Но этот процент увеличивается, когда вы добавляете больше атрибутов: добавление только вашего семейного положения может увеличить вероятность того, что вас идентифицируют 99%. Другие атрибуты включают количество транспортных средств, рабочий класс (выбранная отрасль) и владение домом..

Как компании должны анонимировать наши данные?

Из этого исследования ясно, что нынешняя практика анонимизации не обеспечивает надлежащей защиты частной жизни людей и делает их уязвимыми для повторной идентификации любым лицом, имеющим доступ к этим данным..

К сожалению, здесь мало что может сделать индивид – это зависит от компаний и учреждений, которые хранят, продают и используют эти данные, чтобы изменить способ анонимизации данных. Такие нормативные акты, как GDPR ЕС и Калифорнийский закон о защите прав потребителей, требуют, чтобы отдельные лица во всех наборах данных были анонимными и не могли быть повторно идентифицированы, но подотчетность компаний может оказаться сложной задачей..

Одним из способов предотвращения повторной идентификации в анонимных данных является использование дифференциальной конфиденциальности, математической модели, которая тщательно добавляет контролируемый объем случайного «шума» в данные перед их отправкой на сервер, делая данные немного более приблизительными, чем точными, но адекватно защищает частную жизнь человека. Такие компании, как Apple и Google, включили дифференциальную конфиденциальность в свой сбор данных.

Мы скоро увидим, как дифференциальная конфиденциальность подвергнется серьезному испытанию: она будет использована при следующей переписи населения США..

Шаги, которые вы можете предпринять, чтобы защитить себя

Поэтому, когда компания запрашивает ваше разрешение на передачу анонимных данных третьим сторонам, что вам следует делать? Рассмотрите возможность анонимизации ваших данных самостоятельно. Не каждая компания действительно имеет право на вашу настоящую дату рождения, ваш фактический почтовый индекс, ваш пол или семейное положение, или даже обязательно ваше настоящее имя. Если деталь не имеет решающего значения для использования вами конкретной услуги, рассыпьте некоторые противоречия вокруг. (И если в вашем почтовом ящике появится уникальное имя с ошибкой, вы будете точно знать, какая компания продала вас.)

Более того, ведите бизнес только с компаниями, которые полностью осведомлены о том, какие данные они собирают, которые никогда не собирают ненужные им данные, которые никогда не передают или не продают вашу личную информацию третьим лицам, и которые занимаются анонимностью даже базовой диагностики. информация смертельно серьезна (и даже позволит вам отказаться, если хотите). Мы знаем, по крайней мере, один.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map