Dados demográficos anônimos ainda podem ser usados ​​para identificar você

Perfil de um homem cujo rosto tem informações identificáveis ​​sobre ele.


Se você é uma das poucas pessoas que lê os termos de serviço, pode encontrar nas cláusulas de política de privacidade de várias empresas uma cláusula dizendo que elas podem coletar e vender seus dados a terceiros.

Os dados, dizem eles, são anonimizados, mas um novo estudo publicado na Comunicações da natureza demonstra que, dependendo do que você compartilha, ainda é possível identificá-lo com uma precisão surpreendente. Pesquisadores do Imperial College de Londres e da Universidade de Louvain, na Bélgica, criaram um modelo de aprendizado de máquina que pode reidentificar indivíduos de conjuntos de dados anônimos, mesmo de “conjuntos de dados altamente incompletos”.

Tais revelações ocorrem em um momento em que mais pessoas desconfiam de empresas que vendem seus dados a terceiros e têm implicações negativas na privacidade dos dados anônimos atualmente armazenados (e compartilhados) que muitas empresas e instituições acadêmicas coletam e usam.

Como funciona o anonimato de dados?

A menos que você esteja completamente fora da rede, produz regularmente muitos dados pessoais – desde suas compras on-line e rotas de corrida até mais dados pessoais, como seus registros médicos.

Esses dados são valiosos para anunciantes que desejam melhorar sua segmentação (leia-se: Cambridge Analytica) e para pesquisadores que procuram tendências em saúde pública, além de ensinar o reconhecimento facial à inteligência artificial.

Para proteger as identidades por trás dos dados, as “práticas recomendadas” gerais foram remover informações de identificação óbvia, como nomes, endereços de email e números de telefone e de segurança social.

[Deseja mais notícias sobre privacidade e segurança? Inscreva-se no boletim informativo do blog ExpressVPN.]

Técnicas de anonimização desatualizadas

Muitos dos métodos populares de anonimização permaneceram inalterados desde os anos 90, deixando de adotar técnicas de anonimização mais complexas em resposta à explosão de dados on-line desde.

Houve vários casos, desde 2000, de conjuntos de dados supostamente anônimos que foram liberados e subsequentemente re-identificados.

Em 2017, os jornalistas “re-identificaram políticos em um conjunto de dados de histórico de navegação anônimo de 3 milhões de cidadãos alemães, descobrindo suas informações médicas e suas preferências sexuais”.

O novo estudo também aponta para trabalhos anteriores, nos quais os pesquisadores foram capazes de “identificar indivíduos em trajetórias anônimas de táxi em Nova York, viagens de compartilhamento de bicicleta em Londres, dados de metrô em Riga e conjuntos de dados de telefone celular e cartão de crédito”.

Poucos pontos de dados necessários para identificar novamente você

Os pesquisadores responsáveis ​​pelo estudo criaram um formulário on-line onde você pode testar suas chances de ser identificado (apenas para residentes nos EUA e no Reino Unido) de uma empresa de seguros de saúde hipotética com apenas três pontos de dados: sexo, data de nascimento e código postal.

Por exemplo, se você era um homem dos EUA nascido em 12 de novembro de 1990 e atualmente morando no CEP 02139, há um 54% chance de seu empregador ou vizinho identificar você.

Mas essa porcentagem aumenta quando você adiciona mais atributos: adicionar apenas seu estado civil pode aumentar a chance de identificar você até 99%. Outros atributos incluem número de veículos, classe de trabalho (setor escolhido) e propriedade da casa.

Como as empresas devem estar anonimizando nossos dados?

Está claro neste estudo que as práticas atuais de anonimização não protegem adequadamente a privacidade das pessoas e as deixam vulneráveis ​​a serem identificadas novamente por qualquer pessoa que tenha acesso a esses dados..

Infelizmente, não há muito o que o indivíduo possa fazer aqui – cabe às empresas e instituições que armazenam, vendem e usam esses dados para alterar a forma como eles os anonimizam. Regulamentos como o GDPR da UE e a Lei de Privacidade do Consumidor da Califórnia exigem que os indivíduos em todos os conjuntos de dados sejam anônimos e impossíveis de serem identificados novamente, mas responsabilizar as empresas pode ser difícil.

Uma maneira de impedir a re-identificação em dados anônimos é adotar a privacidade diferencial, um modelo matemático que adiciona cuidadosamente uma quantidade controlada de “ruído” aleatório nos dados antes de serem enviados para um servidor, tornando os dados um pouco mais aproximados do que precisos, mas protege adequadamente a privacidade do indivíduo. Empresas como Apple e Google incorporaram privacidade diferencial em sua coleta de dados.

Em breve, veremos a privacidade diferencial posta à prova em grande escala: ela será usada no próximo censo dos EUA.

Etapas que você pode seguir para se proteger

Portanto, quando uma empresa solicita sua permissão para compartilhar dados anônimos com terceiros, o que você deve fazer? Considere anonimizar seus dados você mesmo. Nem toda empresa realmente tem direito à sua verdadeira data de nascimento, seu código postal real, seu sexo ou estado civil, ou mesmo necessariamente seu nome real. Se um detalhe não for crucial para o uso de um serviço específico, espalhe alguma inconsistência. (E se um nome exclusivo com erros de ortografia começar a aparecer na sua caixa de correio, você saberá exatamente qual empresa o vendeu.)

Melhor ainda, faça negócios apenas com empresas que sejam totalmente francas sobre os dados que coletam, que nunca coletam dados que não precisam, que nunca compartilham ou vendem suas informações pessoais com terceiros e que anonimizam até mesmo o diagnóstico básico informações mortalmente sérias (e até permitem que você desative, se desejar). Por acaso sabemos de pelo menos um.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map