Datele demografice anonimizate pot fi încă folosite pentru a vă identifica

Profilul unui bărbat a cărui față are informații identificabile despre el.

Dacă sunteți unul dintre puținii oameni care citesc termenii de serviciu, este posibil să găsiți îngropați în politicile de confidențialitate ale diferitelor companii o clauză care spune că ar putea colecta și vinde datele dvs. către terți.

Datele, spun ei, sunt anonimizate, dar un nou studiu a fost publicat în Comunicații Natura demonstrează că, în funcție de ceea ce împărtășiți, poate fi încă posibil să vă reidentificați cu o precizie uluitoare. Cercetătorii de la Imperial College London și Universitatea din Louvain din Belgia au creat un model de învățare automată care poate identifica persoanele din seturi de date anonimizate, chiar și din „seturi de date puternic incomplete”.

Astfel de revelații vin într-un moment în care mai multe persoane se tem de companiile care își vând datele către terți și au implicații păguboase de confidențialitate pentru datele anonime stocate (și partajate) în prezent pe care multe companii și instituții academice le colectează și le folosesc.

Cum funcționează anonimizarea datelor?

Cu excepția cazului în care sunteți complet în afara grilei, produceți în mod regulat o mulțime de date personale – de la cumpărăturile online și rutele de rulare la mai multe date personale, cum ar fi fișele dvs. de sănătate.

Astfel de trove de date sunt praf de aur pentru agenții de publicitate care doresc să-și îmbunătățească țintirea (citiți: Cambridge Analytica), precum și pentru cercetătorii care caută tendințe în sănătatea publică și să predea recunoașterea facială inteligenței artificiale.

Pentru a proteja identitățile din spatele datelor, „cele mai bune practici” generale au fost eliminarea informațiilor de identificare evidente precum nume, adrese de e-mail și numere de telefon și de securitate socială..

[Vrei mai multe știri despre confidențialitate și securitate? Înscrieți-vă la buletinul de blog ExpressVPN.]

Tehnici de anonimizare învechite

Multe dintre metodele populare de anonimizare au rămas neschimbate încă din anii 90, nereușind să adopte tehnici de anonimizare mai complexe ca răspuns la explozia de date online de atunci.

Au existat mai multe cazuri, care datează încă din anul 2000, a seturilor de date presupuse anonime care au fost lansate și ulterior reidentificate.

În 2017, jurnaliștii au „reidentificat politicienii într-un set de date de istorie de navigare anonimizat de 3 milioane de cetățeni germani, descoperind informațiile lor medicale și preferințele lor sexuale.”

Noul studiu indică, de asemenea, lucrări anterioare în care cercetătorii au fost în măsură să „identifice în mod unic persoanele din traiectoriile anonimizate ale taxiului din New York, călătoriile cu bicicleta în Londra, datele de metrou din Riga și seturile de date ale telefoanelor mobile și ale cărților de credit.”

Puține puncte de date necesare pentru a vă identifica din nou

Cercetătorii din spatele studiului au construit un formular online în care vă puteți testa șansele de a fi identificat (doar pentru rezidenții din SUA și Marea Britanie) de la o companie de asigurări de sănătate ipotetice cu doar trei puncte de date: sexul dvs., data nașterii și codul poștal.

De exemplu, dacă ai fost un bărbat din SUA născut la 12 noiembrie 1990 și care locuiește în prezent în codul poștal 02139, există un 54% șansa ca angajatorul sau vecinul să te poată identifica.

Dar acest procent crește atunci când adăugați mai multe atribute: Adăugarea singurului statut civil poate crește șansa de a vă identifica 99%. Alte atribute includ numărul de vehicule, clasa de lucru (industria aleasă) și proprietatea casei.

Cum ar trebui să anonimizeze companiile datele noastre?

Din acest studiu este clar că practicile actuale de anonimizare nu protejează în mod adecvat confidențialitatea oamenilor și le lasă vulnerabile la reidentificarea de către oricine are acces la aceste date.

Din păcate, nu există prea multe lucruri pe care individul le poate face aici – depinde de companiile și instituțiile care stochează, vând și utilizează aceste date pentru a schimba modul în care anonimizează datele. Reglementări precum GDPR din UE și Legea privind confidențialitatea consumatorilor din California impun ambele persoane din toate seturile de date să fie anonime și să nu poată fi reidentificate, dar companiile responsabile se pot dovedi dificile.

Un mod de a preveni reidentificarea în datele anonimizate este adoptarea unei confidențialități diferențiale, un model matematic care adaugă cu atenție o cantitate controlată de „zgomot” aleatoriu în date înainte de a fi trimise către un server, ceea ce face ca datele să fie puțin mai aproximative decât corecte, dar protejează în mod adecvat confidențialitatea individului. Companii precum Apple și Google au încorporat confidențialitatea diferențială în colectarea lor de date.

În curând, vom vedea că confidențialitatea diferențială este pusă la încercare: va fi folosită în recensământul american.

Pași pe care îi puteți face pentru a vă proteja

Deci, atunci când o companie vă solicită permisiunea de a partaja date anonimizate cu terți, ce ar trebui să faceți? Luați în considerare anonimizarea datelor dvs. Nu orice companie are dreptul la data de naștere adevărată, a codului poștal real, a genului sau a stării civile sau chiar neapărat numele tău real. Dacă un detaliu nu este crucial pentru utilizarea dvs. de un anumit serviciu, presărați o anumită inconsecvență. (Și dacă un nume scris cu scris unic începe să apară în căsuța dvs. poștală, veți ști exact ce companie v-a vândut.)

Mai bine, faceți doar afaceri cu companii care sunt complet avansate cu privire la datele pe care le colectează, care nu colectează niciodată date de care nu au nevoie, care nu împărtășesc sau nu vând informațiile dvs. personale cu niciun terț și care iau anonimizarea chiar și a diagnosticului de bază informații mortale în serios (și chiar vă permit să renunțați, dacă doriți). Se întâmplă să știm despre cel puțin unul.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me