Anonimizētus demogrāfiskos datus joprojām var izmantot, lai jūs identificētu

Tāda vīrieša profils, kura sejā ir identificējama informācija par viņu.


Ja esat viens no nedaudzajiem cilvēkiem, kas lasa pakalpojumu sniegšanas noteikumus, dažādu uzņēmumu konfidencialitātes politikās jūs varat atrasties kā klauzula, kurā teikts, ka viņi var vākt un pārdot jūsu datus trešajām personām.

Viņi saka, ka dati ir anonīmi, bet jauns pētījums publicēts Dabas sakari parāda, ka atkarībā no tā, ko kopīgojat, joprojām var būt iespējams jūs identificēt ar pārsteidzošu precizitāti. Pētnieki no Londonas Imperiālās koledžas un Beļģijas Luvīnas universitātes izveidoja mašīnmācīšanās modeli, kas var identificēt personas no anonimizētām datu kopām, pat no “ļoti nepilnīgām datu kopām”.

Šādas atklāšanas notiek laikā, kad arvien vairāk cilvēku uztraucas par uzņēmumiem, kas pārdod savus datus trešajām personām, un tiem ir postoša ietekme uz pašlaik glabāto (un koplietoto) anonīmo datu privātumu, ko vāc un izmanto daudzi uzņēmumi un akadēmiskās iestādes..

Kā darbojas datu anonimizācija??

Ja neesat pilnībā atradies no tīkla, jūs regulāri ražojat daudz personas datu – sākot no pirkumiem tiešsaistē un brauciena maršrutiem līdz vairāk personiskiem datiem, piemēram, jūsu veselības ierakstiem..

Šādas datu troves ir zelta putekļi reklāmdevējiem, kuri vēlas uzlabot mērķauditorijas atlasi (lasīt: Cambridge Analytica), un pētniekiem, kuri meklē tendences sabiedrības veselības jomā, un iemācīt sejas atpazīšanu mākslīgajam intelektam.

Lai aizsargātu identitāti, kas atrodas aiz datiem, vispārējā “paraugprakse” ir bijusi acīmredzami identificējošas informācijas noņemšana, piemēram, vārdi, e-pasta adreses, tālruņu un sociālās apdrošināšanas numuri..

[Vai vēlaties vairāk privātuma un drošības ziņu? Reģistrējieties ExpressVPN emuāra biļetenam.]

Novecojušas anonimizācijas metodes

Kopš deviņdesmitajiem gadiem daudzas no populārajām anonimizācijas metodēm nav mainījušās, kopš kopš 1990. gada, reaģējot uz tiešsaistes datu eksploziju, nav pieņemtas sarežģītākas anonimizācijas metodes..

Ir bijuši vairāki gadījumi, sākot ar 2000. gadu, kad it kā anonīmas datu kopas tika izlaistas un pēc tam atkārtoti identificētas..

2017. gadā žurnālisti veiksmīgi “atkārtoti identificēja politiķus anonimizētā pārlūkošanas vēstures datu kopā ar 3 miljoniem Vācijas pilsoņu, atklājot viņu medicīnisko informāciju un seksuālās vēlmes”.

Jaunais pētījums norāda arī uz iepriekšējo darbu, kurā pētnieki spēja “unikāli identificēt personas anonimizētās taksometru trajektorijās Ņujorkā, velosipēdu dalīšanas braucienos Londonā, metro datus Rīgā, kā arī mobilo tālruņu un kredītkaršu datu kopās”.

Daži datu punkti nepieciešami, lai jūs varētu atkārtoti identificēt

Pētījuma autori ir izveidojuši tiešsaistes veidlapu, kurā jūs varat pārbaudīt savas iespējas tikt identificētām (tikai ASV un Lielbritānijas rezidentiem) no hipotētiskas veselības apdrošināšanas kompānijas, kurai ir tikai trīs datu punkti: jūsu dzimums, dzimšanas datums un pasta indekss..

Piemēram, ja jūs esat ASV vīrietis, kurš dzimis 1990. gada 12. novembrī un dzīvojat ar pasta indeksu 02139, tur ir 54% iespēja, ka jūsu darba devējs vai kaimiņš varētu jūs identificēt.

Bet šis procents palielinās, ja pievienojat vairāk atribūtu: ja pievienojat tikai savu ģimenes stāvokli, tas varētu palielināt iespēju jūs identificēt 99%. Citi atribūti ietver transportlīdzekļu skaitu, darba klasi (izvēlētā nozare) un māju īpašumtiesības.

Kā uzņēmumiem vajadzētu anonimizēt mūsu datus?

No šī pētījuma izriet, ka pašreizējā anonimizācijas prakse pienācīgi neaizsargā cilvēku privātumu un padara viņus neaizsargātus, lai tos varētu atkārtoti identificēt ikviens, kam ir piekļuve šiem datiem.

Diemžēl šeit nav daudz, ko indivīds var darīt, – tie ir uzņēmumi un iestādes, kas šos datus glabā, pārdod un izmanto, lai mainītu, kā viņi datus anonimizē. Tiesību akti, piemēram, ES GDPR un Kalifornijas Likums par patērētāju privātumu, pieprasa, lai personām visās datu kopās būtu anonīmi un tos nebūtu iespējams atkārtoti identificēt, taču kontrolakciju sabiedrībām var izrādīties grūti.

Viens no veidiem, kā novērst atkārtotu identificēšanu anonimizētos datos, ir pieņemt atšķirīgu privātumu – matemātisku modeli, kas pirms datu nosūtīšanas uz serveri uzmanīgi pievieno kontrolētu izlases “trokšņa” daudzumu, padarot datus nedaudz tuvākus nekā precīzus, bet pietiekami aizsargā indivīda privātumu. Uzņēmumi, piemēram, Apple un Google, datu apkopošanā ir iestrādājuši atšķirīgu privātumu.

Drīzumā lielā mērā tiks pārbaudīta atšķirīga konfidencialitāte: tā tiks izmantota nākamajā ASV tautas skaitīšanā.

Pasākumi, ko varat veikt, lai pasargātu sevi

Tātad, ja uzņēmums lūdz jūsu atļauju koplietot anonīmus datus ar trešām personām, kā rīkoties? Apsveriet iespēju pats savus datus anonimizēt. Ne katram uzņēmumam ir tiesības uz jūsu patieso dzimšanas datumu, faktisko pasta indeksu, dzimumu vai ģimenes stāvokli vai pat obligāti uz jūsu īsto vārdu. Ja kāda detaļa nav būtiska, lai jūs izmantotu konkrētu pakalpojumu, apkaisiet dažas neatbilstības. (Un, ja jūsu pastkastē parādīsies unikāli kļūdaini uzrakstīts vārds, jūs precīzi zināt, kurš uzņēmums jūs pārdeva.)

Vēl labāk, ja darāt darījumus tikai ar uzņēmumiem, kas ir pilnīgi informēti par to, kādus datus viņi vāc, kuri nekad neapkopo nevajadzīgus datus, kuri nekad neizplata un nepārdod jūsu personisko informāciju ar trešām personām un kuri pat pamata diagnostikas datus anonimizē. informācija nāvējoši nopietni (un pat ļauj jums atteikties, ja vēlaties). Mēs zinām vismaz vienu.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map