Anonimowe dane demograficzne mogą być nadal wykorzystywane do identyfikacji użytkownika

Profil mężczyzny, którego twarz ma identyfikowalne informacje na jego temat.


Jeśli jesteś jedną z niewielu osób, które czytają warunki korzystania z usługi, możesz znaleźć w polityce prywatności różnych firm klauzulę mówiącą, że mogą one gromadzić i sprzedawać Twoje dane stronom trzecim.

Dane, jak twierdzą, są anonimowe, ale nowe badanie opublikowane w Komunikacja przyrodnicza pokazuje, że w zależności od tego, co udostępniasz, nadal możesz być w stanie zidentyfikować Cię z zadziwiającą dokładnością. Naukowcy z Imperial College London i University of Louvain w Belgii stworzyli model uczenia maszynowego, który może identyfikować osoby z anonimowych zbiorów danych, nawet z „bardzo niekompletnych zbiorów danych”.

Takie ujawnienia pojawiają się w czasie, gdy coraz więcej osób obawia się firm sprzedających swoje dane stronom trzecim i ma szkodliwy wpływ na prywatność obecnie przechowywanych (i udostępnianych) anonimowych danych, które wiele firm i instytucji akademickich gromadzi i wykorzystuje.

Jak działa anonimizacja danych?

O ile nie jesteś całkowicie wyłączony z sieci, regularnie generujesz dużo danych osobowych – od zakupów online i tras biegowych po więcej danych osobowych, takich jak dokumentacja medyczna.

Takie narzędzia do wyszukiwania danych są złotym pyłem dla reklamodawców, którzy chcą poprawić swoje ukierunkowanie (czytaj: Cambridge Analytica), a także dla badaczy szukających trendów w zdrowiu publicznym i uczących sztucznej inteligencji rozpoznawania twarzy.

Aby chronić tożsamość danych, ogólne „najlepsze praktyki” polegały na usunięciu oczywistych informacji identyfikujących, takich jak nazwiska, adresy e-mail oraz numery telefonu i ubezpieczenia społecznego.

[Chcesz więcej informacji o prywatności i bezpieczeństwie? Zapisz się na biuletyn blogu ExpressVPN.]

Nieaktualne techniki anonimizacji

Wiele popularnych metod anonimizacji pozostało niezmienionych od lat 90., nie przyjmując bardziej złożonych technik anonimizacji w odpowiedzi na eksplozję danych online od.

Było kilka przypadków, już od 2000 r., Rzekomo anonimowych zbiorów danych, które zostały wydane, a następnie ponownie zidentyfikowane.

W 2017 r. Dziennikarze z powodzeniem „ponownie zidentyfikowali polityków w anonimowym zbiorze danych historii przeglądania 3 milionów obywateli Niemiec, odkrywając ich informacje medyczne i preferencje seksualne”.

Nowe badanie wskazuje również na wcześniejsze prace, w których naukowcy byli w stanie „jednoznacznie zidentyfikować osoby na anonimowych trajektoriach taksówek w Nowym Jorku, wycieczki rowerem w Londynie, dane metra w Rydze oraz zbiory danych telefonów komórkowych i kart kredytowych”.

Kilka punktów danych potrzebnych do ponownej identyfikacji

Badacze stworzyli formularz online, w którym możesz sprawdzić swoje szanse na identyfikację (tylko dla mieszkańców USA i Wielkiej Brytanii) z hipotetycznego towarzystwa ubezpieczeń zdrowotnych z zaledwie trzema danymi: płeć, data urodzenia i kod pocztowy.

Na przykład, jeśli byłeś amerykańskim mężczyzną urodzonym 12 listopada 1990 r., A obecnie mieszkasz w kodzie pocztowym 02139, istnieje 54% szansa, że ​​twój pracodawca lub sąsiad cię zidentyfikuje.

Ale odsetek ten wzrasta, gdy dodasz więcej atrybutów: samo dodanie stanu cywilnego może zwiększyć szansę na identyfikację 99%. Inne atrybuty obejmują liczbę pojazdów, klasę pracy (wybraną branżę) i własność domu.

W jaki sposób firmy powinny anonimizować nasze dane?

Z tego badania jasno wynika, że ​​obecne praktyki anonimizacji nie chronią odpowiednio prywatności ludzi i narażają ich na ponowne rozpoznanie przez każdego, kto ma dostęp do tych danych.

Niestety, niewiele można tutaj zrobić – to od firm i instytucji, które przechowują, sprzedają i wykorzystują te dane, by zmienić sposób ich anonimizacji. Przepisy, takie jak unijne RODO i kalifornijska ustawa o ochronie konsumentów, wymagają, aby osoby we wszystkich zestawach danych były anonimowe i niemożliwe do ponownej identyfikacji, ale pociągnięcie firm do odpowiedzialności może okazać się trudne.

Jednym ze sposobów zapobiegania ponownej identyfikacji anonimowych danych jest przyjęcie zróżnicowanej prywatności, modelu matematycznego, który ostrożnie dodaje kontrolowaną ilość losowego „szumu” do danych przed wysłaniem ich na serwer, dzięki czemu dane są nieco bardziej przybliżone niż dokładne, ale odpowiednio chroni prywatność osoby. Firmy takie jak Apple i Google włączyły zróżnicowaną prywatność do swoich zbiorów danych.

Wkrótce przekonamy się, że prywatność różnicowa zostanie przetestowana na wielką skalę: zostanie wykorzystana w kolejnym spisie ludności w USA.

Kroki, które możesz podjąć, aby się chronić

Więc kiedy firma poprosi Cię o zgodę na udostępnianie anonimowych danych stronom trzecim, co powinieneś zrobić? Rozważ anonimizację swoich danych. Nie każda firma naprawdę ma prawo do twojej prawdziwej daty urodzenia, twojego faktycznego kodu pocztowego, twojej płci lub stanu cywilnego, a nawet niekoniecznie twojego prawdziwego imienia i nazwiska. Jeśli jakiś szczegół nie jest kluczowy dla korzystania z określonej usługi, posyp trochę niespójności. (A jeśli w skrzynce pocztowej zacznie pojawiać się wyjątkowo błędnie napisana nazwa, będziesz dokładnie wiedzieć, która firma cię sprzedała).

Co więcej, współpracuj tylko z firmami, które są całkowicie otwarte na temat tego, jakie dane gromadzą, które nigdy nie zbierają żadnych niepotrzebnych danych, które nigdy nie udostępniają ani nie sprzedają twoich danych osobowych stronom trzecim, i które anonimizują nawet podstawową diagnostykę informacje śmiertelnie poważne (a nawet pozwalają zrezygnować, jeśli chcesz). Zdarza się, że znamy co najmniej jeden.

Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map