Анонимирани демографски подаци се још увек могу користити за идентификацију

Профил мушкарца чије лице има препознатљиве податке о њему.

Ако сте један од ретких људи који читају услове коришћења услуге, можда ћете у закону о приватности различитих компанија пронаћи клаузулу која каже да могу да прикупљају и продају ваше податке трећим лицима.

Подаци, кажу, анонимни су, али нова студија објављена у Натуре Цоммуницатионс показује да, у зависности од тога шта делите, још увек можете да вас идентификујете задивљујућом тачношћу. Истраживачи са Империал Цоллеге Лондон и Универзитета Лоуваин у Белгији креирали су модел машинског учења који може поново препознати људе из анонимних скупова података, чак и из „јако непотпуних скупова података“.

Овакве објаве долазе у време када више људи пази на компаније које продају своје податке трећим лицима и имају штетне импликације на приватност тренутно сачуваних (и дељених) анонимних података које многе компаније и академске институције прикупљају и користе.

Како функционира анонимизација података?

Ако нисте потпуно изван мреже, редовно производите мноштво личних података – од ваших куповина на мрежи и рута за трчање до више личних података попут ваших здравствених картона.

Такви скупови података представљају златну прашину за оглашиваче који желе да побољшају своје циљање (читај: Цамбридге Аналитица), као и за истраживаче који траже трендове у јавном здравству и да науче препознавање лица вештачкој интелигенцији.

Да би се заштитили идентитети који стоје иза података, општа „најбоља пракса“ била је уклањање очигледно идентификационих информација попут имена, адресе е-поште и бројева телефона и социјалног осигурања..

[Желите више вести о приватности и безбедности? Пријавите се на билтен за ЕкпрессВПН блог.]

Застареле технике анонимизације

Многе популарне методе анонимизације остале су непромењене од деведесетих година прошлог века, а нису усвојиле сложеније технике анонимизације као одговор на експлозију мрежних података од тада.

Било је неколико случајева, отприлике 2000, наводно анонимних скупова података који су ослобођени и касније поново идентификовани.

У 2017. години новинари су успешно „идентификовали политичаре у анонимном скупу података о историји прегледа 3 милиона немачких грађана, откривајући њихове медицинске податке и своје сексуалне склоности“.

Нова студија такође указује на претходни рад у којем су истраживачи успели да „јединствено идентификују појединце у анонимним такси путањама у НИЦ-у, излетима за дељење бицикла у Лондону, подацима подземне железнице у Риги, скуповима података о мобилним телефонима и кредитним картицама“.

Неколико података потребно је да вас поново идентифицирају

Истраживачи који стоје иза студије изградили су интернетски образац на којем можете тестирати своје шансе да се идентификујете (само за становнике Сједињених Држава и Велике Британије) од хипотетичке компаније за здравствено осигурање са само три тачке података: ваш пол, датум рођења и поштански број..

На пример, ако сте били амерички мушкарац рођен 12. новембра 1990. године и тренутно живите у поштанском броју 02139, постоји 54% шанса да вас послодавац или комшија препозна.

Али тај проценат се повећава када додате још атрибута: Додавање самог брачног статуса може повећати шансу да вас идентификујете 99%. Остали атрибути укључују број возила, радни разред (изабрана индустрија) и власништво куће.

Како компаније требају анонимизирати наше податке?

Из ове студије је јасно да тренутна пракса анонимизације не штити адекватно приватност људи и оставља их рањивим да их поново идентификује онај ко има приступ тим подацима.

Нажалост, појединац овде не може много учинити – на компанијама и институцијама које складиште, продају и користе ове податке, то је промења начина на који они анонимују податке. Прописи попут ГДПР-а ЕУ и Калифорнијског закона о приватности потрошача захтевају од појединаца у свим скупима података да буду анонимни и немогуће их је поново идентификовати, али држати одговорне компаније могу се показати тешко.

Један од начина спречавања поновне идентификације у анонимним подацима јесте усвајање диференцијалне приватности, математичког модела који пажљиво додаје контролисану количину случајног „шума“ у податке пре него што се пошаљу серверу, чинећи податке мало приближнијима него тачним, али на одговарајући начин штити приватност појединца. Компаније попут Аппле-а и Гоогле-а уградиле су различиту приватност у своје прикупљање података.

Ускоро ћемо видети различиту приватност која ће бити тестирана на велико: она ће бити коришћена у наредном америчком попису становништва.

Кораци које можете предузети како бисте се заштитили

Па кад нека компанија затражи вашу дозволу за дељење анонимних података са трећим лицима, шта треба да радите? Размислите о анонимности својих података сами. Није свака компанија заиста права на ваш датум рођења, стварни поштански број, полни или брачни статус или чак нужно ваше право име. Ако неки детаљ није пресудан за употребу одређене услуге, пошкропите около неке недоследности. (А ако се у поштанском сандучићу покаже јединствено погрешно написано име, знаћете тачно која вас компанија је продала.)

Још боље, послујте само са компанијама које су потпуно напредне око података које прикупљају, које никада не прикупљају никакве податке који им нису потребни, а који никада не деле или не продају ваше личне податке било којој трећој страни, а који анонимно подносе чак и основну дијагностику. информације озбиљно озбиљне (и чак вам дозвољавају да одустанете, ако желите). Случајно знамо барем једног.

Kim Martin
Kim Martin Administrator
Sorry! The Author has not filled his profile.
follow me