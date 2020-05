Velký datový striptýz

Sbíráme o vás hodně dat, ale nebojte, vše je anonymní. Zaklínadlo v podobě anonymních dat se opět hlásí o slovo, tentokrát vítr vane od karetní společnosti Mastercard, která zpřístupnila zdarma svou rozsáhlou databázi Mastercard Tourism Insights.

Kromě informací z karet jsou v této databázi i data, která Mastercard nakoupila od třetích stran, jako jsou vyhledávače, rezervační systémy nebo sociální sítě. Ale prý jde o agregovaná, vyčištěná, anonymizovaná a kdo ví jaká ještě data.

Před dvěma lety publikoval The Guardian článek o tom, jak byly odhaleny tajné základny speciálních jednotek v zemích třetího světa. Vojáci tam totiž chodili ven běhat s chytrými hodinkami. Data z těchto hodinek byla také agregovaná a anonymizovaná, jenže v širokém okolí nikdo jiný s healthtrackery nebyl, takže jakmile byla vystavena veřejně, bylo snadné je odhalit.

Nedávno mi kolega poslal článek o tom, že ve státě Washington je legální prodávat anonymizovaná zdravotní data a že jedna datová analytička dokázala tyto záznamy propojit s fyzickou identitou několika lidí. Porovnala získaná data s jinými dostupnými údaji, třeba z veřejně dostupných zdrojů, jako jsou novinové články či sociální sítě. To je zase nějaký konspirační nesmysl, říkám si.

Jenže co třeba agregovaná data o pohybu z mobilních telefonů? Máte mapu a na ní čáry z mobilů. Jistěže anonymních. Co když je uvidí váš zaměstnavatel, co nemá příliš rád demonstrace. A uvidí tam trasu váš domov, zaměstnání a demoška? Dostanete padáka? Pokud se na zmíněné trase nepřipletlo moc telefonů, jste odhaleni. Čím méně datových stop spolu s kratším obdobím, tím spíše k odhalení dojde. Inu, není anonymizace jako anonymizace.

Řada subjektů dnes bezelstně vydává citlivá data v anonymizované podobě jiným subjektům. Jak ale prohlásil jeden špičkový markeťák, skutečně anonymizovaná data dneska nikdo nechce, protože se podle nich nedá profilovat.

Tesat.