Privatliv i data mining er altafgørende: University of Newcastle

  • Nov 01, 2023

Der er forskellige metoder, dataindsamlere kan bruge til at beskytte fortrolige oplysninger om personer, de er indsamle oplysninger fra, ifølge University of Newcastle lektor Dr. Ljiljana Brankovic.

Der sker et mineboom lige nu, og det har intet med ressourcer at gøre. Data mining er blevet en usædvanlig rentabel forretning, da oplysninger om enkeltpersoner indsamles, handles og analyseres. Beskyttelse af dataenes privatliv er til gengæld altafgørende, og dataindsamlere skal sammen med dataminere anvende nye teknikker til at sikre, at privatlivets fred ikke kompromitteres, ifølge University of Newcastle, New South Wales, professor Dr. Ljiljana Brankovic.

Der er en database for næsten alt i disse dage, lige fra personlige oplysninger indsamlet af hospitaler til, hvad der bliver sagt på sociale medier. Disse databaser pakkes ofte sammen og sælges eller afleveres til forskningsformål for at udvinde ny indsigt om offentligheden.

Fjernelse af unikke identifikatorer fra oplysningerne menes almindeligvis at forhindre dem, der har adgang til databasen fra kræsne fortrolige individuelle oplysninger, men Dr. Brankovic sagde, at dette er ukorrekt. Ofte kan mønstre, der skinnede fra databaser, føre til identifikation af en person, sagde hun.

"Dataindsamlere har et stort ansvar for at sikre, at data er beskyttet," sagde Dr. Brankovic på Open Group Enterprise Transformation-konferencen i Sydney mandag. "Nu har vi love på vej, og det er meget svært at følge med."

Den nye lov, Brankovic henviser til, er 2012 Privacy Amendment Bill, der træder i kraft i 2014, og som vil gøre den private sektor mere ansvarlig for databeskyttelse. Virksomheder skal også være bekymrede over muligheden for, at de data, de indsamler, bliver stjålet af ubudne gæster, og disse individuelle oplysninger skal stadig beskyttes på en eller anden måde.

Hvordan kan de for dataindsamlere sælge databaser til andre virksomheder og samtidig opretholde et niveau af privatliv for de personer, hvis oplysninger er blevet indsamlet? Dr. Brankovic sagde, at der er flere teknikker til at gøre det.

"Alle skal kun have adgang til data, der er af interesse for dem. Det er klart, fordi ikke kun data er fortrolige, mønstre kan også være fortrolige," sagde hun. "Et sæt beskyttelsesforanstaltninger kaldes begrænsning, hvor man ikke tillader fuld adgang til dataene.

"Nogle forespørgsler vil blive besvaret, og nogle bliver ikke - der er forskellige måder at gøre det på. Et potentielt problem med dette er, at du måske ikke svarer på noget, du kunne, og nogle gange er det stadig ikke sikkert."

En anden måde er at tilføje støj til dataene, hvilket også har sine begrænsninger, men kan være en effektiv måde at sikre, at selvom ubudne gæster får fingrene i dataene, ville det være ekstremt vanskeligt for dem at udtrække fortrolige individuelle oplysninger fra det.

Processen med at tilføje støj til dataene er randomiseret, så mønstre i dataene er næsten umulige at skelne, ifølge Dr. Brankovic.

"Du kan se på dataene og derefter tilføje det støjniveau, du har brug for," sagde hun. "Du kan tilføje støj til dataene og derefter sælge dem, men din egen kopi forbliver ren.

"Du vil ikke tilføje støj og miste din kopi - det er dine data."

Uanset hvilke teknikker dataindsamlere og minearbejdere anvender, understregede Dr. Brankovic, at mens privatlivets fred give enkeltpersoner nogle rettigheder til de oplysninger, der indsamles om dem, ejer de ikke selve dataene.

Byrden for at beskytte dataene påhviler stadig dem, der indsamler dataene, sagde hun.