Vaikka se käyttää usein melko monimutkaisia algoritmeja, eroavaisen yksityisyyden tavoite on melko yksinkertainen: varmista, että ihmisillä, joiden tietoja kerätään, on yhtä paljon yksityisyyttä kuin jos tietoja ei olisi koskaan tallennettu. Sinun ei pitäisi koskaan pystyä tunnistamaan ketään vain katsomalla joukkoa tallennettua tietoa heistä.
Kuinka erilainen yksityisyys toimii
Koska tietoja meistä kerätään ennennäkemättömällä nopeudella ja ihmiset ovat siitä epämukavia, ajatus siitä, että yksityisyytesi voidaan todistaa matemaattisesti, alkaa näyttää hyvältä. Yritykset, kuten Microsoft, Google, Apple, Facebook ja Uber, ovat joko toteuttaneet sen jossakin muodossa tai tutkivat vaihtoehtojaan, mutta jo ennen kuin iso tekniikka kiinnostui, sitä käytettiin esimerkiksi arkaluontoisiin tutkimustietoihin, lääketieteellisiin tietueisiin ja jopa osiin Yhdysvaltain väestönlaskennasta.
Se tekee tämän lisäämällä kohinaa joko itse tallennettuihin tietoihin tai tuloksiin, jotka palautetaan, kun joku kyselee sitä – sekoittamalla yksittäisiä tietoja, mutta säilyttäen yleisen muodon. “Melu” on olennaisilta osin epäsäännöllisyys tai selittämätön vaihtelu tiedoissa, ja tavoitteena on lisätä melua yksittäisiin datapisteisiin pitäen samalla yleiset mitat, kuten keskiarvo, mediaani, tila ja keskihajonta, lähellä niiden sijaintia.
Yksinkertainen differentiaalinen yksityisyys
Kuvitelkaamme, että sinut on valittu osallistumaan uraauurtavaan yhteiskuntatieteelliseen tutkimukseen. Tässä on kuitenkin saalis: jotkut kysymykset ovat mahdollisesti kiusallisia, syyttäviä tai muuten hankalia sinulle. Sanotaan vain, ettet halua kenenkään näkevän nimesi valintamerkin vieressä sarakkeessa ”Todella piti Thrones-pelin viimeisestä kaudesta”.
Onneksi tutkijat ovat anonimoineet tutkimuksen. Nimien sijaan saat satunnaisluvun, mutta silloinkin ihmiset voivat käyttää vastauksiasi ja kaventaa sitä sinulle.
Se on ongelma, joka on tosiasiassa tullut melko vähän todellisessa maailmassa, ehkä tunnetuin milloin tutkijat pystyivät tunnistamaan paitsi Netflix-käyttäjät mutta jopa saada tietää heidän poliittisista mieltymyksistään. Mutta entä jos voisimme hyödyntää nämä tiedot samoin kuin kyselymme, jotta kukaan tuloksia lukeva ei tietäisi varmasti, mitä kukin sanoi?
Lisätään melua kolikkoläpillä
Tässä on tekniikka, jota voimme käyttää sekä yksityisyyden ylläpitämiseen että sellaisten tulosten saamiseen, jotka näyttävät kokonaisuudessaan siltä kuin ne olisivat, jos kaikki kertovat totuuden:
- Esitämme sinulle kyllä / ei-kysymyksen (piditkö viimeisestä Game of Thrones -kaudesta?). Käännät kolikon.
- Jos kolikko on päätä, käännä kolikko uudelleen. (Ei ole väliä mitä saat toisen kerran.) Vastaa kysymykseen rehellisesti. (“Joo.”)
- Jos se on häntää, käännä kolikko uudelleen. Jos se on päätä, sano “Kyllä”. Jos se on häntä, sano “Ei”.
Emme katso kolikkoa, joten emme tiedä, käskikö se valehdella vai ei. Tiedämme vain, että sinulla oli 50% mahdollisuus kertoa totuus ja 50% mahdollisuus sanoa “Kyllä” tai “Ei”.
Vastauksesi tallennetaan sitten nimesi tai henkilötunnuksesi viereen, mutta sinulla on nyt uskottava kiistettävyys. Jos joku syyttää sinua viimeisen Game of Thrones -kauden nautinnosta, sinulla on puolustus, jota tukevat todennäköisyyslait: kolikon kääntö sai sinut sanomaan sen.
Todelliset algoritmit, joita useimmat teknologiayritykset käyttävät yksityisyyden suojaan, ovat paljon monimutkaisempia kuin tämä (kaksi esimerkkiä alla), mutta periaate on sama. Tekemällä epäselväksi, onko kukin vastaus oikea vai ei, tai jopa muuttamalla vastauksia satunnaisesti, nämä algoritmit voivat varmistaa, että riippumatta siitä, kuinka monta kyselyä joku lähettää tietokantaan, he eivät pysty tunnistamaan ketään konkreettisesti.
Kaikki tietokannat eivät kuitenkaan käsittele tätä samalla tavalla. Jotkut käyttävät algoritmeja vasta, kun tiedusteluista kysytään, eli itse tietoja tallennetaan edelleen alkuperäisessä muodossaan jonnekin. Tämä ei tietenkään ole ihanteellinen tietosuojaskenaario, mutta erilainen yksityisyyden suojaaminen missä tahansa vaiheessa on parempi kuin vain raakadatan työntäminen maailmaan.
Kuinka sitä käytetään?
Omena
Apple käyttää erilaista yksityisyyttä peittää yksittäiset käyttäjätiedot ennen kuin ne on koskaan lähetetty heille, käyttämällä logiikkaa, jonka mukaan, jos monet ihmiset lähettävät tietonsa, melulla ei ole merkittävää vaikutusta koottuihin tietoihin. He käyttävät tekniikkaa nimeltä Count Count Sketch, mikä tarkoittaa lähinnä sitä, että tiedot koodataan, satunnaisia kappaleita muutetaan ja sitten “epätarkka” versio dekoodataan ja lähetetään Applelle analysoitavaksi. Se ilmoittaa asioista, kuten heidän kirjoittamisehdotuksistaan, hakuvihjeistä ja jopa emojista, jotka avautuvat, kun kirjoitat sanaa.
Googlen ensimmäinen suuri kokeilu erilaiseen yksityisyyteen oli RAPPOR (satunnaistettu koottu tietosuojaa säilyttävä tavallinen vaste), joka kuljettaa tiedot suodattimen läpi ja muuttaa satunnaisesti kappaleita käyttämällä yllä kuvatun kolikon kääntömenetelmän versiota. Alun perin he käyttivät sitä tietojen keräämiseen tietoturva-asioista Chrome-selaimessa ja ovat sen jälkeen soveltaneet erilaista yksityisyyttä muualla, kuten löytäneet yrityksen kiireisyyden milloin tahansa paljastamatta yksittäisten käyttäjien toimintaa. He ovat todella hankkineet tämän projektin, joten heidän työnsä perusteella voi olla enemmän sovelluksia.
Miksi kaikkia tietoja ei käsitellä tällä tavalla?
Eri tietosuoja on tällä hetkellä hieman monimutkainen toteuttaa, ja sen mukana tulee tarkkuuden kompromissi, joka voi vaikuttaa negatiivisesti kriittiseen dataan joissakin olosuhteissa. Koneoppimisalgoritmi, joka käyttää yksityistettyjä tietoja arkaluonteisessa lääketieteellisessä tutkimuksessa, saattaa tehdä virheitä, jotka ovat riittävän suuria tappamaan esimerkiksi ihmisiä. Siitä huolimatta se näkee jo todellista käyttöä tekniikan maailmassa, ja kun otetaan huomioon lisääntyvä tietoisuus tietosuojasta, on hyvät mahdollisuudet nähdä matemaattisesti todistettavissa oleva yksityisyys mainostettavan tulevaisuudessa myyntikohteena.
Kuvahyvitykset: RAPPOR-tietovirta, Palvelinpuolen algoritmi Hademard Mean Count -piirustukselle, Dataset-survey R-MASS -paketti, Todennäköisyyksien puu – kolikon kääntäminen
Liittyvät:
-
12 turvallisinta sähköpostipalvelua yksityisyyden parantamiseksi
-
Palauta yksityisyytesi näillä Googlen palveluiden tietosuojaan keskittyvillä vaihtoehdoilla
-
18 Tietosuoja-asetukset, jotka sinun tulisi tutkia Windows 10: ssä