Big data og den store personvernutfordringen

Hver dag sender vi store mengder data om oss selv til Google, Facebook, via mobilene, nettavisene vi leser og annonsenettverkene på nettsidene vi besøker. Også smart tv’en og andre hjemmedingser som er koblet opp mot wifi/internett kan gjøre dette med mindre man skrur det av. De er alle sammen på hver sin måte med til å avsløre hva du gjør, hva du søker på, hva du kjøper, hva du sier og liker på Facebook, hva du klikker på, hvilke nyheter du leser eller hvilke jobber du søker på. Det er med andre ord omfattende informasjon om oss selv som blir delt videre!

Via treningsapper og andre sensorbaserte tjenester sender du av gårde data om kroppens aktivitetsnivå. Via legen og andre medisinske instanser blir det sendt informasjon om helsen din. Det offentlige vet mye om dine økonomiske og skattemessige forhold. Mobilen er nesten for et komplett overvåkningssenter å regne, særlig om du også har GPS slått på. Noe av dataene er sikret, men det meste er ikke. En del av dataene er personlige og knyttet opp mot ditt navn eller andre personlige data om deg selv, mens mye av dataen er anonymisert eller befinner seg i en gråsone for hva som kan betegnes for personlig. Problemet er at noen få selskaper sitter på veldig mye forskjellige data om oss og det er vanskelig å se for seg hvordan dataene kan kombineres og utnyttes, ikke minst i et fremtidsscenario. Hvis man skulle ønske å distansere seg fra denne datadelingen, er det nesten umulig, når man ønsker å være til stedet digitalt, sosialt og funksjonelt i samfunnet.

Mye av datainnsamlingen har pågått i mange år; dermed er mengden innsamlet data i mange tilfeller særdeles omfattende, selv om ikke alle dataene er av det slag som kan kobles direkte opp mot deg som person. Til en viss grad dreier det seg om data som brukes for å gjøre tjenester bedre eller utvikle nye tjenester. Dataene brukes også ofte til markedsføring, som igjen kan rettes direkte tilbake til brukeren igjen, ofte i form av retargeting annonsering. Dataene beveger seg på tvers av landegrenser, noe som gir juridiske utfordringer.

En av de mest grunnleggende problemene med den omfattende innsamlingen av data, er at kun de færreste har særlig oversikt over hvor mye data som blir samlet inn om dem og hvordan denne blir brukt. Fordi man har begrenset oversikt og kunnskap om hvordan data blir delt, kan det også medføre at man utvikler feilaktige forestillinger om hvordan dataene benyttes. Det er ikke usannsynlig at disse forestillingene også kan innta en konspiratorisk form noen ganger, og at man tillegger IT aktørene verre hensikter enn de har i virkeligheten. Dette burde bekymre de respektive selskaper ettersom det er med til å undergrave tilliten man har til dem.

Selvsagt er det svært variabelt hvilken grad av tillit man har til de respektive aktører. I Norge har forhåpentligvis de fleste en høy grad av tillit til offentlige aktører, mens tilliten til private aktører som Facebook og Google ser ut til å ha blitt lavere blant mange brukere, i hvert fall kan det se ut til at antallet mer kritiske medieinnlegg de siste årene kan ha økt folks bevissthet. I andre land vil dette kunne være helt motsatt.

Brukernes tilnærming til denne problemstillingen varierer naturligvis etter hva slags brukere de er.

På den ene siden har man brukere som ikke bryr seg om hvordan dataene blir delt. De har stor grad av tillit til selskapene og hvordan de behandler dataene, selv når de burde være bekymret. Høyst sannsynlig er uvitenhet årsaken til den manglende bekymringen. De baserer seg på forestillingen om at fordi de ikke selv har noe å skjule, så gjør det ingen ting at de sender av sted data om seg selv. Nettopp denne tankegangen har IT selskapene belaget seg på i mange år, mens de tjener milliarder.

Andre brukere forstår at de bør bekymre seg, men mangler kunnskapen om hvordan de skal gardere seg, hvilket medfører at de føler seg maktesløse og gir opp å forstå hva det innebærer.

Til slutt har man brukeren som både er skeptisk og også har kompetansen til å gardere seg mot datamisbruk og derfor enten ikke bruker tjenester som stjeler hans data og også sikrer seg ved å installere programmer og plugins slik at han har kontroll på egne data i den grad det er mulig. Denne type bruker bør være en utfordring for IT selskapene, fordi inntjeningen dermed kan begrense seg. På sikt vil man forhåpentligvis se flere slike brukere fordi den generelle teknologikompetansen vil øke. Derfor burde også dette bekymre selskapene som lever av brukerdata.

Eksempelvis burde nettaviser og annonsenettverk se verdien i å luke ut useriøse annonsører, slik at folk i mindre grad behøver å benytte seg av blocking-verktøy, som forhindrer nettaviser og andre nettaktører fra å tjene penger.

Ettersom datamengden vil eskalere ytterligere fremover, i form av at mengden tjenester, systemer og dingser med tilhørende brukerdata vil øke eksponentielt, må kunnskapen økes tilsvarende på både bruker-, bedrifts- og samfunnsnivå. I verst tenkte scenarier kan man ikke utelukke at det kan utgjøre en mulig nasjonal sikkerhetsrisiko.

En annen utfordring relatert til Big data-problematikken er hvilke beregninger man foretar på bakgrunn av dataene man har, enten det er på individnivå, gruppenivå eller hele befolkningen. For en ting er hva IT gigantene eller systemene vet om deg, det andre er hvilke beregninger som kommer ut av dette og hvor korrekte disse er. Det er mange grunner til å være kritisk til hvilke resultater man får ut av disse enorme datamengdene og hvor verdifulle resultatene er, enten det er i en bedrift, på samfunnsnivå eller for den enkelte bruker. Det er en enorm analyseprosess å vurdere om dette faktisk gavner oss eller om det er et potensielt blindspor i den teknologiske utviklingen.