Skal kunstig intelligens fiske med net eller harpun?

TECHTENDENSER: Skal vi fiske med net eller med harpun, når vi bruger kunstig intelligens til at jagte de værdifulde indsigter, som gemmer sig i oceanerne af data? Teknologien gør det muligt at kaste stadig bredere net ud, men hensynet til privatliv og menneskerettigheder passer bedre med at gå efter et enkelt, veldefineret mål.  

Peter Hesseldahl

AI i det offentlige

Kunstig intelligens er på vej ind i den offentlige sektor. I en serie artikler ser vi nærmere på, hvordan avanceret automatisering og dataanalyse påvirker sagsbehandlingen og lovgivningen, og hvilke etiske dilemmaer kunstig intelligens fører med sig.

AI kan løfte borgere – eller holde dem nede

Skal kunstig intelligens fiske med net eller harpun?

Nu bliver den offentlige sektor kunstigt intelligent

AI i det offentlige sætter borgernes tillid på spil

Der er to modstridende logikker inden for brug af big data og kunstig intelligens.

Fra et teknologisk synspunkt er den mest effektive måde at bruge kunstig intelligens at indsamle så mange data som muligt, som så kan samkøres og analyseres af computeren på kryds og tværs for at finde sammenhænge.

Den store, nye styrke ved maskinlæring er netop, at computeren ofte ser komplekse mønstre, som mennesker ikke ville have opdaget, fordi vi ikke kan overskue så store mængder data.

Et eksempel kan være, at computeren bemærker, at der er sammenhænge mellem en gruppe menneskers dna-profiler, og hvorvidt de får bivirkninger af forskellige slags medicin. Jo flere data maskinen kan søge i, des mere præcise og des mere komplekse sammenhænge kan den spore.

Fra et privatlivssynspunkt gælder det tværtimod om at begrænse brugen af personlige data.

Vi har hver især ret til at vide, hvornår andre samler data om os, og hvad informationerne bliver brugt til. Andre skal ikke kunne snage i vores personlige data, og ved at minimere indsamlingen og stille strenge krav til samkørslen forsøger vi at sikre os mod de lækager og misbrug, der uvægerligt sker i et vist omfang. 

De to logikker vil være på kollisionskurs i de kommende år. Efterhånden som kunstig intelligens og maskinlæring modnes og breder sig, vil presset vokse for at slippe grebet om vores data, så computerne kan udfolde deres potentiale.

Man kan nærmest sige, at det er teknologiens natur; den fungerer bedst, jo flere data den har til rådighed. Menneskers natur derimod er at holde kortene tættere til kroppen.

Målrettet, begrænset og rimeligt

I forhold til personlige data er lovgivningen i dag ret klar: Man skal holde sig til harpunen, når man vil have indsigt i folk.

Der er især tre bestemmelser, som skal sikre borgerne mod urimelig overvågning.

  • Data skal indsamles til et konkret formål
  • Der må kun indsamles de højst nødvendige data
  • Der skal være proportionalitet imellem graden af indsamling og analyse og det resultat, man kan opnå.

Det skal understreges, at den relativt strenge regulering gælder for persondata, som altså kan henføres en specifik person. Der samles masser af ikkepersonlige data, som uden videre kan analyseres og samkøres, for eksempel trafiktællinger, miljømålinger, data fra produktion eller anonyme data om udbredelsen af sygdomme eller indkomstfordeling.

GDPR, det europæiske direktiv om beskyttelse af persondata, siger, at indsamlingen af personlige data kun må foretages til et konkret formål, som borgerne skal kende. Dataene må ikke bruges i andre sammenhænge eller på måder, der er i modstrid med den oprindelige indsamling.

GDPR siger også, at man ikke må indsamle eller behandle flere data, end hvad der er højst nødvendigt i forhold til det konkrete formål.

Endelig fastslår Den Europæiske Menneskerettighedskonvention, at der skal være et rimeligt forhold mellem den gevinst, brugen af personlige data kan have for samfundet, og det indgreb i en persons privatliv, som overvågningen medfører. I menneskerettighedskonventionen har beskyttelse af persondata status på linje med boligens ukrænkelighed.

Alle tre bestemmelser er naturligvis stærkt frustrerende for en kunstig intelligens, der bare gerne vil gøre sit job så godt som muligt.

Frit valg på stort set alle hylder

Når det offentlige i de kommende år begynder at bruge kunstig intelligens, vil det være fristende at samle masser af data for mere effektivt at kunne spotte problemer og unormale forhold.

Det var tanken bag Gladsaxe-modellen, som måtte droppes. Ved at samkøre en lang række oplysninger ville kommunen identificere familier med små børn, der havde risiko for at mistrives.

På samme måde kan man i princippet opstille flere filtre, der automatisk søger efter andre problematiske forhold, som kommunen med god grund vil forsøge at fange i opløbet. Man kunne tjekke for indikationer på misbrug, depression, demens, radikalisering … whatever.

Kort sagt, der kunne være store muligheder i at fiske med store net i den offentlige pulje af data.

Den civile instans, der nok i dag går længst i den retning, er Udbetaling Danmark, der står for at udbetale offentlige tilskud og ydelser som folkepension, boligstøtte, børnetilskud og barselspenge. For at kontrollere for snyd har Udbetaling Danmark, der drives af ATP, fået meget vidtgående adgang til offentlige registre.

Jurist og vicedirektør i tænketanken Justitia, Birgitte Arent Eiriksson, beskriver i en artikel i bogen ’Eksponeret’, at Udbetaling Danmark uden borgerens samtykke kan trække oplysninger om økonomiske forhold og om ferier – ikke kun for modtageren af en ydelse, men for samlever, familien og andre medlemmer af husstanden.

Om nødvendigt kan man desuden trække data fra blandt andet uddannelsesinstitutioner, sygehuse, læger, psykologer, pengeinstitutter og arbejdsgivere.

I 2016 ansøgte Udbetaling Danmark om også at få adgang til at trække data fra folks elmålere, men det blev afvist af regeringen.

Det interessante ved data fra elmålere er ikke så meget elforbruget i sig selv. Målingerne kan give et indblik i, hvor mange der bor i en husstand, hvornår de er hjemme, hvornår de står op og går i seng, og om de er bortrejst i perioder.

Udbetaling Danmark foretager løbende datasammenkøringer, der omfatter op til 2,7 millioner modtagere af ydelser. Man skønner, at værdien af kontrolindsatsen i 2018 lå på 552 millioner kroner, men trods det meget store antal mennesker, som automatisk kontrolleres, er antallet af sager, der udtages til nærmere behandling lidt over 3.000.

Udbetaling Danmarks detaljerede analyser af en stor del af den danske befolkning rejser naturligvis spørgsmålet, om gevinsterne er proportionale med indgrebet i privatlivet, og om dataindsamlingen kan siges at være målrettet og begrænset.

Umiddelbart virker det som om, der fiskes med meget store net snarere end harpuner.

Den hollandske dom

I begyndelsen af februar blev et offentligt hollandsk kunstigt intelligent system til at afsløre skattesnyd og socialt bedrag dømt ulovligt ved en hollandsk domstol.

SyRI, system til risikoidentifikation, var udviklet til at forudsige risikoen for, at en person vil begå socialt bedrageri, skattesnyd eller udføre sort arbejde.

Systemet er især blevet brugt til at analysere befolkningen i boligkvarterer med lave indkomster ved at sammenkøre informationer fra en række offentlige registre om beskæftigelse, gæld, sociale udbetalinger og uddannelse.

Rettens afgørelse henviste specifikt til de krav, som EU og Den Europæiske Menneskerettighedskonvention stiller. Dommen fastslog, at det ikke var gennemskueligt, hvordan systemet nåede frem til sine vurderinger, at systemet havde en diskriminerende effekt over for indvandrere og grupper med lave indkomster, og at data ikke blev anvendt målrettet og i rimeligt omfang.

Man må forvente, at der vil komme mange lignende sager, der skal afgøre, hvorvidt myndigheder kan anvende kunstig intelligens som et net eller en harpun.


Få Mandag Morgens overskrifter direkte i din mail.

Tilmeld dig nyhedsbrevet nu




Få Mandag Morgens overskrifter direkte i din mail.

Tilmeld dig nyhedsbrevet nu