Big Data er en ny tids råstof

Vi står på tærsklen til en digital revolution, der rækker langt ud over it-branchen. De kolossale og voksende datamængder bliver en eftertragtet råvare med mangfoldige anvendelsesmuligheder i erhvervslivet og i en lang række samfundssektorer. Intelligent brug af data kan spare 15-20 pct. på de offentlige driftsbudgetter, løfte indtjeningen markant i private virksomheder og skabe helt nye vækstbrancher. Barack Obama og andre toppolitikere har sat data højt på den politiske dagsorden, men danske beslutningstagere tøver.

Anders Rostgaard Birkmann
Et intelligence-partnerskab

Denne analyse er den første i en analyseserie om datadreven innovation, som Mandag Morgen i de kommende uger offentliggør på mm.dk og i månedsmagasinet Navigation. Mandag Morgen har i den forbindelse indgået et intelligence-partnerskab med Google, der har været med til at støtte projektet, levere data og ny viden. Mandag Morgen har det fulde ansvar for det journalistiske indhold.

I Luleå i det nordlige Sverige, mindre end 100 kilometer fra polarcirklen, kan et begejstret bystyre i øjeblikket se den digitale datarevolution udspille sig for deres øjne. Her bygger internetkæmpen Facebook nemlig et datacenter, der bliver det hidtil største af sin art. Fabriksbygninger vil dække et areal, der svarer til 13 fodboldbaner. 

Forklaringen på den særegne placering er kulden. Med frostgrader i 8 ud af 12 måneder er det muligt for Facebook og andre store it-giganter at spare udgifterne til den nedkøling, der er nødvendig for at opbevare de mange data. Og mængderne vokser. Ifølge it-analysehuset IDC vil det digitale univers vokse med faktor 300, fra 130 exabyte i 2005 til 40.000 exabyte i 2020. Det svarer til mere end 5.200 gigabyte for hver verdensborger – mand, kvinde eller barn. Se figur 1. 

Dataeksplosionen" caption="Figur 1  

Figur 2  " align="left" image="https://www.mm.dk/wp-content/uploads/2016/02/92d8d-arb_fig02_saadanomsaettesdatatilpenge.png" image_width="0" image_full="https://www.mm.dk/wp-content/uploads/2016/01/35bb4-arb_fig02_saadanomsaettesdatatilpenge.png | Forstør   Luk

Big data giver værdi på flere niveauer – fra dataopsamling over bedre drevne forretninger til helt nye virksomheder.

Kilde: Digital Universe Study, IDC, 2012. [/graph]

Lignende datacentre skyder i øjeblikket op over hele verden. Google har indrettet en såkaldt serverfarm på en tidligere papirfabrik i Finland. Og Amazon har spredt serverparker rundt over hele Europa for at være tæt på kunderne. De store it-giganter bruger nemlig ikke kun datacentrene til deres egne datadrevne forretninger, men lejer også datakraften ud til andre virksomheder. 

For big data er ikke længere et fænomen forbeholdt internetvirksomheder. Ifølge eksperterne vil datarevolutionen i de kommende år vende op og ned på hverdagen for samfund, virksomheder og almindelige borgere. 

Et paradigmeskifte

De nye, store datacentre bliver – kombineret med højhastighedsforbindelser og kraftigere computere – hjertet, hjernen og rygraden i en stadig mere udbygget digital økonomi, hvor data er den centrale råvare med næsten ubegribelige anvendelsesmuligheder. 

OECD anslår i en rapport fra midten af april, at udnyttelse af big data kan spare europæiske regeringer for 15-20 pct. på de offentlige driftsbudgetter. Og billedet går igen sektor efter sektor. Eksisterende virksomheder kan øge indtjeningen med 5-6 pct. ved at hoppe med på datarevolutionen. Og dertil kommer talrige nye virksomheder, der opstår alene på grund af mulighederne for at bearbejde data på nye måder. Data er basalt set gået fra at være en nødvendig faktor i handelstransaktioner til at blive selve handelsvaren. 

Big data er ikke bare et særligt it-fænomen. Allerede i dag ser vi, hvordan intelligent brug af data har vidtrækkende anvendelsesmuligheder på en række områder fra sundhedssektoren til trafikplanlægning og miljøteknologi.

Hovedforklaringen er, at de enorme datamængder giver mulighed for at få besvaret nogle af de spørgsmål, vi aldrig tidligere har kunnet få svar på. Vi er vidner til et paradigmeskifte, der tåler sammenligning med de store videnskabelige revolutioner, mener Viktor Mayer-Schönberger, medforfatter til den nye bog “Big Data – A Revolution That Will Transform How We Live, Work and Think” og professor ved Oxford University. 

“Tidligere var det dyrt at tilvejebringe data. Når man havde brug for et svar på et spørgsmål, foretog man en stikprøve, der kunne besvare det. Men stikprøver forudsætter, at du har et konkret spørgsmål at stille. I en æra med big data kan man teste mere abstrakte teorier, fordi datagrundlaget allerede eksisterer,” siger han.

I første omgang er den største udfordring imidlertid at forstå fænomenet til bunds og udvikle et nyt mindset, der kan rumme det, mener Viktor Mayer-Schönberger.

“Vi skal først og fremmest forstå data som en informationsværdi og udvikle et mindset omkring det. Ellers får vi ikke samlet data og analyseret dem, og så er værdien tabt,” siger han. 

De tre V’er

Big data-revolutionen hænger sammen med tre teknologiske udviklingsspor, der på engelsk har affødt udtrykket “The Three V’s”:

  • Volume. Mængden af data vokser eksponentielt. 
  • Velocity.  Det samme gør den hastighed, hvormed data kan behandles. Ifølge den såkaldte Moores Lov fordobles computerkraften på 18 måneder. For 20 år siden krævede det eksempelvis en maskine på størrelse med et køleskab og en vægt på 250 kg at gemme en gigabyte data. I dag render vi hver især rundt med adskillige gigabytes i lommen på forskellige smartphones. 
  • Variety. Der opstår hele tiden et væld af nye datakilder, ofte ustrukturerede. Det kan være sensorer indbygget i produkter, diskussioner på de sociale medier eller lydklip, fotografier og videomateriale. 

Data på dagsordenen

Det enorme potentiale har i flere lande sat big data på dagsordenen på allerhøjeste politiske niveau.

For bare et par uger siden udsendte USA’s præsident, Barack Obama, en direkte ordre til sin administration om, at den amerikanske regeringsmaskine nu har pligt til at åbne for alle de data, der ligger i arkiverne – bl.a. i håbet om, at denne råvare kan få nyt liv i hænderne på fantasifulde iværksættere. Han henviste bl.a. til den industri og vækst, der i sin tid fulgte i kølvandet på daværende præsident Ronald Reagans åbning af adgangen til GPS-data.

I det hele taget har big data-revolutionen ramt Obama-administrationen. Obama har også iværksat et ambitiøst big data-projekt, der skal bane vej for en præcis kortlægning af den menneskelige hjerne. Obamas egen valgsejr i efteråret bliver i øvrigt også tilskrevet en knivskarp brug af dataanalyse til at ramme de rette vælgere.

I Storbritannien står regeringschefen ikke tilbage for sin amerikanske kollega. I august i fjor lagde premierminister David Cameron for første gang op til, at det skal være muligt for forskere at få adgang til anonyme data fra sundhedssystemet. 

“Det vil hjælpe til at gøre Storbritannien til det bedste sted i verden at udføre den førende forskning,” sagde han. 

I forvejen ligger Storbritannien ifølge en vurdering fra revisionshuset Deloitte helt i front med adgangen til offentlige data. Den britiske regering har bl.a. etableret Open Data Institute (ODI), der skal hjælpe iværksættervirksomheder med at få værdi ud af offentlige data, som led i den britiske regerings genopretningsplan efter den økonomiske krise. 

ODI vil modtage 10 millioner pund over de næste fem år, og private investorer inviteres også med. Således har stifteren af auktionssitet eBay, Pierre Omidyar, allerede postet 470.000 pund i projektet.

Brede anvendelsesmuligheder

Den store politiske bevågenhed skyldes ikke bare det kommercielle potentiale. Big data har anvendelsesmuligheder i en lang række samfundssektorer.

På sygehusene kan big data redde liv. På en række nordamerikanske hospitaler er det eksempelvis nu overladt til en computer at diagnosticere, om en for tidligt født baby skal i behandling for en infektion – vel at mærke 24 timer før infektionen indtræffer. Det er muligt på grund af adgang til omfattende historiske data om bl.a. hjerterytme, åndedræt og temperatur.

Uddannelsessektoren er et andet område, hvor big data spås kæmpe muligheder. I takt med at flere og flere studerende modtager it-understøttet undervisning, onlinekurser osv.,  bliver det muligt for underviserne i realtid at få hjælp til at forbedre kursustekster, fordi algoritmer hele tiden overvåger de store mængder af data om, hvordan de studerende tilegner sig teksterne. 

På den lidt længere bane kan big data i undervisningssektoren også skabe langt mere præcist differentieret undervisning, hvor algoritmerne selv tilpasser undervisningsniveauet til den enkelte på baggrund af store mængder data om, hvad der er mest effektfuldt for en person med bestemte læringskarakteristika. 

Big data kan også blive et potent beslutningsværktøj for politikere.

Et studie foretaget af Global Pulse, der bl.a. brugte sproganalyser, viste, at politiske beslutningstagere kunne bruge data fra sociale medier til at formulere politikker, der adresserede problemerne blandt arbejdsløse. Det skete bl.a. ved at scanne de sociale medier, hvor det var muligt at få et billede af, hvilke udfordringer de arbejdsløse oplevede. 

Et tredje eksempel er trafikplanlægning. I London-området var politikerne i mange år overbeviste om, at togpendlere typisk var de personer, der boede i stationsbyerne omkring London. Men med data fra selskabet Intrix, der akkumulerer data fra bilers GPS-anordninger, opdagede politikerne, at mange af togpendlerne faktisk kom fra oplandet omkring stationsbyerne. Det betød, at indsatsen for at forbedre infrastrukturen blev kanaliseret over på disse mindre veje. 

Talrige analyser viser, at der alene i den offentlige sektor ligger et kæmpe potentiale gemt i big data. Alene i effektivitetsforbedringer vil regeringer i udviklede vestlige lande ifølge McKinsey kunne spare mere end 250 milliarder euro årligt ved at anvende big data. 

I Storbritannien alene har den britiske tænketank Policy Exchange i forlængelse heraf fastslået, at brug af big data kan spare den offentlige sektor for mellem 16 og 33 milliarder pund om året. Det svarer til 250-500 pund pr. indbygger. 

Også i forhold til klimaudfordringerne vil big data have et stort potentiale. OECD fastslår i rapporten “Exploring Data-Driven Innovation as a New Source of Growth”, der udkom i midten af april, at brugen af big data i energisektoren i forbindelse med smartgrid vil kunne give en miljøgevinst på 2 milliarder ton sparet CO2 i 2020. 

Ifølge OECD er der en enorm potentiel miljøgevinst i mere intelligent afvikling af trafikken. Det arbejde er man i gang med i Stockholm. Her eksperimenterer forskere sammen med IBM lige nu med at bruge data fra GPS-modtagere i taxaer kombineret med data fra trafiksensorer, forureningsmålere og vejrmålere til at give et realtidsbillede af trafikflow, rejsetider og de bedste pendlermuligheder i den aktuelle situation. Ideen er, at en trafikant altid vil kunne få præsenteret den bedst mulige rute igennem byen på et givent tidspunkt. 

Systemet vil være en videreudbygning af det i forvejen avancerede it-system bag Stockholms betalingsring.

Data skaber ny værdi

For den private sektor er big data også en råvare med profitpotentiale. Big data vil øge produktiviteten, skabe nye job og være katalysator for ny vækst. 

Big data bliver helt uundgåelig at forholde sig til, vurderer professor ved MIT Sloan School of Management, Andrew McAfee, der sammen med sin kollega Eric Brynjolfsson har publiceret artiklen “Big Data: The Management Revolution” i Harvard Business Review.

“Big data bringer den videnskabelige metode til forretningsverdenen, hvor den i mange år har været fraværende. Derfor er det en revolution,” siger han.

Mange virksomhedsledere styrer i sidste ende pr. instinkt og mavefornemmelse. Men undersøgelser viser, at beslutninger baseret på big data altid overgår en ellers udmærket intuition, forklarer McAfee. Virksomheder, der baserer deres beslutninger på big data, klarer sig 5-6 pct. bedre målt på indtjeningen end konkurrenterne. 

[graph title="Sådan omsættes data til penge" class="crb-wpthumb attachment-915-0 crb-graph-large" alt="" />

Kilde: McKinsey Global Institute. 

I rapporten “Big data: The next frontier for innovation, competition, and productivity”, illustrerer konsulenthuset McKinsey bl.a., hvordan big data vil kunne skabe en væsentlig produktivitetsvækst, alene fordi det vil gøre virksomheder i stand til at optimere prissætning, forbedre produktudvikling og indhøste effektiviseringer. Se figur 2. 

Big data vil også have en betydning for hele it-branchen. De mange nye data skal opsamles, lagres og knuses. Ifølge analysehuset Gartner betyder det, at big data alene i 2015 vil skabe 4,4 millioner nye it-job globalt.

Dertil kommer, at der på basis af den nye dataråvare opstår nye vækstvirksomheder, der lever af at omsætte de mange nye data til økonomisk værdi.

Et eksempel er Parkopedia, der på data bygger en service om parkeringspladser i storbyer. Et andet eksempel er it-servicen Decide.com, der ved hjælp af smarte algoritmer forudsiger priserne på forbrugerprodukter i USA og bl.a., ud fra raffineret sandsynlighedsregning, adviserer forbrugerne, hvis prisen på en vare ser ud til at falde i nær fremtid. 

Også veletablerede virksomheder føder iværksættersucceser på ryggen af big data-bølgen. Pakkehåndteringsfirmaet UPS solgte i 2010 sin data-analyseenhed UPS Logistics Technologies til kapitalfonden Thomas Bravo. Den arbejder nu videre under konceptet Roadnet Technologies, der hjælper en række virksomheder med at optimere ruteplanlægningen. Værktøjet har sparet UPS mange penge og miljøet for tonsvis af CO2. 

Danmark mangler en strategi

Herhjemme er boligportalen Boliga et godt eksempel på, hvordan allerede eksisterende offentlige data om det danske boligmarked kan anvendes til nye forretningsmuligheder. Der er også store forhåbninger om, at der vil opstå nye virksomheder og løsninger baseret på danske grunddata, der tidligere kostede penge at få adgang til. I Danmark handler det foreløbig om adgang til landkortdata, selskabsdata, matrikelkort og Det Centrale Virksomhedsregister (CVR).

Big data baner vej for kunstig intelligens

Der er vægt bag ordene, når eksperterne siger, at datarevolutionen kun lige er begyndt. Blandt de mange, næsten ubegribelige perspektiver, der åbner sig, er muligheden for at skabe en kunstig og selvlærende intelligens i form af en algoritme, der selv tilegner sig ny viden på samme måde som den menneskelige hjerne. 

For et par år siden var det IBM’s supercomputer, Watson, der viste muskler i tv-programmet Jeopardy. Og for et år siden var det forskere hos Googles mystiske X Lab, der demonstrerede, at det var muligt at skabe et neuralt netværk bestående af 16.000 computerprocessorer og lade computerne bladre igennem YouTube for at lede efter katte.

Hjerne-simulatoren blev udsat for 10 millioner tilfældige YouTube-videoer i løbet af tre dage, og efter at være præsenteret for 20.000 forskellige ting, begyndte den at registrere katte ved at bruge en lærings-algoritme.

Men det mest bemærkelsesværdige var, at den aldrig fik at vide, hvad en kat var. Det lærte den sig selv ved at knuse og bearbejde de mange data. 

 

Initiativet viser, at Danmark er ved at få øjnene op for potentialet i big data. Men ifølge flere iagttagere mangler der en mere målrettet og strategisk tilgang. 

Bl.a. mangler der en debat om åbning af mere delikate data, påpeger Henrik Zangenberg fra konsulentvirksomheden Zangenberg og Co., der for to år siden udarbejde rapporten “Kvantificering af værdien af åbne offentlige data”, der detaljeret analyserede, hvordan offentlige data vil kunne gavne en række danske private sektorer.

“Foreløbig har man taget fat i data, der ikke er så kontroversielle, men der udestår en diskussion om at få adgang til en lang række andre steder i forskellige sektorer,” siger Henrik Zangenberg.  Han peger bl.a. på data om sundhed, indkomster og energi som eksempler på områder med stort potentiale.

I det hele taget mener flere aktører på datascenen, at der mangler en dansk debat om bl.a. copyright-reglerne. I Storbritannien har professor i digital økonomi ved Cardiff University i Wales, Ian Hargreaves, analyseret, hvordan de britiske copyright-regler begrænser mulighederne i en big data-æra, og er kommet med forslag til ændringer, som regeringen har taget til sig. 

Flere it-selskaber har opfordret den danske regering til at tage ved lære af de britiske erfaringer, så Danmark ikke sakker bagud i den internationale konkurrence.


Få Mandag Morgens overskrifter direkte i din mail.

Tilmeld dig nyhedsbrevet nu

Få Mandag Morgens overskrifter direkte i din mail.

Tilmeld dig nyhedsbrevet nu