Ved formidling af forskning skal vi lære at kende forskel på sammenhænge

BLOG: Formidlingen af ny forskning bliver alt for ofte misforstået og ender med at blive misvisende - og i værste fald bevidst fordrejet. Ikke mindst medier bør få styr på, hvordan forskningsdata skal udlægges, mener forsker i dette blogindlæg.

Om Johannes Lørup Buch

Af Johannes Lørup Buch, biolog og forsker, Syddansk Universitet

Der findes løgne. Der findes forbandede løgne. Og så findes der statistik.

Citatets oprindelse er ukendt, men varianter af det har eksisteret i mere end hundrede år. Og måske med god grund. Som total lægmand er statistik et overbevisende argument, som er svært at afvise. Det kunne for eksempel være en udtalelse som “Undersøgelser viser, at solcreme faktisk giver hudkræft!”. Hvis man ikke har adgang til den videnskabelige artikel, udsagnet baseres på, eller ikke er i stand til at læse den, så er modargumentation en tung omgang.

Hvis undersøgelser viser det, så må det jo være rigtigt. Men hvad viser undersøgelserne rent faktisk?

En ekspert i statistik vil let kunne gennemskue, hvor filmen knækker, og at der ikke er en årsagsammenhæng mellem brugen af solcreme og udvikling af hudkræft. Dette eksempel stammer fra et opslag på Facebook, som senere blev omtalt af TjekDet.dk

Men hvor kommer sådan misinformation fra? Ophavsmanden til de opsigtsvækkende postulater er tilsyneladende ikke totalt lægmand i statistik, men ved nok om disciplinen til at kunne dreje konklusioner fra forskning, så de passer til egen agenda.

Det er ren utopi at forestille sig et samfund, hvor alle har tid og lyst til at gå samtlige Facebookopslag med “alternativ fakta” igennem med lys og lygte, men jeg vil gerne slå et slag for, at vi i det mindste uddanner os på ét punkt. Nemlig når der ved formidlingen af forskningsresultater skelnes mellem årsagssammenhæng, sammenhæng og sammenfald/sammentræf. For jeg tror nemlig, vi ville nå rigtig langt ved blot at skelne mellem disse begreber.

Meget vildledning starter nemlig meget uskyldigt med en forsker, som udtaler sig om et nyt og spændende projekt vedkommende har afsluttet, og konklusionen af studiet bliver så samlet op af medierne.

For nyligt skete dette med glutenholdige fødevarer og gravide.

Politiken havde glemt at spise brød til, og avisen skar derfor konklusionen fra studiet lige hårdt nok. Det resulterede i en opfordring til gravide om at undgå gluten. Vel at mærke med reference til en forsker, hvilket gør udsagnet svært at betvivle.

Den vakse læser husker måske historien, og der var såmænd ingen årsagssammenhæng mellem gluten og udvikling af type 1 diabetes. Der var blot en sammenhæng.

Når fagfolk bruger disse udtryk om forskningsresultater, så er de ikke synonymer. De er tekniske begreber, som har helt klare definitioner. Og jeg mener, at det er en nuancering af sproget, som vi alle bør blive bedre til at benytte os af.

Hvis vi husker blot få år tilbage, så skelnede man for eksempel sjældent mellem procent og procentpoint, hvilket er en sondring som er helt fundamental i formidling af data i dag. Det er bare et eksempel, og jeg håber at det næste kan blive forskellen på sammenhængen.

Men hvad pokker er forskellen så?

Jeg vil dele svaret op i tre grader af forklaringskraft. Og mit eksempel vil være et automatisk belysning- og vandingssystem, som er styret af en timer. Og vi starter i midten af forklaringspyramiden med begrebet “sammenhæng”.

Timeren i det tænkte eksempel tænder for en udendørslampe under carporten klokken 6:45, for det er cirka på det tidspunkt, familien skal afsted om morgenen. Samtidig får udestuen lige en omgang støvregn af vandingssystemet, for på dette tidspunkt er der ingen mennesker, der risikerer at få vand i håret.

Her ser vi, at der er en helt klar sammenhæng mellem, hvornår lyset tændes, og hvornår sprinkleren starter. Men betyder det også at lyset tænder, hvis jeg tager forstøveren ned i udestuen og giver planterne en gang regn på et vilkårligt tidspunkt? Et eksperiment ville vise, at selv det mest ihærdige forsøg med vandflasken ikke ville tænde for lampen i carporten.

Omvendt ville hverken stearinlys eller pandelampe i carporten føre til regnvejr i udestuen. Vi kan altså konstatere at, der er en klar sammenhæng mellem, hvornår de to begivenheder finder sted, men at den ene ikke er årsag til den anden - og omvendt.

Hvis man til gengæld kiggede på, hvornår timeren var sat til at aktivere de to systemer, så ville man igen se en sammenhæng. Klokken 6:45 hver morgen slår timeren til, og det gør de to systemer interessant nok også. Igen vil hverken vand i håret eller lampe i panden have nogen indvirkning på den sidst ankomne i denne treenighed af sammenhængende begivenheder. Men selv små justeringer af timerens indstillinger resulterer i ændrede udfald for både lys og sprinkler.

Og ikke nok med det, de tre begivenheder følger stadig hinanden. Det vil altså sige, at vi kan forklare ændringer i for eksempel lysets tændetidspunkt ved at kigge på timerens indstilling. Her er der altså tale om en klar årsagsammenhæng, både fordi vi kan forklare ændringerne og fordi det er reproducerbart. Vi kan blive ved med at justere timeren, de to andre systemer vil altid følge med.

På sin vis er dette et meget illustrativt eksempel, men det er også fjollet, for i historien er det jo os selv der har sat timeren og de to anlæg op. Så selvfølgelig forstår vi sammenhængen.

Det er straks mere realistisk, hvis man indtager et andet perspektiv, nemlig naboen, der ikke har indsigt i systemet. Naboen har lagt mærke til at lyset tænder, men har måske ikke en umiddelbar forklaring på hvorfor. Så naboen kan stille en række hypoteser op, som ville være værd at kigge nærmere på:

● Lyset tænder, når hoveddøren åbnes

● Lyset tænder, når solen står op

● Lyset er tidsindstillet

● Avisbuddet på cyklen aktiverer lyset

I bedste stalker-stil noterer han de forskellige tidspunkter ned i ti dage, og resultatet ses på figuren herunder.

 

Det står klart, at lyset tændes på samme tid hver dag, nemlig 6:45. Sammenholdt med de andre datapunkter, er der ingen begivenheder som fuldt ud forklarer dette tidspunkt. To gange om året passer 6:45 godt med solopgangen, og et par dage om ugen åbner familien hoveddøren lige omkring 6:45. Avisbuddets cykelrute ser også ud til at passe godt med lyset i carporten, men selv i weekenden tændes lyset på samme tidspunkt. Tilsyneladende er der altså tale om sammenfald hele vejen rundt.

Føler vi os klogere?

Ud fra disse observationer kan det ikke lade sig gøre at fastslå en årsagssammenhæng for tænding af lyset i carporten. Det betyder ikke, at den ikke findes (det ved vi jo, den gør), men på baggrund af dette observationsstudie, er vi ikke i stand til at fastslå den.

Til gengæld kan vi se, at der er en mulig sammenhæng mellem avisbuddets cykeltur og solopgangen. Det kan blot være et sammentræf, men en svag tendens viser sig.

Noget andet som også er vigtigt at have med er, at hvis man udvalgte mindre dele af datasættet, så ville både solopgang (dag 3-5), avisbud (dag 6-7) og døråbning (dag 6-8) vise en mulig sammenhæng med tænding af lyset.

Hvis den observerende nabo var af den forudindtagede overbevisning at lyset tændes med en bevægelsessensor, så kunne han blot vise det sammenfaldende data på de dage, hvor det passer, og på den måde få bekræftet sin tro.

Og nu er vi ved at nærme os sagens kerne. For skulle man diskutere med naboen om årsagen til lysets tænden, så ville han have et stærkt argument i form af observationer, der bekræfter hans idé. Også selvom han måske har smidt over halvdelen af datasættet ud, for at få observationer og konklusion til at stemme overens. Pludselig er bevisbyrden hos personen, der betvivler naboens data, og man får måske tilmed skudt i skoene, at man er uvidenskabelig, fordi man betvivler naboens konklusion på baggrund af data.

Denne situation fremstår selvfølgelig mere og mere tænkt, da det jo drejer sig om et lys under en carport. Men i den virkelige verden bliver denne type vildledende argumenter og retoriske tricks brugt i diskussioner om for eksempel klimaforandringer, vacciner, GMO fødevarer, solcreme, gluten, fracking, krystalhealing osv.

Man har altid skulle være på dupperne, når man gik udenfor en dør, men i dag er det nærmest lige så vigtigt at holde sig skarp, når man scroller ned gennem sin timeline. Information spredes utroligt hurtigt i dag, og bitte små misforståelser kan på ingen tid udvikle sig til en folkebevægelse.

Vi kommer nok aldrig misinformationskampagner til livs, men hvis flere kunne blive skarpe på forskellene mellem årsagssammenhæng, sammenhæng og sammenfald, så er vi altså nået langt.

Fakta om begreberne

Årsagssammenhæng: I fagsprog kaldet kausalitet. Begrebet dækker over en sammenhæng med et forklarende element indbygget. Ændringer i det ene parameter medfører ændringer i det andet, og det er reproducerbart. I forhold til eksemplet i artiklen kan det bruges til at konstatere, at timeren er årsag til at lyset og sprinkleren tændes.

Sammenhæng: I fagsprog kaldet korrelation. Begrebet dækker over begivenheder som finder sted samtidig, men ikke nødvendigvis påvirker hinanden. I forhold til eksemplet i artiklen kan det bruge til at konstatere, at lyset og sprinkleren tændes samtidig.

Sammenfald/sammentræf: I fagsprog kaldet koincidens. Dækker over begivenheder, som tilfældigvis finder sted samtidig. Den mulige sammenhæng forsvinder i et større datasæt. I forhold til eksemplet i artiklen bruges det til at konstatere, at lyset tændes og døren åbnes samtidig på dag 6-8 ved et tilfælde.

Kilde: Johannes Lørup.

LÆS OGSÅ: Tal og statistik er hverken ufejlbarlige eller forbandede løgne

LÆS OGSÅ: Forskerne har (heller) ikke patent på den absolutte sandhed

LÆS OGSÅ: Smitsomme sygdomme i sundhedsdækningen

LÆS OGSÅ: Forskerne har (heller) ikke patent på den absolutte sandhed

Forrige artikel Derfor indgår TjekDet samarbejde med Facebook Derfor indgår TjekDet samarbejde med Facebook