Å forstå statistikk i krisetider
Publisert:
Koronakrisen har medført et stort behov for hyppig oppdatert statistikk. Tall er harde fakta og gir oss presis informasjon. Likevel kan tolkninger av tall noen ganger misforstås og bli feil.
I en situasjon hvor vi alle må forholde oss til mange og nye tall hele tiden, er det viktig å både kunne forstå tallene riktig, og formidle dem på en relevant måte. En av Statistisk sentralbyrås viktige samfunnsoppgaver er å bidra til god og riktig bruk av både egne og andres statistikker. Derfor forsøker vi i denne artikkelen å peke på noen typiske utfordringer knyttet til utarbeiding, presentasjon og tolkning av statistikk.
Det aller viktigste er nok forståelsen av at statistikk ofte vil være usikker. Statistikk er en sammenfatning av mange tall. Usikkerhet kan for eksempel skyldes at statistikken er basert på få observasjoner eller data som gjelder korte tidsperioder.
Dermed må statistikken tolkes med forsiktighet. Det gjelder spesielt i situasjoner slik som den vi står i nå, hvor det publiseres tall som både er foreløpige, og som publiseres med høyere hyppighet og mindre kvalitetssikring enn normalt. Dette gjøres fordi behovet og etterspørselen etter nye og raske tall er større enn vanlig.
Under har vi trukket frem noen eksempler på vanlige feil som i enkelte tilfeller har blitt gjort i formidlingen av tall relatert til den pågående pandemien.
Antall smittede er ukjent
I starten av pandemien var det mye oppmerksomhet rettet mot tall for registrerte smittede. Det må ikke forveksles med det totale antall smittede – en ukjent størrelse som må estimeres på bakgrunn av ulike data og modeller. Antall registrerte smittede avhenger av testregimet: hvor mange som testes, og hvem som testes.
Testregimet varierer mye mellom land, i både omfang og innretning. Med begrensede testressurser er det i startfasen av en pandemi naturlig å konsentrere testingen om grupper og områder hvor det er viktigst for å kunne bekjempe pandemien. Men registrerte smittede gir da ikke et representativt bilde av smittede i befolkningen.
Tallene for registrerte smittede bør derfor ikke brukes til å sammenligne utbredelsen av epidemien mellom områder eller land. Registrerte smittede gir heller ikke et øyeblikksbilde av hvor mange som er registrert smittet akkurat nå. Tallet vil vokse med tiden, og tar ikke hensyn til hvor mange av de smittede som er blitt friske.
Det er mindre fokus på registrerte smittede nå enn det var i starten av pandemien. Flere har tatt til orde for å teste et representativt utvalg som kan gi grunnlag for å vite hvor mange som er smittet eller som har hatt smitten. En slik undersøkelse kan gi viktig informasjon i ettertid.
Utfordringer med registrering av døde
Tall om døde, innlagte på sykehus og på intensivavdelinger gir bedre indikasjoner på pandemiens alvorlighet enn registrerte antall smittede, men også disse tallene er beheftet med usikkerheter. Det er særlig knyttet til hvordan de enkelte indikatorene defineres og registreres. Mange som dør har andre sykdommer i tillegg, og det kan være vanskelig å avgjøre hva som er en utløsende dødsårsak. Hvordan man undersøker og registrerer dødsårsaker kan i praksis variere mellom land og også innen land mellom for eksempel kommuner og sykehus.
Det kan også være etterslep i registreringene av døde. Dette påvirker ikke det totale tallet på døde, men tallene fra dag til dag blir vanskelige å sammenligne og tidsseriene krevende å tolke.
Viktigheten av bruk av rater
Bruk av absolutte tall ved sammenligninger er en kilde til feil bruk av statistikk, ofte også når statistikken framstilles på kart. Når tall på antall innlagte eller dødstall fra store land som USA sammenlignes med små land som Norge må det brukes rater. Innlagte eller døde per innbygger er det som gjelder ved sammenligning mellom land og områder. Men sammenligning mellom land er ofte heller ikke så relevant når det er store variasjoner innen de enkelte landene. Større byer som New York og London har klart høyere dødsrater enn spredtbygde områder i de aktuelle landene. Dette bør det tas hensyn til ved valg av områder som sammenlignes.
Sett tallene i sammenheng
Statistiske resultater bør generelt settes i sammenheng med annen statistikk og ses i perspektiv. Det kan være relevant å sammenligne korona-dødsfall med dødsfall av andre sykdommer som «vanlig» influensa selv om sykdommene er ulike med hensyn til smitte og dødelighet på individnivå. Et dødsfall er like alvorlig uansett årsak, men kan ha ulike konsekvenser for samfunnet. Et stort antall dødsfall på kort tid og på et lite område vil selvsagt være mer belastende for helsevesenet enn om dødsfallene er mer spredt eller viser en jevnere utvikling.
Små tall og tilfeldigheter
Ved sammenligning mellom små geografiske områder eller korte tidsperioder vil det alltid kunne observeres variasjon som skyldes rene tilfeldigheter, og de aktuelle tallene må derfor tolkes med stor forsiktighet. Mange små norske kommuner har ingen påviste smittede eller døde, noen har forholdsvis mange – sånn vil det alltid være hvis sannsynligheten for å bli rammet er liten.
Forklaringsfaktorer
Det er også kjente faktorer som kan ha påvirkning på tallene, for eksempel på dødeligheten eller smitteraten. Relevante faktorer i dette tilfellet er befolkningens aldersstruktur, botetthet, helsetilstanden generelt og forskjeller i helsesystemene. Dette forklares nærmere her.
Når man etter hvert vil rette oppmerksomheten og debatten mot virkningen av ulike tiltak er det også viktig å kontrollere for relevante bakgrunnsvariabler (som rammede personers alder) og ikke forveksle sammenfall (korrelasjon) med årsak/virkning (kausalitet). I formidlingen av informasjon om tiltak er behandlingen av usikkerhet også viktig.
Statistisk sentralbyrå vil bidra
De fleste er flinke til å bruke og tolke statistikken riktig. Noen ganger ser vi imidlertid eksempler på feil eller misvisende bruk av tall i debatten rundt den pågående pandemien. Av og til kan mangelen på relevant statistikk spille en rolle. Dette gjelder både statistikk som belyser selve pandemien og virkningene av den på samfunnet. Statistisk sentralbyrå vil gjerne bidra her, både med mer relevant statistikk og bedre tolkning av denne.
Vi har laget en samleside hvor du finner relevant statistikk knyttet til virkningene av pandemien. I tillegg tar vi gjerne i mot innspill og spørsmål knyttet til ny statistikk og tolkninger av tall ellers.
Faktaside
Kontakt
-
Xeni Kristine Dimakos
-
SSBs informasjonstjeneste