1. Generelt om sesongjustering
5. Kvalitet på sesongjustering
8. Publikasjoner og andre lenker om sesongjustering
For måneds- og kvartalstall er det ofte betydelige sesongvariasjoner som vanskeliggjør en direkte tolkning av utviklingen fra periode til periode. For å lette tolkningen av slike tidsserier, sesongjusteres mange tallserier ved bruk av X-12-ARIMA eller andre sesongjusteringsverktøy.
For mer generell informasjon om sesongjustering og begrepene knyttet til det, se SSBs Metadata - Statistiske metoder - Sesongjustering
1.2 Hvorfor sesongjusteres sykefravær, egen- og legemeldt
Den kvartalsvise statistikken over både egen- og legemeldt sykefravær viser tydelig sesongvariasjon. Tapte dagsverk i kvartalet både grunnet egen- og legemeldt sykefravær er betydelig større i vinterhalvåret (1. og 4. kvartal) blant annet på grunn av luftveisinfeksjoner.
Avtalte dagsverk (feriekorrigert) i kvartalet er lavere sommerhalvåret, særlig i 3. kvartal. Både tapte og avtalte dagsverk er sterkt påvirket av antall arbeidsdager i kvartalet, som er antall ukedager i kvartalet fratrukket offentlige hellig- og høytidsdager.
1.3 Serier som sesongjusteres
Følgende kvartalsvise tidsserier sesongjusteres separat for menn og for kvinner:
- legemeldte tapte dagsverk
- egenmeldte tapte dagsverk
- avtalte dagsverk
Primært publiserer vi sesongjusterte tall for tapte dagsverk grunnet sykefravær sett i forhold til avtalte dagsverk, dvs. den egenmeldte, legemeldte eller total sykefraværsprosenten, enten fordelt på kjønn eller menn og kvinner samlet.
Prekorrigering er korrigering av rådata for kalendereffekter og ekstremverdier før det blir gjennomført en sesongjustering.
● Det gjennomføres en detaljert prekorrigering av rådata. Med detaljert prekorrigering menes bruk av spesialtilpassede modeller for å prekorrigere rådata, som ikke fins som standard opsjoner i sesongjusteringsverktøyet.
Kommentarfelt:
1. Tapte dagsverk i kvartalet grunnet sykefravær prekorigeres med én sesongrenset1 regresjonsvariabel for andelen av tapte legemeldte dagsverk med influensadiagnose i kvartalet, fordelt på kjønn. Variabelen isolerer estimert gjennomsnittseffekt av irregulært influensafravær, bl.a. svineifluensaen 3. og 4. kvartal 2009. Også egenmeldt sykefravær prekorrigeres med samme influensavariabel basert på andelen tapte legemeldte dagsverk, selv om det ikke er noe direkte sammenheng. Prekorrigeringsvariabelen har likevel svært signifikant effekt.
2. Avtalte dagsverk i kvartalet er feriekorrigert basert på feriefraværsandeler fra AKU, jamfør Om statistikken pkt. 4.1. Feriekorrigeringen introduserer sesongvariasjon, AKU-marspåskevariasjon, og trend i nevneren i rådataene vi skal sesongjustere, se evt. Statistikkbanktabell 04545 under AKU. Grunnet trenden i feriefraværsprosenten fra AKU, vil vi prekorrigere disse avtalte dagsverkene med kjønnsfordelte feriefraværsprosenter fra AKU, som er differensiert og sesongrenset.
● Det gjennomføres kalenderjustering på alle serier som viser signifikant og plausibel kalendereffekt innenfor en robust statistisk tilnærming, som regresjon eller RegARIMA-prosedyre. (en regresjonsmodell der støyleddet er modellert ved en ARIMA-modell). Kalenderregresjonsvariable er bearbeidet i samsvar med de norske høytids- og helligdagene.
Predefinerte valg:
● Det korrigeres ikke for virkedager.
Kommentarfelt:
Virkedagsvariable (basert på norske forhold) har ikke signifikant på disse kvartalsdataene2.
Predefinerte valg:
● Ingen korrigering
Kommentarfelt:
Tidsseriene prekorrigeres for antall arbeidsdager i kvartalet. Antall arbeidsdager i kvartalet er definert som antall ukedager (mandag – fredag) i kvartalet fratrukket norske offentlige hellig- og høytidsdager i kvartalet som faller på ukedager. Herunder kommer følgende bevegelige helligdager: skjærtorsdag, langfredag, 2. påskedag, Kristi himmelfartsdag og 2. pinsedag. Egen påskevariabel brukes ikke, fordi den har ikke signifikant effekt når dataene også prekorrigeres for antall arbeidsdager i kvartalet. Prekorrigering for påske i stedet for antall arbeidsdager i kvartalet gir langt dårligere resultat i følge våre AICC-tester.
Predefinerte valg:
● Avhengig av hva som passer best, benyttes enten en kalender basert på norske høytids- og helligdager eller en kalender basert på et gjennomsnitt av antall virkedager til de forskjellige landene innen EU/EU-området.
Kommentarfelt:
Tidsseriene prekorrigeres for antall arbeidsdager i kvartalet. Antall arbeidsdager i kvartalet er definert som antall ukedager i kvartalet fratrukket norske offentlige hellig- og høytidsdager i kvartalet som faller på ukedager. Herunder kommer følgende faste hellig- og høytidsdager dersom de havner på ukedager (mandag – fredag): 1. nyttårsdag 1. mai, 17. mai, 1. juledag og 2. juledag.
Predefinerte valg:
● Seriene kontrolleres for ekstreme verdier, og identifiserte ekstremer blir forklart/modellert med bruk av all tilgjengelig informasjon. Når det foreligger en klar tolkning av årsaken til de ekstreme verdiene (f.eks. streik eller konsekvenser forårsaket av endringer i politikken m.m.) blir de inkludert som regressorer i modellen.
Kommentarfelt:
Kjøre automatisk søk etter signifikante ekstremverdier (alle typer) ved årlige gjennomganger eller spesielle behov. Løpende gjøres ikke automatiske søk etter ekstremverdier (outlier{}-prosedyren ikke aktivert).
Så langt er kun to tilfeller forhåndsdefinert:
Ø Nivåskift i legemeldte tapte dagsverk mellom 2. og 3. kvartal 2004 (Sykmeldingsreformen)
Ø Ekstremverdi 3. kvartal 2009 for egenmeldte tapte dagsverk3 (starten av svineinfluensaen)
For å prekorrigere er det nødvendig å velge en ARIMA-modell, samt avgjøre om data bør log-transformeres eller ikke.
● Modell velges automatisk etter etablerte rutiner i sesongjusteringsverktøyet.
Kommentarfelt:
Automdl{}-prosedyren i versjon 0.3 av X-12-ARIMA anvendes med standardopsjoner4.
Dekomponeringsrutinen spesifiserer hvordan trend-, sesong og irregulær komponent blir dekomponert. De mest vanligste dekomponeringene er additiv, multiplikativ og log additiv
● Automatisk valg av dekomponeringsrutine.
Predefinerte valg:
● X12-ARIMA
I enkelte serier er det ønskelig at f.eks. sum (gjennomsnitt) kvartalsvise sesongjusterte tall for et år skal være identisk med sum (gjennomsnitt) kvartalsvise tall i den opprinnelige råserien.
● Ingen konsistensbetingelser pålegges.
I enkelte serier pålegges det konsistens mellom sesongjusterte totaler og underaggregater. I tillegg er det for enkelte tidsserier et forhold mellom de ulike seriene, for eksempel bruttoprodukt som er lik produksjon minus produktinnsats.
● Tvinger likhet mellom sesongjusterte under- og overaggregater.
Kommentarfelt:
Likheten framkommer gjennom indirekte metode, se pkt. 3.4.
En direkte metode er anvendt dersom tidsserier for en total og tilhørende underaggregater alle er sesongjustert hver for seg. En indirekte metode er anvendt for total dersom tidsserier for de tilhørende underaggregater er sesongjustert direkte og det deretter er foretatt en aggregering til totalnivå.
● Indirekte metode anvendes, der komponentene sesongjusteres direkte med samme tilnærming og programvare. Totalene blir beregnet ved å aggregere de sesongjusterte komponentene.
Kommentarfelt:
Følgende tidsserier sesongjusteres separat for menn og for kvinner:
- legemeldte tapte dagsverk
- egenmeldte tapte dagsverk
- avtalte dagsverk (i kvartalet)
Sesongjusterte tall for menn og kvinner samlet fremkommer ved summering av de sesongjusterte tall for menn og kvinner.
Når sesongjusteringen skal gjennomføres er det mulig å velge hvilken periode som skal brukes i estimeringen og beregningen av korrigeringsfaktorene. Med korrigeringsfaktorer menes faktorer for å prekorrigere og sesongjustere tidsserien.
● Hele tidsserien brukes for å beregne modell og korrigeringsfaktorer.
Sesongjusteringen kan bli endret ved at det kommer til nye observasjoner eller rådata endres. Dette kalles revisjon, og det finnes flere måter å håndtere revisjonen på i offentliggjøringen av statistikken.
● Sesongjusterte data revideres i overensstemmelse med veldefinerte og offentlig tilgjengelige revisjonsrutiner og frigivingskalender.
● Delvis løpende korrigering, der modellene inkludert evt. log-transformering, sesong- og trendfiltre, kalender-variable og ekstremverdier kun identifiseres årlig, mens respektive regresjonsparametere og faktorer reestimeres løpende hver gang nye eller reviderte rådata er tilgjengelige.
● Hele serien revideres når sesongfaktorene reestimeres.
● Det evalueres kontinuerlig/periodevis de forskjellige kvalitative indikatorer som sesongjusteringsverktøyet produserer.
● For å behandle de fleste serier brukes et begrenset utvalg av diagnostikk og grafiske muligheter som sesongjusteringsverktøyet produserer.
Tabellen nedenfor viser enkelte indikatorer på kvalitet på sesongjusterte tall:
http://www.ssb.no/a/kortnavn/sykefratot/kvalitetsindikatorer.xls
Forklaringen på indikatorene i tabellen kan finnes her:
SSBs Metadata - Statistiske metoder - Sesongjustering
● Alle seriene er lange nok for å gjennomføre sesongkorrigeringsrutiner på en optimal måte.
● Alle seriene som skaper problemer ved å bruke vanlige opsjoner i sesongjusteringsverktøyet behandles på en spesiell måte.
Kommentarfelt:
Sykefraværsdagsverk
Store influensairregulariteter er en spesiell utfordring for statistikken. Influensafraværet er normalt høyt i 1. kvartal, av og til høyt i 4. kvartal, og av og til lavt vinterhalvåret. Uten prekorrigering av sesongmessig unormal influensa blir usikkerheten større i beregning av kalendereffekten og sesongkomponenten. I tillegg vil den irregulære komponenten, som er en del av sesongjusterte tall, bli ekstra stor dersom en ikke lager sesong- og influensajusterte tall. Det er bakgrunnen for at sykefraværsdagsverkene prekorrigeres med én sesongrenset regresjonsvariabel for andelen av tapte legemeldte dagsverk med influensadiagnose i kvartalet (se kapittel 2.1).
Avtalte (feriekorrigerte) dagsverk i kvartalet
Feriekorrigeringen basert på AKU introduserer sesongvariasjon, AKU-marspåskevariasjon, trend og utvalgsusikkerhet i rådataene som skal sesongjusteres, se evt. Statistikkbanktabell 04545 under AKU. Grunnet trenden i feriefraværsprosenten fra AKU, prekorrigerer vi disse avtalte dagsverkene med kjønnsfordelte feriefraværsprosenter fra AKU, som er differensiert og sesongrenset. Differensieringen fjerner mye av trenden i prekorrigeringsvariabelen.
● Både rådata og sesongjusterte serier er tilgjengelige.
● Historiske data er tilgjengelige med hensyn til gjennomføring av revisjonsanalyse.
For egenmeldt sykefravær publiserer vi ikke absolutte, kun sykefraværsprosenter.
Se tidligere publisert for tabeller med historiske sesong- og influensajusterte data.
● Sesong-, kalender- og influensajusterte tall formidles i vedleggstabeller og i Statistikkbanken.
● Kun sesong- og kalenderjusterte tall formidles i Statistikkbanken, der beregnede effekter av sesongmessig unormal influensa blir lagt til igjen, slik at det synes i tallene.
● For hver serie formidles enkelte indikatorer som viser kvaliteten på sesongjusteringsrutiner.
Kommentarfelt:
Sesong-, kalender- og influensajusterte tall gir glattere serier, og er i fokus, fordi de er enklest å tolke. Kun sesong- og kalenderjusterte tall vil gi litt mer hakkede serier, fordi de også viser sesongmessig unormal influensa, som for eksempel svineinfluensaen 2. halvår 2009.
The Committee for Monetary, Financial and Balance of Payments statistics: ESS-Guidelines on seasonal adjustment
Dinh Quang Pham: Innføring i tidsserier - sesongjustering og X-12-ARIMA, Notater 2001/2, Statistisk sentralbyrå
US Census Bureau: X-12-ARIMA Reference manual Version 0.3
ONS Methodology and Statistical Development: Guide to seasonal adjustment with X-12-ARIMA
Jon Petter Nossen (2011): Sesongjustering av sykefravær - Forslag til metode. Arbeid og velferd nr. 4-2011. NAV (tidlig metodeforslag, og diskusjon av bl.a. influensajustering og brudd knyttet til legemeldingsreformen)
1 Sesongrenset vi si at kvartalsgjennomsnittet er trukket fra.
2 Vi vil revurdere virkedagsvariable dersom vi skal sesongjustere aldersfordelte tall. Yngre arbeidstakere har i gjennomsnitt kortere varighet på sykefraværene, og da er det større sjanse for at evt. effekter av virkedagsvariable blir mer signifikante.
3 Egenmeldt sykefravær prekorrigeres også med en influensavariabel basert på andelen tapte legemeldte dagsverk, selv om det ikke er noe direkte sammenheng mellom variablene. Prekorrigsvariabelen forklarer effekten av influensa irregularitetene godt bortsett fra i starten av svineinfluensaen 3. kvartal 2009, da ekstremverdien er predefinert.
4 Den gamle Pickmdl{}-prosedyren i X-12-ARIMA klarer ikke å velge en tilfredsstillende ARIMA-modell for enkelte serier for egenmeldte tapte dagsverk, og gir advarsel om sesong-overdifferensiering og at modellen bør velges manuelt.