Innhald
Om sesongjustering
Generelt om sesongjustering
For måneds- og kvartalstall er det ofte betydelige sesongvariasjoner som vanskeliggjør en direkte tolkning av utviklingen fra periode til periode. For å lette tolkningen av slike tidsserier, sesongjusteres mange tallserier ved bruk av X-13-ARIMA-SEATS.
For mer generell informasjon om sesongjustering og begrepene knyttet til det, se Generelt om sesongjustering (pdf).
Merk spesielt at i forbindelse med koronautbruddet (mars 2020) er det gjort noen endringer i sesongjusteringen:
- additive utliggere (AO) og nivåskift (LS) er innarbeidet i prekorrigeringen.
- det månedlige trendtallet for siste observasjon erstattes med det sesongjusterte tallet, siden vi ikke kan spesifisere nivåskift i siste observasjon og punktekstremverdi (AO)
- Nav-tallene prekorrigeres for gradvis brudd knyttet til endret saksbehandlingssysstem, spesifisert som kvadratisk avtagende gradvis brudd (QD2018.10-2019.1)
Kvifor blir denne statistikken sesongjustert?
På grunn av bevegelige helligdager og ferieavvikling i juli og desember varierer utførte ukeverk gjennom året. Også antall sysselsatte og arbeidsledige, særlig for unge, viser noe variasjon gjennom året, bl.a. på grunn av ferievikarer og sommerjobbing av elever og studenter eller forsøk på å skaffe seg sommerjobb. Dette vanskeliggjør en direkte sammenligning fra en måned til den neste. For å justere for disse forhold sesongjusteres AKU, slik at man kan analysere den underliggende aktivitetsutviklingen som sier noe om konjunkturforløpet fra måned til måned.
Serier som sesongjusteres
Sysselsatte personer og arbeidsledige sesongjusteres fordelt på alder over/under 24 år.
For utførte ukeverk sesongjusterer vi følgende 3 serier for hver for seg, og summerer deretter for å få totalen:
- Personer 24 år og under
- Menn over 24 år
- Kvinner over 24 år
I tillegg til AKU, sesongjusterer vi tall for registrerte helt ledige hos NAV og registrerte helt ledige hos NAV + personer på ordinære arbeidsmarkedstiltak som et supplement, i og med at disse tallene ikke er heftet med utvalgsusikkerhet. For disse NAV-seriene sesongjusterer vi 4 serier fordelt på kjønn kryssklassifisert med alder over/under 24 år hver for seg.
Prekorrigering
Prekorrigeringsrutiner i bruk
Prekorrigering er korrigering av rådata for kalendereffekter og ekstremverdier før det blir gjennomført en sesongjustering.
Det gjennomføres en detaljert prekorrigering av rådata. Med detaljert prekorrigering menes bruk av spesialtilpassede modeller for å prekorrigere rådata, som ikke finnes som standardopsjoner i sesongjusteringsverktøyet.
Kalenderjustering
Kalenderjusteringer innebærer både å justere for virkedager og for bevegelige helligdager. Virkedagskorrigering betyr at vi justerer rådata for at både antall arbeidsdager og sammensetningen av dem kan variere fra periode til periode.
Det gjennomføres kalenderjustering på alle serier som viser signifikant og plausibel kalendereffekt innenfor en robust statistisk tilnærming, som regresjon eller RegARIMA-prosedyre. (en regresjonsmodell der restleddet er modellert ved en ARIMA-modell).
Metode for justering for virkedager
Det korrigeres ikke for virkedager.
Kommentar : AKU kartlegger befolkningens tilknytning til arbeidsmarkedet i hele referanseuker. Referanseukene deles ikke for å følge klanderens inndeling av måneder. Dermed inneholder alle månedene like mange mandager som tirsdager, onsdager, torsdager osv. Månedsfilene inneholder enten 4 eller 5 uker, og oppblåsningsfaktorene justerer for dette. Derfor påvirkes virkedagene kun av faste- og bevegelige høytids- og helligdager.
Justering for bevegelige helligdager
Det justeres ved hjelp av estimering av varigheten for effekten av de bevegelige helligdagene, spesielt tilpasset norske forhold.
Kommentar :
De sesongjusterte seriene for utførte ukeverk prekorrigeres dersom påskeuka havner i mars.
Utførte ukeverk er også sensitive for enkeltstående fridager, og prekorrigeres derfor også for: 1. mai og 17. mai på ukedager, 2. påskedag, 2. pinsedag og Kristi Himmelfartsdag. Vi tar også høyde for at Kristi Himmelfartsdag kan havne på en og samme dato som faste fridager (f. eks. Kristi Himmelfartsdag på 17. mai i 2007 og 2012 og på 1. mai i 2008). I tillegg korrigerer vi for antall offentlige fridager på ukedager i desember og antall normalarbeidsdager i romjula i desember/januar i AKU, fordi vi i AKU aldri deler referanseuker (mandag-søndag) mellom måneder, slik kalenderen gjør.
Alle prekorrigeringsviablene er regnet som avvik fra respektive månedsgjennomsnitt.
I tillegg er variablene justert med en ukemultiplikator1 for å bedre justere for at noen måneder i AKU har 5 referanseuker mens andre har 4 referanseuker. Årsaken er at kalendereffektene blir litt ”utvannet” når vektene på månedsfilen er tilpasset 5 ukesutvalg, i og med at det da er kun er rundt en 1/5 som er intervjuet om en referanseuke med en spesiell hendelse, for eksempel påskeuka. Tilsvarende blir kalendereffektene litt kraftigere enn gjennomsnittet når vektene på månedsfilen er tilpasset 4 ukesutvalg. (Gjennomsnittlig antall uker pr. måned er på lang sikt ca. 4,348. Ukemultiplikatoren for 4 ukersmåneder er da 4,348/4=1,087, og for 5 ukersmåneder 4,348/5=0,870.)
Nasjonal og EU/euroområde-kalender
En kalender basert på norske høytids- og helligdager benyttes.
Kommentar : Kalender basert på norske høytids- og helligdager benyttes. Vi tar også høyde for månedsinndelingen i AKU, hvor referanseukene (mandag – sønddag) ikke deles.
Behandling av ekstreme verdier
Ekstreme verdier, også kalt utliggere, er unormale verdier i serien.
Seriene kontrolleres for ekstreme verdier, og identifiserte ekstremer blir forklart/modellert med bruk av all tilgjengelig informasjon. Når det foreligger en klar tolkning av årsaken til de ekstreme verdiene (f.eks. streik eller konsekvenser forårsaket av endringer i politikken m.m.) blir de inkludert som regressorer i modellen.
Ekstreme verdier identifiseres automatisk i sesongjusteringsverktøyet, og blir fjernet før sesongjustering gjennomføres. De ekstreme verdiene inkluderes i etterkant i de sesongjusterte tall.
Kommentar : Kun additive (punkt) utliggere identifiseres og fjernes automatisk.
Håndtering av koronakrisen (mars 2020):
Koronakrisen modelleres konsekvent for alle tidsserier med spesifisering av punktekstremverdi for siste observasjon (etter mars 2020), og framover med nivåskift (LS) for hver måned fra og med mars 2020 bortsett fra siste observasjon. Eksempelvis innebærer det med tall tom. mars, prekorrigeres med spesifikasjonen AO2020.3. Senere med tal tom. mai vil bli prekorrigert med spesifikasjonen: LS2020.3 LS2020.4 og AO2020.5. Prekorrigerte effekter legges tilbake i de sesongjusterte tallene etter at sesongkomponent er beregnet. Vanlige trendtall for siste observasjon blir misvisende siden den ikke påvirkes av siste punktekstremverdi, kun av nivåskift. Vi erstatter nå derfor trendtallet for siste måned med sesongjustert tall for siste måned. Det er vårt beste anslag for siste observasjon. I statistikkbanken presenteres tidsserier som er glattet med 3 måneders glidende gjennomsnitt i etterkant, både for sesongjusterte tall og trend.
Modellering av brudd i tidsseriene fra NAV
Tidsserier for registrerte ledige hos NAV og registrerte ledige + ordinære tiltaksdeltakere hos NAV prekorrigeres for Koronakrisen (se avsnitt over) og i tillegg to ulike brudd omtalt på www.nav.no. Det
Tidsseriene fra NAV er konsekvent prekorrigert for gradvis brudd knyttet til endret saksbehandlingssystem i november 2018. Det er spesifisert som kvadratisk avtagende gradvis brudd (QD2018.10-2019.1) i tråd med informasjon på fra NAV. I tillegg er tidsseriene fra NAV konsekvent prekorrigert med ett nivåskift (LS2018.7), siden NAV startet med påminnelse på SMS fra juli 2018 til registrerte ledige om å sende meldekort om de fortsatt ønsket å være registrert som arbeidssøkere.
Valg av modell
For å prekorrigere er det nødvendig å velge en ARIMA-modell, samt avgjøre om data bør log-transformeres eller ikke
Modell velges automatisk etter etablerte rutiner i sesongjusteringsverktøyet.
Kommentar : Prosedyren pickmdl i Versjon 0.3 av X-12-ARIMA benyttes, med standard metode (=first) i den årlige identifiseringen av ARIMA-modellene, før de automatisk valgte ARIMA-modellene hardkodes i egen prosedyre. I listen over ARIMA-modeller som evt. sjekkes i pickmdl prosedyren, har vi for AKU-seriene lagt til 3 ekstra modeller mot slutten, som skulle være spesielt egnet til å modellere tidsserier med en datafangst der personene intervjues hver 3. måned (over 2 år). De ekstra ARIMA-modellene er:
(0,1,[1,3])(0,1,1)12
(0,1,3)(0,1,1) 12
(0,1,1)1(0,0,1)3(0,1,1)12
Dekomponeringsrutiner
Dekomponeringsrutinen spesifiserer hvordan trend-, sesong og irregulær komponent blir dekomponert. De mest vanligste dekomponeringene er additiv, multiplikativ og log additiv
Automatisk valg av dekomponeringsrutine.
Kommentar : Automatiske valg foretas ved årlig gjennomgang. Valgte dekomponeringmetoder hardkodes.
Sesongjustering
Valg av sesongjusteringsmetode
X13-ARIMA-SEATS
Konsistens mellom rådata og sesongjusterte tall
I enkelte serier er det ønskelig at f.eks. sum (gjennomsnitt) av sesongjusterte tall for et år skal være identisk med sum (gjennomsnitt) i den opprinnelige råserien.
Tvinger likhet over året mellom sesongjusterte data og rådata (gjennomsnitt).
Kommentar : Siden årsgjennomsnittene først er klare ved publiseringen av 4. kvartal, benyttes foreløpige justeringsfaktorer fra året før inntil de nye er klare. Hele året blir derfor nivåjustert ved publiseringen av 4. kvartal.
Konsistens mellom aggregat/definisjoner for sesongjusterte tall
I enkelte serier pålegges det konsistens mellom sesongjusterte totaler og underaggregater. I tillegg er det for enkelte tidsserier et forhold mellom de ulike seriene, for eksempel bruttoprodukt som er lik produksjon minus produktinnsats.
Tvinger likhet mellom sesongjusterte under- og overaggregater.
Kommentar : Likheten framkommer gjennom indirekte metode, se under. Arbeidsstyrken sesongjusteres ikke. Arbeidsstyrken, sesongjustert, er definert lik summen av sysselsatte, sesongjustert, og arbeidsledige, sesongjustert.
Direkte eller indirekte metode
En direkte metode er anvendt dersom tidsserier for en total og tilhørende underaggregater alle er sesongjustert hver for seg. En indirekte metode er anvendt for total dersom tidsserier for de tilhørende underaggregater er sesongjustert direkte og det deretter er foretatt en aggregering til totalnivå.
Indirekte metode anvendes, der komponentene sesongjusteres direkte med samme tilnærming og programvare. Totalene blir beregnet ved å aggregere de sesongjusterte komponentene.
Tidshorisont for estimering av modell og beregning av korrigeringsfaktorer
Når sesongjusteringen skal gjennomføres er det mulig å velge hvilken periode som skal brukes i estimeringen og beregningen av korrigeringsfaktorene. Med korrigeringsfaktorer menes faktorer for å prekorrigere og sesongjustere tidsserien.
Hele tidsserien brukes for å beregne modell og korrigeringsfaktorer.
Revisjonsrutiner
Revisjonsrutiner i bruk
Sesongjusteringen kan bli endret ved at det kommer til nye observasjoner eller rådata endres. Dette kalles revisjon, og det finnes flere måter å håndtere revisjonen på i offentliggjøringen av statistikken.
Sesongjusterte data revideres i overensstemmelse med veldefinerte og offentlig tilgjengelige revisjonsrutiner og frigivingskalender.
Kommentar :
Revisjon ved kvartalets andre måned; den første månedsfilen i kvartalet er foreløpig, og blir supplert med intervjuer som SSB ikke rakk å få med innen den foreløpig
tidsfristen. Datamaterialet blir reestimert samtidig med estimeringen av tall for kvartalets andre måned. Til reesetimeringen
benyttes også mer oppdatert hjelpeinformasjon om hele populasjonen fra Arbeidstakerregisteret og Folkeregisteret.
Kvartalsvis revisjon; de 2 første månedsfilene i kvartalet er foreløpige, og blir supplert med intervjuer ved kvartalsslutt, som SSB ikke rakk å få med innen de foreløpige tidsfristene. Til reesetimeringen benyttes også mer oppdatert hjelpeinformasjon om hele populasjonen fra Arbeidstakerregisteret Til estimeringen for 4. kvartal benyttes også mer oppdatert hjelpeinformasjon om hele populasjonen fra det årlige Ligningsregisteret.
Årlig revisjon ; Etter sesongkorrigering blir nivået på seriene justert slik at årsgjennomsnittene av de sesongkorrigerte tallene er lik tilsvarende ukorrigerte tall fra AKU. Siden årsgjennomsnittene først er klare ved publiseringen av 4. kvartal, benyttes foreløpige justeringsfaktorer fra året før inntil de nye er klare. Hele året blir derfor nivåjustert ved publiseringen av 4. kvartal.
Løpende eller faste valg i sesongjusteringen
Delvis løpende korrigering, der modellene, inkl. evt. log-transformering, sesong- og trendfiltre og kalender-regressorene kun identifiseres årlig, mens respektive regresjonsparametere og faktorer reestimeres løpende hver gang nye eller reviderte rådata er tilgjengelige. Punkt-ekstremverdier reidentifiseres og estimeres imidlertid løpende hver gang nye rådata er tilgjengelige.
Tidshorisont for publisering av reviderte tall
Hele serien revideres når sesongfaktorene reestimeres.
Kvalitet på sesongjustering
Evaluering av sesongjusterte tall
Det evalueres kontinuerlig/periodevis de forskjellige kvalitative indikatorer som sesongjusteringsverktøyet produserer.
Kvalitetsindikatorer
For å behandle de fleste serier brukes et begrenset utvalg av diagnostikk og grafiske muligheter som sesongjusteringsverktøyet produserer.
Tabellen nedenfor viser enkelte indikatorer på kvalitet på sesongjusterte tall: kvalitetsindikatorer
Forklaringen på indikatorene i tabellen kan finnes her: SSBs Metadata - Statistiske metoder - Sesongjustering
Spesielle tilfeller
Sesongjustering av korte tidsserie
Alle seriene er lange nok for å gjennomføre sesongkorrigeringsrutiner på en optimal måte
Kommentar : I 2006 var det en omlegging av AKU, hvor vi bl.a. begynte å kartlegge arbeidsmarkedssituasjonen også for 15-åringer. For å unngå brudd lar vi tidsseriene nå starte i 2006.
Behandling av vanskelig tidsserier
Problematiske serier behandles på en spesiell måte kun når de er relevante. Øvrige serier behandles i følge vanlige rutiner.
Kommentar : Stor tilfeldig variasjon (utvalgsusikkerhet) og liten sesongvariasjon gjør at vi ikke sesongjusterer alle variablene kjønnsfordelt. Dette gjelder arbeidsledige, sysselsatte og utførte ukeverk for personer 24 år og under. Etter sesongkorrigering og nivåjustering brytes evt. de aldersfordelte tallene ned på kjønn ved hjelp av månedlige fordelingsnøkler. Fordelingsnøklene er laget av uoffisielle trend tall fra ekstrakjøringer av X12-ARIMA basert på AKU.
Publiseringsrutiner
Tilgjengelighet
Både 3 måneders glidende sentrerte gjennomsnitt av sesongjusterte serier og trend er tilgjengelige.
Alle metadata relatert til hver enkelte serie er tilgjengelige.
Historiske sesongjusterte data er tilgjengelige i statistikkens arkiv med hensyn til gjennomføring av revisjonsanalyse.
Sesongjusterte AKU-tall er også tilgjengelig som åpne data med Application Programming Interface ( API ).
Kommentar : Se tidligere publisert for tabeller med historiske sesongjusterte data.
Formidling
3 måneders glidende sentrerte gjennomsnitt av sesong- og kalenderjusterte serier og trend formidles.
For hver serie formidles enkelte indikatorer som viser kvaliteten på sesongjusteringsrutinene.
Kommentar : Kun 3 måneders glidende sentrerte gjennomsnitt av sesong- og kalenderjusterte tall publiseres for å redusere usikkerheten, i tillegg til trenden. For eksempel er tallet for september gjennomsnittet av anslagene for august – oktober.
Statistikken blir no publisert saman med Arbeidskraftundersøkelsen.