Innhold
Om statistikken
Definisjoner
-
Navn og emne
-
Navn: Stortingsvalget, velgerundersøkelsen
Emne: Valg
-
Ansvarlig seksjon
-
Seksjon for befolkningsstatistikk
-
Definisjoner av viktige begrep og variabler
-
Partiforkortelser:
AP Det Norske Arbeiderparti
SV Sosialistisk Venstreparti
RV Rød Valgallianse
SP Senterpartiet
KRF Kristelig Folkeparti
V Venstre
H Høyre
FRP Fremskrittspartiet
DLF Det Liberale Folkeparti
DPP Det Politiske Parti
FLP Fedrelandspartiet
KSP Kristent Samlingsparti
KYST Kystpartiet
MDG Miljøpartiet De Grønne
NF Norsk Folkeparti
NKP Norges Kommunistisk Parti
NLP Naturlovpartiet
PP Pensjonistpartiet
TVKD Tverrpolitisk kyst- og distriktsparti
-
Standard klassifikasjoner
-
Landsdeler: Landets fylker er fra og med valget i 1997 gruppert i landsdeler på følgende måte:
1. Oslo og Akershus
2. Hedmark og Oppland
3. Sør-Østlandet: Østfold, Buskerud, Vestfold, Telemark
4. Agder/Rogaland: Aust-Agder, Vest-Agder og Rogaland
5. Vestlandet: Hordaland, Sogn og Fjordane og Møre og Romsdal
6. Trøndelag: Sør-Trøndelag og Nord-Trøndelag
7. Nord-Norge: Nordland, Troms og Finnmark
Administrative opplysninger
-
Regionalt nivå
-
Fylke
-
Hyppighet og aktualitet
-
Hvert fjerde år
-
Internasjonal rapportering
-
Anonymisert mikrodatasett gjøres tilgjengelig for internasjonal forskning.
-
Lagring og anvendelse av grunnlagsmaterialet
-
Institutt for Samfunnsforskning og forskere tilknyttet Valgforskningsprogrammet har dataene eksklusivt inntil to år. Ved tidspunkt for frigivning av data, senest innen to år, gjøres et anonymt datasett allment tilgjengelig for forskning via NSD.
Bakgrunn
-
Formål og historie
-
Statistisk sentralbyrå gjennomførte egne stortingsvalgsundersøkelser i 1969 og 1973. Fra 1977 har valgundersøkelsene i forbindelse med stortingsvalg blitt gjennomført i samarbeid mellom Statistisk sentralbyrå og Institutt for samfunnsforskning.
-
Brukere og bruksområder
-
Statistikken og analysene blir brukt av forskere og studenter innen en rekke samfunnsfag som statsvitenskap, sosiologi og medier og kommunikasjon. Andre viktige grupper er journalister, de politiske partiene og offentlig forvaltning. Statistikk fra stortingsvalg etterspørres også fra journalister, forskere og studenter i andre land.
-
Likebehandling av brukere
-
Adgang til tallene før publisering:
Som en del av samarbeidet om produksjonen mottar ISF avidentifiserte og anonyme datasett. ISF samarbeider med SSB om enkelte publiseringer fra undersøkelsene og har tilgang til tallgrunnlaget forut for statistikkpublisering på SSBs nettsider. SSB publiserer statistikk fra undersøkelsen samtidig som ISF publiserer sine analyser.
Ingen eksterne brukere har tilgang til statistikk før den er publisert samtidig for alle kl. 08.00 på ssb.no etter forhåndsvarsling senest tre måneder før i Statistikkalenderen Dette er et av de viktigste prinsippene i SSB for å sikre likebehandling av brukerne.
-
Sammenheng med annen statistikk
-
Statistikken kan sees i sammenheng med annen valgstatistikk.
-
Lovhjemmel
-
Frivillig samtykkebassert, Statistikkloven § 2-5 (1) og Datatilsynets vedtak av 16.3.2006 pkt 1.1 og 2.1 (ref 01/533-17)
-
EØS-referanse
-
Ikke aktuelt
Produksjon
-
Omfang
-
Populasjonen er alle norske borgere med stemmerett i stortingsvalgene. Statistikken baseres på et representativt utvalg. Resultatene dreier seg om politisk adferd som stemmegiving, holdninger til politiske stridsspørsmål og tillit til politiske institusjoner.
-
Datakilder og utvalg
-
Ved valget 2017 gjennomførte Statistisk sentralbyrå og Institutt for samfunnsforskning fire forskjellige velgerundersøkelser:
- Undersøkelse av valgkampen (VPU),
- Den tradisjonelle stortingsvalgundersøkelsen (SVU)
- Undersøkelse med spørsmål fra en internasjonal modul (CSES)
- Velgerundersøkelsen blant innvandrere og øvrige (VU)
I tillegg ble alle som ikke deltok i undersøkelsene invitert til å svare på en kort versjon av undersøkelsen. Analysene og resultatene om partivalg er basert på de fire undersøkelsene og dermed et langt større utvalg enn tidligere.
Til intervjuundersøkelsen i 2013 ble et bruttoutvalg på 3 138 forsøkt intervjuet. Det ble oppnådd fullstendig intervju med 1 727 personer. Både i 2009 og 2013 ble frafallet (de vi ikke oppnådde intervju med) kontaktet på nytt ved et kort selvutfyllingsskjema med spørsmål om bl.a. stemmegivning. Om lag 200 personer svarte i forbindelse med denne oppfølgingen.
Til intervjuundersøkelsen i 2009 ble et bruttoutvalg på 2 944 forsøkt intervjuet. Det ble oppnådd fullstendig intervju med 1 782 personer.
Til intervjuundersøkelsen i 2005 ble et bruttoutvalg på 2 965 forsøkt intervjuet. Det ble oppnådd fullstendig intervju med 2 012 personer.
Utvalget er et såkalt rullerende panel, det vil si at omtrent halvparten av de som deltok i 2013 også deltok i 2009. Halvparten av de som deltok i 2009 deltok i 2005 osv. I forbindelse med valget i 2017 er planen at halvparten av de som deltok i 2013 blir kontaktet på nytt for intervju.
Utvalgene er trukket direkte fra valgmanntallet. Intervjuundersøkelsene frem til 2013 er trukket i henhold til i Statistisk sentralbyrås utvalgsplan for besøksintervju. I utvalgsplanen er hele landet inndelt i et sett av utvalgsområder, som igjen er inndelt i 109 strata. Utvalgsområder er kommuner eller grupper av kommuner. Kommuner med lavt innbyggertall er slått sammen med andre kommuner, slik at alle utvalgsområder har minst 7 prosent av samlet innbyggertall i det stratumet området tilhører. I en del tilfeller er mindre omegnskommuner til folkerike kommuner slått sammen med den store kommunen i ett område. Alle kommuner med mer enn 30 000 innbyggere og en del kommuner med mellom 25 000 og 30 000 innbyggere er tatt ut som egne strata. Tilleggsutvalgene er trukket enkelt tilfeldig fra valgmanntallet.
-
Datainnsamling, editering og beregninger
-
Data blir samlet inn både gjennom telefonintervju og ved et Internettbasert skjema, og respondentene kunne svare på PC, Mac eller smarttelefon. Den tradisjonelle stortingsvalgundersøkelsen (SVU) har høyest svarprosent, her er også personlig intervju benyttet. I de tre andre undersøkelsen er det kun benyttet selvutfylling på web (pc. Mac eller
Smartphone). I tillegg ble alle som ikke deltok i undersøkelsen invitert til å svare på en kort versjon av undersøkelsen.Frem til 2013 var det en times langt personlig intervju. Regelen var at intervjuene skulle foregå ved besøk med mindre intervjuobjektet ba om å få ta det på telefon.
-
Sesongjustering
-
Ikke relevant
-
Konfidensialitet
-
Sammenliknes med tidligere valg.
-
Sammenlignbarhet over tid og sted
-
SSB har gjennomført undersøkelser ved hvert stortingsvalg siden 1969. Valgforskningsprogrammet gjennomførte også undersøkelser i 1957, 1965. Disse undersøkelsene er for en rekke sentrale variabler sammenlignbare med dagens undersøkelser. Deler av statistikken følger internasjonale standarder og er sammenliknbar med liknende undersøkelser.
Nøyaktighet og pålitelighet
-
Feilkilder og usikkerhet
-
Som en del av kvalitetskontrollen av undersøkelsen sammenliknes estimater fra undersøkelsen med offisiell valgstatistikk. Vi kan blant annet sammenlikne partifrekvensen i utvalget med det offisielle valgresultatet for partiene. Slike avvik mellom svarene fra undersøkelsen og offisiell valgstatistikk kan skyldes ulike typer målefeil (innsamlingsfeil og bearbeidingsfeil), skjevhet innført ved frafall og utvalgsvarians. Av disse feilkildene er målefeil det vanskeligste å avdekke, målefeil kan komme av at intervjupersonen avgir feil svar. Det kan skyldes vansker med å huske forhold tilbake i tiden. Det kan også skyldes misforståelser av spørsmål. Når det blir spurt om forhold som folk erfaringsmessig finner kompliserte, må en regne med å få en del feilaktige svar. Bearbeidingsfeil er avvik mellom den verdien som registreres inn og den verdien som til slutt rapporteres ut. Gjennom ulike kontroller har man søkt å finne feil og rette dem opp. Utvalgsmetoden som benyttes i valgundersøkelsen, roterende panel, gjør det mulig å studere og eliminere en del målefeil. Når en har rettet opp feil så langt som det er mulig, er erfaringen at de statistiske resultatene i de fleste tilfeller påvirkes forholdsvis lite av både innsamlingsfeil og bearbeidingsfeil. Virkningen av feil kan likevel være av betydning i noen tilfeller. Det gjelder særlig hvis feilen er systematisk, det vil si at den samme feilen gjøres relativt ofte. Tilfeldige feil har forventningen 0, og medfører ikke skjevhet i estimatene. En tenker seg at feil som ikke er systematiske trekker like mye i hver retning, og at de derfor har svært liten effekt.
Det er ikke alle som er trukket ut som ønsker eller har anledning til å delta. Dersom personer med bestemte kjennetegn deltar systematisk mindre enn andre, oppstår en systematisk skjevhet. Systematisk skjevheter kan være uheldige fordi de fører til nettoutvalget (de som er intervjuet) ikke er representativt for den populasjonen man er ute etter å undersøke. Av den grunn er det viktig å ha oversikt over frafallet, slik at man får kjennskap til hvor skjevt utvalget er i forhold til populasjonen. Det gjør det også mulig å korrigere utvalget for kjente skjevheter. Vi har observert fra analyser av frafallet i valgundersøkelsene at det er en korrelasjon mellom å delta i undersøkelsen og kjennemerker som kjønn, aldersgruppe og utdannelse. Videre er det en klar sammenheng mellom å delta i valget og å delta i undersøkelsen. Vi har derfor fra 2013 valgt å forsøke å rette opp noe av denne skjevheten ved å vekte for de variablene vi har tilgang til for hele populasjonen: Stemt i valget fra manntallskontoret, kjønn, aldersgruppe og utdannelse. Frafallsvekten er beregnet som enkel etterstratifisering.
Valgundersøkelsen er en utvalgsundersøkelse, Gjennom utvalgsundersøkelser kan vi anslå forekomsten av ulike fenomener i en stor gruppe (populasjonen) ved å måle forekomsten bare i et mindre utvalg som er trukket fra populasjonen. Det gir store besparelser sammenlignet med om vi skulle gjennomført målingen i hele populasjonen, men samtidig får vi en viss usikkerhet i anslagene. Denne usikkerheten kan vi beregne når vi kjenner sannsynligheten for at hver enkelt enhet i populasjonen skal bli trukket til utvalget. Metoden som brukes til å beregne et anslag (estimatet), kalles en estimator. Det er to aspekter ved en estimator som er viktige. For det første bør estimatoren gi omtrent korrekt verdi ved gjentatte forsøk. Det vil si at den ”treffer målet” i den forstand at ved gjentatt trekking av utvalg, vil gjennomsnittsverdien av estimatene være sentret rundt den sanne populasjonsverdien; estimatoren er forventningsrett . I tillegg trenger vi et mål på hvor stor variasjon rundt populasjonsverdien estimatene har ved gjentatt trekking av utvalg. Det er denne variasjonen som er den statistiske usikkerheten til estimatet, og det vanlige målet er standardfeilen, SE (fra det engelske begrepet ”standard error”), til estimatet. SE er definert som det estimerte standardavviket til estimatoren. SE forteller dermed hvor mye et anslag i gjennomsnitt vil avvike fra den sanne verdien
Det er ikke foretatt egne beregninger eller anslag av standardavvik for Valgundersøkelsen. Imidlertid gjengir tabellen under en tilnærmet størrelse på standardavviket for observerte prosentandeler ved ulike utvalgsstørrelser ved et sikkerhetsnivå på 95 prosent. Av tabellen går det frem at usikkerheten blir mindre når antall observasjoner
øker, og at usikkerheten øker etter hvert som resultatet nærmer seg 50 prosent. Ved hjelp av standardavviket er det mulig å beregne et intervall som med en bestemt sannsynlighet innehar den sanne verdi av en beregnet størrelse (den verdien vi ville fått dersom vi hadde foretatt en totaltelling i stedet for en utvalgsundersøkelse). Slike intervaller kalles konfidensintervaller hvis de er konstruert på en bestemt måte: la M være den beregnede størrelsen og S være et anslag for standardavviket til M. Vi må selv bestemme oss for sikkerhetsnivået, men det er vanlig å konstruere konfidensintervaller som med tilnærmet 95 prosent sannsynlighet inneholder den sanne verdien for M. Konfidensintervallet er da gitt ved at vi legger 2 standardavvik til M for å få intervallet øvre grenseverdi, mens vi trekker 2 standardavvik fra M for å få nedre grenseverdi. Grensene for konfidensintervallet er derved gitt ved (M – 2*S) og (M + 2*S). Dette intervallet vil med 95 prosent sannsynlighet inneholder den sanne verdien for M i populasjonen. Tabellen under viser størrelsen på standardavviket for noen utvalgte prosentandeler og utvalgsstørrelser.Standardfeil i prosentpoeng for observerte prosentandeler ved ulike utvalgsstørrelser, for enkelt tilfeldig utvalg.
n : \ P :
5/95
10/90
15/85
20/80
25/75
30/70
35/65
40/60
45/55
50/50
25
4,4
6,0
7,1
8,0
8,7
9,2
9,5
9,8
9,9
10,0
50
3,1
4,2
5,0
5,7
6,1
6,5
6,7
6,9
7,0
7,1
100
2,2
3,0
3,6
4,0
4,3
4,6
4,8
4,9
5,0
5,0
200
1,5
2,1
2,5
2,8
3,1
3,2
3,4
3,5
3,5
3,5
300
1,3
1,7
2,1
2,3
2,5
2,6
2,8
2,8
2,9
2,9
500
1,0
1,3
1,6
1,8
1,9
2,0
2,1
2,2
2,2
2,2
1 000
0,7
0,9
1,1
1,3
1,4
1,4
1,5
1,5
1,6
1,6
1 200
0,6
0,9
1,0
1,2
1,3
1,3
1,4
1,4
1,4
1,4
1 500
0,6
0,8
0,9
1,0
1,1
1,2
1,2
1,3
1,3
1,3
2 000
0,5
0,7
0,8
0,9
1,0
1,0
1,1
1,1
1,1
1,1
4500
0,3
0,4
0,5
0,6
0,6
0,7
0,7
0,7
0,7
0,7
8000
0,2
0,3
0,4
0,4
0,5
0,5
0,5
0,5
0,6
0,6
Følgende eksempel illustrer hvordan en kan bruke tabellen over for å beregne konfidensintervall. Anta at i en utvalgsundersøkelse med 1 000 respondenter, oppgir 20 prosent at de ville stemt på Fremskrittspartiet i morgen. I tabellen finner vi at standardavviket er 1,3 for et resultat på 20 prosent med 1 000 observasjoner. Konfidensintervallet for den sanne verdien får grensene 20 +- (2*1,3). Intervallet strekker seg da fra 17,4 til 22,6. Det betyr at vi med 95 prosents sannsynlighet kan slutte at andelen som vil stemme på Fremskrittspartiet i morgen, ligger mellom 17,4 og 22,6 prosent. Det er vanlig å operere med et sikkerhetsnivå på 95 prosent, men konfidensintervall kan konstrueres for andre sikkerhetsnivå. Da må standardavviket multipliseres med et annet tall enn 2. Ofte er det ønskelig å sammenligne prosenttall for flere grupper. Når to usikre tall sammenlignes, vil usikkerheten på forskjellen mellom dem vanligvis bli større enn usikkerheten knyttet til hvert enkelt tall. Standardavviket til forskjeller mellom to prosenttall er lik kvadratroten av summen av kvadratene av standardavvikene til enkelttallene. Når en har anslag for standardavvikene til slike forskjeller, kan en konstruere konfidensintervall for den sanne verdi på samme måte som beskrevet ovenfor.
-
Revisjon
-
Ikke relevant