I hvilken grad klarer folk å oppgi riktig inntekt i intervjuundersøkelser sammenlignet med det de på ære og samvittighet oppgir i selvangivelsen? Denne artikkelen viser at få personer oppgir en helt riktig inntekt når de blir intervjuet. Det er imidlertid store forskjeller i hvilken grad folk over- eller underrapporterer sin inntekt i intervju avhengig av alder, kjønn, yrkestilknytning, inntekts- og utdanningsnivå. Det er i tillegg en klar tendens til at folk i intervju oppgir å ha en mer "gjennomsnittlig" inntekt enn det selvangivelsen avslører.
Jon Epland og Mads Ivar Kirkeberg
De fleste av oss har vel en eller annen gang blitt oppringt av et meningsmålingsinstitutt og blitt bedt om å svare på spørsmål av forskjellig art. Til slutt i slike intervjuer dukker det ofte opp spørsmål av en art som intervjueren har ventet med for ikke å irritere intervjuobjektet unødvendig. Et slikt spørsmål kan være hvor stor inntekt du hadde i en foregående periode, for eksempel i forrige år. Ofte kan det være vanskelig for intervjuer å, i det hele tatt, få svar på slike spørsmål, og i hvert fall få korrekte svar. Det er flere grunner til dette. Mange vil føle at spørsmål om egen økonomi er såpass sensitivt at de ikke ønsker å svare, eller man har store problemer med å huske størrelsen på sin egen inntekt i fjor. En del klarer kanskje å huske sånn omtrent hvilken yrkesinntekt eller pensjon man hadde, men når man blir bedt om å oppgi sin bruttoinntekt, og i tillegg skal legge til andre skattepliktige inntekter som for eksempel renter på bankinnskudd, aksjeutbytte, inntekt av bolig og så videre, så blir det fort verre. Noen kan også ha hatt flere ansettelsesforhold i løpet av året, mens andre, som for eksempel selvstendig næringsdrivende, kan ha inntekter som varierer mye fra år til år. De færreste vil vel også under et intervju tilby seg å finne frem selvangivelsen fra fjoråret for å finne beløpet der.
En av de beste metodene for å studere målefeil i intervjuundersøkelser, er å sammenligne disse dataene med tilsvarende data fra administrative regist-re. Det har av åpenbare grunner ikke blitt gjort mange slike undersøkelser. Intervjuundersøkelser er kostbare, og det skal argumenteres godt for å inkludere slike spørsmål når man har opplysningene tilgjengelig på registre hos skattemyndighetene. Noen undersøkelser er likevel foretatt opp gjennom årene, hovedsakelig i de nordiske landene. Resultatene fra undersøkelsene varierer en del. I en tidlig norsk undersøkelse (Siring 1980) ble opplysninger om familiens nettoinntekt innhentet i Fruktbarhetsundersøkelsen 1977, sammenlignet med tilsvarende inntekt i skatteregisteret. Her fant man blant annet en høy grad av overrapportering av inntekt ved intervju. En viktig årsak til dette var at mange av kvinnene som ble intervjuet hadde en klart overdrevet oppfatning av størrelsen på sin ektefelles inntekt! En annen årsak var at folk misforsto spørsmålet og rapporterte bruttoinntekt når de egentlig ble bedt om å oppgi nettoinntekt. En senere dansk undersøkelse (Jørgensen 1998) fant også en relativt høy grad av overrapportering fordi folk misforsto selve inntektsbegrepet. Andre undersøkelser, for eksempel Michaud og Latouche (1996) og Nordberg, Penttilä og Sandström (2001), konkluderer derimot med at respondentene i høy grad underrapporterer sin inntekt i forhold til den inntekten som de har i administrative registre. De sistnevnte fant at det var særlig selvstendig næringsdrivende og de med høy inntekt som oppga en for lav inntekt ved intervju.
I den norske levekårsundersøkelsen for 1997 ble folk spurt både om sin individuelle bruttoinntekt og husholdningens samlede bruttoinntekt i foregående år (se boks om Data). Nedenfor presenteres først noen resultater av de sammenligningene som er gjort med den individuelle bruttoinntekten på selvangivelsen til disse intervjuobjektene, deretter skal vi se litt på hvordan folk "treffer" når de skal anslå hele husholdningens inntekt2.
Data
Intervjuopplysningene om inntekt er hentet fra Levekårsundersøkelsen 1997. Dette er en omfattende undersøkelse hvor det blant annet spørres om helse, arbeidsforhold, bolig, sosiale relasjoner og så videre. To spørsmål om inntekt er også inkludert: 1) Hvor stor var din egen bruttoinntekt i 1996? Med bruttoinntekt menes inntekt før fradrag og skatt er trukket fra 2) Hva vil du anslå husholdningens samlede bruttoinntekt til i 1996? Omtrent 4 900 individer 16 år og eldre ble spurt (bruttoutvalget), mens omtrent 3 400 individer svarte (nettoutvalget). Dette gir en svarandel på 69 prosent. En sammenligning av brutto- og nettoutvalget viser at nettoutvalget har en liten skjevhet ved at de som har svart gjennomsnittlig har en litt høyere bruttoinntekt på selvangivelsen enn det opprinnelige utvalget. Bruttoutvalget Nettoutvalget Netto/Brutto 3. kvartil 234 000 kroner 246 000 kroner 105 Median 150 000 kroner 164 000 kroner 109 1. kvartil 74 000 kroner 79 000 kroner 107 Gjennomsnitt 175 000 kroner 183 000 kroner 105 For andre variabler som alder og kjønn er det ingen slik skjevhet mellom de to ut-valgene (Sundvoll og Teigum 1998). Nettoutvalget har fått påkoblet tilsvarende inntektsopplysninger fra Statistisk sentralbyrås selvangivelsesstatistikk 1996. Dette ga kobling for 3 166 personer som danner grunnlaget for selve analysen. Vi går i denne artikkelen ut fra at det beløpet som registreres på selvangivelsen ligger nærmere det "sanne" eller faktiske beløpet folk har i inntekt, selv om vi vet at for noen individer, for eksempel selvstendig næringsdrivende, vil dette kanskje ikke være riktig. Vi begrunner vårt valg med at de langt fleste skattytere (for eksempel lønnsmottakere og pensjonister) i liten grad har muligheter til å unndra skattepliktige inntekter, på grunn av den rapporteringen som i dag skjer i fra arbeidsgiver, trygdekontor, bank, forsikringsselskap med videre og til skatteetaten. |
Som tabell 1 klart viser, så oppgir mer enn to tredeler for lav inntekt ved intervju, mens tre av ti oppgir for høy inntekt. Det er likevel store forskjeller i graden av feilrapportering. Mer enn hvert tredje intervju-objekt oppgir en inntekt som avviker mindre enn 5 prosent av bruttoinntekten på selvangivelsen. Men hver fjerde person oppgir faktisk en inntekt som ligger mer enn 20 prosent over eller under inntekten på selvangivelsen. Nesten 10 prosent av alle intervjuobjektene har så "dårlig hukommelse" at de bommer med mer enn halvparten av sin årlige bruttoinntekt. De i underkant av 3 prosent uten noe avvik mellom inntekt på selvangivelsen og i intervju, er hovedsakelig personer uten inntekt, og for dem er det kanskje ikke så vanskelig å huske?
Vi skal nå se litt nærmere på hva som kjennetegner de som har de største avvikene, og konsentrerer oss heretter om de som oppgir en inntekt som avviker mer enn 20 prosent fra hva de har oppgitt i sin selvangivelse.
Den sosioøkonomiske statusen til intervjuobjektet ser ut til å være viktig når man skal forklare forskjellen mellom den inntekten folk oppgir i intervju og hva de har oppgitt på selvangivelsen. Som vi ser i figur 1, oppgir selvstendig næringsdrivende i langt større grad feil inntekt sammenlignet med de som er lønnsmottakere. En av årsakene til dette er åpenbar. Lønnsmottakere vil ofte ha en relativt god oversikt over sin årlige lønnsinntekt som dessuten ikke vil variere så mye fra et år til et annet. Selvstendig næringsdrivende har ofte en mer komplisert økonomi, og inntekten kan i større grad variere. Det er vel også et godt kjent faktum at innslaget av "svarte penger" er mye større blant næringsdrivende enn blant vanlige lønnsmottakere. Vi finner da også at drøyt 22 prosent av de selvstendig næringsdrivende oppga en inntekt under intervju som var mer enn 20 prosent høyere enn hva de hadde oppgitt på selvangivelsen. Tilsvarende andel blant lønnsmottakere var 6 prosent. Blant de som oppga en lavere inntekt under intervju, var forskjellene langt mindre mellom næringsdrivende og ansatte.
Det er også litt interessant å legge merke til at pensjonister i stor grad oppgir feil inntekt, selv om man skulle tro at disse hadde en relativt stabil økonomi. Nesten en av fire pensjonister oppgir mer enn 20 prosent for lav inntekt under intervju. Det er grunn til å tro at mange pensjonister unnlater å inkludere sine kapitalinntekter, som kan være en relativt stor inntektskilde for denne gruppen. Generelt ser man at respondenter hvor kapitalinntektene utgjør en betydelig andel av bruttoinntekten, oppgir en altfor lav inntekt. Blant intervjuede hvor kapitalinntektene sto for mer enn en firedel av bruttoinntekten, oppga to tredeler en inntekt som var minst 20 prosent for lav i forhold til inntekten på selvangivelsen.
Omtrent 7 prosent av pensjonistene oppgir en inntekt under intervju som ligger mer enn 50 prosent høyere eller lavere enn på selvangivelsen. Tilsvarende andeler blant de selvstendig næringsdrivende og blant lønnsmottakerne er henholdsvis 12 og 4 prosent.
Som vi ser i figur 2, er det en klar tendens til at graden av feilrapportering varierer med hvilket inntektsnivå den intervjuede har. Personer som befinner seg nederst og øverst i inntektsfordelingen ser ut til å ha større problemer med å oppgi tilsvarende inntekt i intervju som i selvangivelsen sin, sammenlignet med personer med mer midlere inntekter. Blant de med en bruttoinntekt under 50 000 kroner oppgir mer enn halvparten en inntekt som avviker mer enn 20 prosent fra hva de har oppgitt på selvangivelsen året før. For de med en inntekt mellom 200 000 og 300 000 kroner er tilsvarende andel drøyt 10 prosent.
Tallene viser også at de med høyest inntekt i større grad oppgir en lavere inntekt under intervju, mens dette i langt mindre grad er tilfellet i de lavere inntektsklassene. Med andre ord kan det se ut som at de rikeste ønsker å opptre mer "gjennomsnittlig" når de blir intervjuet om sin økonomi. Blant de med en inntekt på en halv million kroner eller høyere oppgir hver femte person minst 20 prosent lavere inntekt når de blir intervjuet.
Figur 3 viser en svak tendens til at kvinner, sammenlignet med menn, i større grad feilrapporterer sin inntekt når de blir intervjuet. Blant kvinnene oppgir 26 prosent at de har en inntekt som avviker mer enn 20 prosent mot den de har oppgitt til ligningsmyndighetene. Blant menn er andelen 22 prosent. Men det er ingen forskjell mellom kjønnene for de som oppgir mer enn 50 prosent avvik i inntekten sin. Kvinnene er som regel de mest "beskjedne": Det er en tendens til at kvinner i større grad oppgir en lavere inntekt, mens menn i større grad oppgir en høyere inntekt når de blir intervjuet.
Figur 3 viser også at alder, ikke uventet, har betydning for graden av feilrapportering. Ved sammenligning av ulike aldersgrupper finner man at de unge i alderen 16-29 år er overrepresentert blant de som oppgir feil inntekt. Dette er tilfellet både for de som gir for høye og for lave inntektstall. En årsak kan være at dette ofte dreier seg om studenter og skoleelever med varierende arbeidsinntekter. Studielån og stipend er for eksempel skattefrie og ikke inkludert i bruttoinntekt, men kan kanskje av noen oppgis som slik inntekt under et intervju.
Vi ser også at de i aldersgruppen 70 år og eldre er blant de med de største avvikene i inntekt. Dette må sees i sammenheng med det som figur 1 viser, at pensjonistene var den gruppen etter selvstendig næringsdrivende som oftest oppga feil inntekt under intervju. Et annet forhold som spiller inn, er det gjennomsnittlig lavere utdanningsnivået blant de eldre.
Det kan virke som om en intervjuer vil få bedre svar på spørsmål om individuell inntekt desto høyere utdanning intervjuobjektet har. Figur 4 viser i hvert fall at i den gruppen med lengst utdanning er det 17 prosent som "bommer" med mer enn 20 prosent. Blant de med lavest utdanning er tilsvarende andel 28 prosent. Det er også en tendens i retning av at de med lavere utdanning i større grad oppgir en høyere inntekt når de blir intervjuet, enn hva tilfellet er hos de med høyere utdanning.
Til analyseformål vil det ofte være vel så interessant å vite hva som er husholdningens inntekt enn den personlige inntekten til intervjuobjektet. En får da et bedre bilde av de økonomiske levekårene til vedkommende. Men for å få opplysninger om husholdningsinntekten krever dette at den som blir intervjuet har en god oversikt over hva de andre husholdningsmedlemmene har i inntekt.
Det viser seg, ikke overraskende, at respondenter som bor sammen med andre, åpenbart har større problemer med å vite hva som er husholdningsinntekten enn sin egen inntekt. Vi så for eksempel at 38 prosent av alle som ble intervjuet "traff" rimelig bra ved at den personlige bruttoinntekten de oppga ikke var mer enn 5 prosent forskjellig fra det man fant på selvangivelsen. Denne andelen ble redusert til 30 prosent når man stilte tilsvarende spørsmål om husholdningsinntekten til de av intervjuobjektene som enten var gift eller samboende.
Ellers så innehar "avvikerne" i stor grad de samme kjennemerkene når det gjelder husholdningsinntekt som vi allerede har sett for personlig inntekt. Det er en overvekt av selvstendige og pensjonister blant dem som bommer mye. Det samme gjelder for de aller yngste og de aller eldste og for de som befinner seg i hver sin ende av inntektsfordelingen. I tillegg ser igjen utdanningsnivået ut til å ha betydning når det gjelder i hvor stor grad det er sammenfall mellom oppgitt husholdningsinntekt i intervju og på selvangivelsen.
Det ble innledningsvis referert til en tilsvarende norsk undersøkelse fra slutten av 1970-tallet, der en av konklusjonene var at gifte kvinner i intervjuet oppga altfor høye familieinntekter, blant annet som følge av at de trodde ektemennene hadde en høyere inntekt enn det de faktisk hadde (Siring 1980). Det kan derfor være av interesse å se om det etter 20 år med sterk økning i kvinners sysselsetting og dermed økt bidrag til familieøkonomien, fremdeles er slik at gifte eller samboende kvinner har en overdrevet forestilling om hva ektemannen tjener?
Ut fra figur 5 kan vi slå fast at den tid nok er forbi. Blant alle gifte eller samboende kvinner var det bare en liten andel (6 prosent) som oppga en husholdningsinntekt i intervjuet som var minst 20 prosent høyere enn det registerdata viser. Det er i stedet en tendens til at de gifte kvinnene – og i noe større grad enn menn – oppgir for lave husholdningsinntekter i intervjuet. Dette gjelder i særlig grad for kvinner i aldersgruppene 50-69 år og 70 år og eldre.
Når man i spørreundersøkelser stiller spørsmål om inntekt, er det blant annet for å kunne gruppere intervjuobjektene i ulike inntektsklasser for siden å se i hvilken grad det er sammenheng mellom inntektsnivået og de svar respondenten gir innenfor en rekke andre områder, for eksempel spørsmål knyttet til helse- og arbeidsforhold, forbruksmønster, holdninger til u-hjelp eller partipreferanse. Men vil en slik inndeling etter inntektsklasser kunne gi et riktig bilde på inntektsfordelingen, når vi har sett at relativt mange åpenbart har vansker med å oppgi en inntekt som samsvarer med det vi finner på selvangivelsen? En måte å få svar på dette på, er å se i hvor stor grad det er overlapp mellom den inntektsklassen intervjuobjektene selv plasserer seg i ut fra intervjudata, med den klassen som baserer seg på selvangivelsesdata.
I tabell 2 har vi plassert alle de som har svart på intervjuet i en rekke ulike inntektsklasser, der hvert enkelt trinn er på 50 000 kroner. Ved første øyekast kan det virke som at det, med unntak for de med de aller laveste inntektene, er liten grad av samsvar mellom den inntektsklassen som baserer seg på intervjuopplysninger, og den som er basert på selvangivelsen. For personer med en bruttoinntekt nær gjennomsnittet for hele den voksne befolkningen (ca. 180 000 kroner i 1996), det vil si i inntektsintervallet fra 150 000 til 200 000 kroner, var det for eksempel bare 63 prosent som også hadde oppgitt å tilhøre samme inntektsintervallet i intervjuet. Nå kan det likevel være slik at respondenten i intervjuet kan ha vært litt for "omtrentlig" i besvarelsen av inntektsspørsmålet, og dermed havnet like over eller like under dette intervallet. Det viser seg ganske riktig at de fleste av dem som ble intervjuet og som ikke klarte å treffe "rett" inntektsklasse, likevel har oppgitt en inntekt som plasserer dem i inntektsgruppen straks under eller over denne klassen. Vi ser for eksempel at om vi utvider inntektsklassen med 50 000 kroner hver vei, så ville samsvaret mellom inntektsopplysningene fra intervju og selvangivelse øke til hele 96 prosent for de med typiske gjennomsnittsinntekter (det vil si mellom 150 000 og 200 000 kroner). Vi legger likevel merke til at samsvaret blir merkbart dårligere når inntektsnivået øker. For eksempel svarte så mange som 15 prosent av alle med en bruttoinntekt på mellom 400 000 og 450 000 kroner i selvangivelsen, at de hadde en bruttoinntekt som var minst 50 000 kroner lavere i intervjuet.
Når vi ser på tilsvarende samsvar for husholdningsinntekt (tabell 3), er det likevel større grunn til å stille spørsmål om vi helt kan stole på de besvarelsene som er gitt i intervjuet. Det viser seg for eksempel at så mange som mellom 20 og 25 prosent av intervjuobjektene, noe varierende etter hvilket inntektstrinn de befinner seg på, oppgir å ha en husholdningsinntekt som er minst 50 000 kroner forskjellig (høyere eller lavere) fra det selvangivelsesdata viser. Vi får dessuten igjen bekreftet at folk, når de blir spurt, har en tendens til helst å oppgi at de har en inntekt nær "gjennomsnittet" i befolkningen. For de med relativt lave husholdningsinntekter, for eksempel under 250 000 kroner, er det relativt mange som svarte at de hadde en inntekt som var høyere enn det som står på selvangivelsen. For de med relativt høye inntekter, for eksempel over 400 000 kroner, er forholdet omvendt. Her går feilrapporteringen i større grad "nedover" ved at mange oppgir å ha en inntekt som er lavere enn det selvangivelsen faktisk viser.
Formålet med artikkelen har vært å sammenligne inntektsopplysninger gitt ved intervju med tilsvarende opplysninger hentet fra selvangivelsen. Resultatet har vist at det er nødvendig med relativt grove inndelinger i inntektsklasser for at det skal bli god overlapp mellom inntektsopplysninger innhentet ved intervju og tilsvarende opplysninger om inntekt fra selvangivelsen. Når man foretar detaljerte sammenligninger av inntektsdata fra de to kildene, avdekkes betydelige forskjeller, og graden av feilrapportering varierer med ulike kjennemerker ved respondentene. Det er videre et gjennomgående trekk at intervjuobjektene tenderer å rapportere en lavere inntekt ved intervju, enn det som er oppgitt på selvangivelsen. Dette gjelder i særlig grad for dem med høye skattepliktige inntekter.
En lærdom av dette må være at man bør være forsiktig med å benytte intervjudata over inntekt til for eksempel å beskrive det "gjennomsnittlige" inntektsnivået til ulike grupper, eller til å beskrive hvordan inntektene er fordelt innen befolkningen. Derimot så kan inntektsopplysninger innhentet fra intervju være en velegnet bakgrunnsvariabel, i alle fall så lenge man grupperer respondentene inn i romslige inntektskategorier.
1. Resultatene er tidligere presentert i Epland og Kirkeberg 2002.
2. Intervjuobjektene ble bedt om å avrunde sin inntekt til nærmeste 1 000 kroner, eller til nærmeste 10 000 kroner dersom de hadde problemer med å svare.
Referanser
Epland, J. og M.I. Kirkeberg (2002): Comparing Norwegian income data in administrative registers with income data in the Survey of Living Conditions, Draft version, Contributed paper presented at The International Conference on Improving Surveys (ICIS), Copenhagen, Denmark, 25 August to 28 August 2002.
Jørgensen, J. M. (1998): Comparison of Income Variables between the European Community Household Panel and Danish Statistical Registers. Statistics Denmark.
Michaud, S og M. Latouche (1996): Some data quality impacts when merging survey data on income with tax data. SLID Research Paper Series, Catalogue No. 96-12, Statistics Canada.
Nordberg, L., I. Penttilä og S. Sandström (2001): A study on the effect of using interview versus register data in income distribution analysis with an application to the Finnish ECHP-survey in 1996. CHINTEX WP 5, Statistics Finland.
Siring, E. (1980): Sammenlikning av inntektstall oppgitt i Fruktbarhetsundersøkelsen 1977 med inntektstall fra skatteregisteret, Interne Notater 80/24, Statistisk sentralbyrå.
Sundvoll, A. og H. M. Teigum (1998): Samordnet levekårsundersøkelse 1997 - tverrsnittsunder-søkelsen. Dokumentasjonsrapport. Notater 98/34, Statistisk sentralbyrå.
Mads Ivar Kirkeberg er seniorrådgiver i Statistisk sentralbyrå, Seksjon for inntekts- og lønnsstatistikk ( mads.ivar.kirkeberg@ssb.no).
Jon Epland er seniorrådgiver i Statistisk sentralbyrå, Seksjon for inntekts- og lønnsstatistikk (jon.epland@ssb.no).