Statistisk sentralbyrå (SSB) har tidligere utviklet en modell for å beregne markedsverdier for boliger som ble tatt bruk i 2009, og siden har blitt brukt til å beregne formuesgrunnlaget for boliger. Flere kommuner bruker også dette formuesgrunnlaget ved utskrivning av eiendomsskatt.
I den eksisterende modellen beregnes boligverdi separat for forskjellige regioner og boligtyper (beregningsområde). De enkelte beregningsområdene er inndelt i soner basert på prisnivå. Hvert beregningsområde deles opp i prissoner, der hovedregelen er at soner består av hele kommuner. Kommunereformen i 2020 førte til at modellen treffer dårligere enn før, fordi kommuner i forskjellige soner ble slått sammen.
Vi utarbeider her en modell basert på grunnkretser, som er betraktelig mindre enn kommuner. Vi bruker en maskinlæringsalgoritme for å gruppere grunnkretsene til beregningsområder med tilstrekkelig antall observasjoner. De 14 000 grunnkretsene i Norge deles opp i ca. 1 200 beregningsområder, separat for hver boligtype. For hver kombinasjon av geografisk område og boligtype kjøres så en separat hedonisk regresjon for å predikere boligverdi.
Vi diskuterer også kort andre metoder som kan brukes for å bedre utnytte informasjonen som er tilgjengelig i dagens data.
Den grunnleggende avveiningen ved aggregering av grunnkretser er at vi ønsker å skape små områder som er så homogene som mulig, samtidig som vi er avhengig av et visst antall omsetninger i den hedoniske regresjonen. Det resulterer i mange, geografisk små beregningsområder i sentrale strøk, og geografisk større beregningsområder i mindre sentrale strøk. Slik utnyttes den store mengden informasjon i byer til bedre å predikere lokale prisnivåer.
Vi viser resultater fra grunnkretsmodellen, og sammenligner dem med resultater fra den eksisterende modellen for både 2019 og 2020. Grunnkretsmodellen gir tydelige forbedringer i prediksjonskraften for beregnet boligverdi. Dette gjelder for alle fylker, og for fire forskjellige mål på prediksjonskraft. I tillegg predikerer grunnkretsmodellen boligverdien for dyre boliger i Oslo mye bedre. Dette har vært en kjent svakhet ved den eksisterende modellen. Resultatene for den nye modellen er svært like for 2019 og 2020, noe som tyder på at sammenslåing av kommuner har liten effekt på modellen, og at den er relativt stabil over tid.
Notatet avsluttes med en diskusjon av resultatene, modellens robusthet, samt en gjennomgang av forskjellige problemstillinger man må ta hensyn til hvis man skal bruke grunnkretsmodellen for beregning av boligverdi for hele boligmassen.