Statistisk sentralbyrå (SSB) har tidligere utviklet en modell for å beregne markedsverdier for boliger som ble tatt bruk i 2009, og siden har blitt brukt til å beregne formuesgrunnlaget for boliger. Flere kommuner bruker også dette formuesgrunnlaget ved utskrivning av eiendomsskatt.
Boligverdi beregnes separat for forskjellige regioner og bygningstyper (beregningsområde). De enkelte beregningsområdene er inndelt i soner basert på prisnivå. Hvert beregningsområde deles opp i prissoner, der hovedregelen er at soner består av hele kommuner. Kommunereformen i 2020 førte til at modellen treffer dårligere enn før, fordi kommuner i forskjellige soner ble slått sammen.
Vi utarbeider en modell basert på grunnkretser, og en maskinlæringsalgoritme for å gruppere grunnkretsene til grupper med tilstrekkelig antall observasjoner. De 14 000 grunnkretsene i Norge deles opp i ca. 1 200 grupperinger, separat for bygningstype. For hver kombinasjon av geografisk område og bygningstype kjøres så en separat hedonisk regresjon for å predikere boligverdi.
Den grunnleggende avveiningen ved aggregering av grunnkretser er at man ønsker å skape små områder som er så homogene som mulig, samtidig som man er avhengig av et visst antall omsetninger i den hedoniske regresjonen. Det resulterer i mange, geografisk små grupper i sentrale strøk, og geografisk større grupper i mindre sentrale strøk. Slik utnyttes den store mengden informasjon i byer til å bedre predikere lokale prisnivåer.
Resultater fra grunnkretsmodellen vises, og sammenlignes med resultater fra den eksisterende modellen for både 2019 og 2020. Grunnkretsmodellen gir tydelige forbedringer i prediksjonskraften for beregnet boligverdi. Dette gjelder for alle tre fylker, og for fire forskjellige mål på prediksjonskraft. I tillegg predikerer grunnkretsmodellen boligverdien for dyre boliger i Oslo mye bedre. Dette har vært en kjent svakhet ved den eksisterende modellen. Resultatene for den nye modellen er svært like for 2019 og 2020, noe som tyder på at sammenslåing av kommuner har liten effekt på modellen, og at den er relativt stabil over tid.
Vi diskuterer også kort andre metoder som kan brukes for å bedre utnytte informasjonen som er tilgjengelig i dagens data.
Notatet avsluttes med en diskusjon av resultatene, samt gjenstående utfordringer ved bruken av grunnkretsmodellen for beregning av boligverdi for hele boligmassen.