Denne kost-nyttevurderingen gjelder anvendelse av produktinformasjon om alle varer i EPD-databasen (produktdatabase for dagligvarer) til Tradesolution til etablert offisiell statistikk, samt til utvikling av nye statistikkprodukter/framtidig offisiell statistikk.

Nytten er først og fremst knyttet til hvordan varedeklarasjoner fra Tradesolution kan dekke behovene for utvikling av ny offisiell statistikk over kosthold og forbruk. Samtidig kan varedeklarasjoner øke kvaliteten i annen offisiell statistikk som SSB produserer.

Nytten er videre knyttet til å forbedre kvalitet og aktualitet i statistikkproduksjonen i dag og på lengre sikt. En moderne, effektiv og samordnet datainnsamling kan dessuten bidra til å redusere SSBs ressursbruk knyttet til datainnsamling og bearbeiding av data. Kostnadene som er beskrevet i dette notatet er først og fremst knyttet til opplysningenes «sensitivitet» i et kommersielt perspektiv.

Ansvarlig enhet: Avdeling for personstatistikk

Dato: 25. juni 2024

Oppgavegiver(e): Tradesolution AS

Rapporteringshyppighet: Det skal leveres to årlige uttrekk med oppdatert informasjon av alle varer som ligger i EPD-databasen. De to uttrekkene skal leveres med status per 30.06 og 31.12 for det aktuelle året, og da innen to uker etter disse datoene.

Beskrivelse av data som oppgavegiverne skal rapportere:

SSB har behov for relevant produktinformasjon om alle varene i Tradesolutions EPD-database. Det gjelder bl.a. GTIN-nummer til alle varer i basen som gjør det mulig å knytte de til solgte varer fra dagligvarekjedene, samt utførlig deklarasjon av vare- og næringsinnhold av alle varer i basen for å kunne gi et så komplett bilde som mulig av nettopp mengde næringsinnhold i befolkningens kosthold. Teknisk løsning for overføringer spesifiseres nærmere i dialog med Tradesolution.

1. Forankring i det nasjonale statistikkprogrammet:

Formålet med å hente inn informasjon om varene i EPD-databasen er:

Å produsere offisiell statistikk i henhold til statistikkprogrammet. 

  1. Ny offisiell kostholdstatistikk, jf. kapittel 5.7, Helse og omsorg.  Statistikken er under utvikling på oppdrag fra Helsedirektoratet. Utviklingsarbeidet er forankret i intensjonsavtalen for et sunnere kosthold (helsedirektoratet.no), en avtale mellom helsemyndighetene og matbransjen (næringsorganisasjoner, mat- og drikkeprodusenter, dagligvarehandelen og serveringsbransjen).
  2. Statistikk over forbruk i norske husholdninger jf. kapittel 5.8, Inntekt og forbruk i nasjonalt statistikkprogram.

2. Begrunnelse for at opplysningene er nødvendige:

Ett av hovedmålene i SSBs strategi er at vi skal samle inn, bruke og dele data til beste for samfunnet. Vi skal bidra til kvalitet og kontinuitet i grunnlagsdata og utnytte veksten i nye datakilder, samt sørge for effektiv innhenting, bruk og deling av data. I Finansdepartementets tildelingsbrev for 2024 er det spesifisert at SSBs utviklingsarbeid skal inkludere og utnytte data fra nye og eksisterende datakilder for å kontinuerlig forbedre statistikk, analyse og forskning. For å få fullt utbytte av data over solgte varer fra dagligvarekjedene som SSB mottar og anvender i produksjon av offisiell statistikk, er det behov for en mer utførlig deklarasjon av vare- og næringsinnhold for varer. EPD-databasen fra Tradesolution AS er den beste tilgjengelige kilden til dette formålet. 

Når det gjelder anvendbarhet av innholdet i EPD-databasen til SSBs formål, viser en gjennomgang av allerede tilsendte data for test og utvikling at disse inneholder detaljerte vareopplysninger for rundt 40 prosent av alle solgte matvarer. For de mest solgte varene i dagligvaremarkedet er dekningen i EPD-databasen betydelig høyere.

I SSBs statistikkarbeid har informasjonen i EPD-databasen både en direkte og indirekte bruk.  Den direkte bruken handler om å utnytte den faktiske informasjonen som EPD-databasen inneholder per vare. Når det gjelder den indirekte bruken, vil informasjonen tilføre stor merverdi som input i avansert maskinlæringsteknologi. Slik teknologi vil ved hjelp av algoritmer basert på informasjon fra EPD-databasen kunne predikere verdier for både mengde, varetype og næringsinnhold, for varer som ikke inngår i EPD-databasen, men som selges i det norske dagligvaremarkedet.

SSB har gjennomført omfattende analyser av tidligere utleverte data fra EPD-databasen, og vurdert hvordan disse dataene kan benyttes i kombinasjon med andre datakilder, både med sikte på å produsere ny statistikk og for å effektivisere eksisterende statistikk. Konklusjonene er entydige på at data fra EPD-databasen tilfører en unik merverdi for å øke både kvalitet og effektivitet i SSBs produksjon av offisiell statistikk. Det finnes heller ingen alternative datakilder i dag som på samme måte gir samme informasjonsverdi som data fra EPD-databasen.

Kostholdstatistikk

Helsedirektoratet bruker statistikk om utvikling i norsk kosthold i forvaltningen av sitt myndighetsområde, og da med Forbruksundersøkelsen som kilde. SSB skal, på oppdrag fra Helsedirektoratet, utvikle og publisere ny offisiell statistikk over kostholdet i den norske befolkningen basert på nye datakilder. Kostholdstatistikken skal ved etablering inneholde en sammenstilling av data over solgte matvarer og data om næringsinnhold i matvarene (bl.a. ved hjelp av informasjon fra EPD-databasen). 

Formålet med statistikken er å måle status og utvikling i kostholdet i den norske befolkningen basert på solgte matvarer hos de største matvarekjedene. Tilgang til og sammenstilling av nevnte datakilder vil gi SSB mulighet til å utvikle ny og svært etterspurt statistikk over utvikling i norsk kosthold med langt høyere kvalitet og detaljeringsgrad enn tidligere, slik det blant annet er uttrykt i helsemyndigheters handlingsplaner og i en intensjonsavtale om et sunnere kosthold inngått mellom helsemyndighetene og matvarebransjen.  

Statistikken skal inkludere informasjon om mengde/volum og næringsinnhold for alle solgte matvarer. Som et ledd i dette har SSB behov for detaljert produktinformasjon for alle varer registrert i EPD-databasen. Her vil det særlig være behov for detaljert næringsdeklarasjon, samt annen relevant informasjon knyttet til næringsinnhold, ingredienser og mengde. Statistikkutviklingen er et oppdrag som utføres for sentrale helsemyndigheter og inngår i statistikkprogrammet. Det er særlig et ønske fra helsemyndighetene at en fremtidig offisiell statistikk bidrar til å ivareta kunnskapsbehov slik disse er uttrykt bl.a. i nevnte handlingsplaner og intensjonsavtale. 

Forbruksstatistikk

Data om forbruk i norske husholdninger ble samlet inn i 2022 etter et opphold på 10 år. Fra og med 2026 er undersøkelsen lovpålagt gjennom EU forordning.  Statistikken gir en detaljert beskrivelse av norske husholdningers forbruk av varer og tjenester. Statistikken gir tall for forbruk i kroner, som andel av det totale forbruket i en husholdning og for matvarer skal også forbrukte mengder i liter/kg per vare publiseres.

Statistikken genereres fra rapporterte kjøp fra respondentene gjennom bilder av blant annet dagligvarekvitteringer der varetekster/linjer skannes. Varetekstene er grunnlaget for maskinlæringsmodeller som predikerer vare og tjenestegruppe. Ved hjelp av mer detaljert produktinformasjon om dagligvarer fra Tradesolutions EPD-database vil vi kunne lage gode modeller for å også gruppere matvarene i henhold til gjeldende klassifikasjonskrav for dataene som er samlet inn i 2022.

Andre statistikker

Produktinformasjonen som EPD-dataene gir vil også være svært nyttig for flere andre statistikker som utnytter data over solgte varer fra dagligvarekjedene som del av datagrunnlaget, bl.a. Konsumprisindeksen og Kjøpekraftspariteter.

Datagrunnlaget som inngår i nevnte statistikkproduksjoner tilsvarer helt eller delvis det for kostholdstatistikken (og forbruksstatistikken), og merverdien av tilgang til informasjon fra EPD-databasen om de ulike varene vil langt på vei være den samme for disse statistikkene.

3. Vurdering av om SSB kan nå formålet ved å bruke informasjon fra offentlige myndigheter:

Denne informasjonen finnes per i dag verken hos SSB eller andre offentlige myndigheter.

4. Vurdering av belastning og omkostning for den opplysningspliktige:

Vedtak om leveranse av detaljert vareinformasjon fra Tradesolution AS inngår i SSBs strategi for å utvikle smidige tekniske løsninger for innsamling og bearbeiding av nye datakilder. Leveranseformen skal ha minst mulig teknisk kostnad for den rapporteringspliktige. Dette innebærer at SSB vil tilrettelegge for et mottaksapparat som er tilpasset oppgavegivers tekniske muligheter for leveranse av data.

I dialog med Tradesolution har SSB fått forståelse for at to årlige uttrekk med nødvendig informasjon om alle varer (ikke bare matvarer) i EPD-databasen, vil være løsningen med minst kostnader for Tradesolution.

5. Beskrivelse og begrunnelse for bruk og behandling av personopplysninger, dersom SSB ber om slike:

Varedeklarasjoner fra Tradesolution er en samling av åpen tilgjengelig informasjon som er påført emballasjen til den enkelte vare, og inneholder ikke personopplysninger.

6. Beskrivelse av opplysningenes sensitivitet:

Personvernperspektiv

Informasjon om varedeklarasjoner fra EPD-databasen er en samling av åpen tilgjengelig informasjon som er påført emballasjen til den enkelte vare, og inneholder ikke personidentifiserende informasjon.

Kommersielt perspektiv

Tradesolution har informert SSB om at EPD-databasen er et viktig kommersielt produkt. Tradesolution har investert og investerer løpende betydelige ressurser i innsamlingen av data til databasen, samt til drift, vedlikehold, og videreutvikling. Dataene i databasen har en særskilt kommersiell verdi og utleveres mot betaling til både offentlige myndigheter og private virksomheter.

7. Beskrivelse av særskilte informasjonssikkerhetstiltak, dersom det er behov for slike:

Informasjonssikkerhet i Statistisk sentralbyrå vil verne både dataeiers og den registrertes interesser, og omfatter bl.a. sikre systemer, rutiner og retningslinjer for behandling av opplysninger, streng tilgangsstyring etter tjenstlig behov og taushetsplikt for enhver som har eller har hatt stilling i eller oppdrag for SSB. Ut over dette er det ikke identifisert behov for særlige tiltak.

8. Begrunnelse for at opplysningene er nødvendige og relevante (dataminimering):

Informasjon om varedeklarering fra Tradesolution som mottas skal dekke behov både til å forbedre kvalitet og aktualitet på eksisterende statistikkprodukter og til utredning for utvikling av nye statistikkprodukter.

SSB skal i utgangspunktet ha all informasjon om alle varer i EPD-databasen, for så å sammenstille denne informasjonen med informasjon om solgte varer som er innhentet fra dagligvarekjedene. Informasjonen fra EPD-databasen dekker en stor andel av alle matvarer som omsettes, og utgjør et viktig grunnlag for å estimere næringsinnhold også for resterende matvarer. SSB vil i dialog med Tradesolution avklare hvilke variabler som er nødvendige for å kunne produsere ønsket statistikk.

9. Forhold ved opplysningene som innebærer begrensninger i sekundærbruk, dersom slike finnes:

Tradesolution har påpekt at dataene i EPD-databasens har en særskilt kommersiell verdi, og at denne verdien potensielt kan forringes dersom SSB gjør dataene tilgjengelige for andre i medhold av statistikkloven § 14.

SSB anerkjenner Tradesolutions innvending, og datasettet fra Tradesolution vil ikke være gjenstand for deling med eksterne brukere i medhold av statistikkloven § 14.

10. Vurdering av bruk av algoritmer osv. dersom saken gjelder beslutning om innrapportering av nye, ustrukturerte datakilder:

Vareinformasjon fra Tradesolutions EPD-database er en strukturert datakilde. Den er ikke å betrakte som «stordata». SSB har allerede mottatt test-data fra Tradesolution, og disse dataene har blant annet vært brukt for å utvikle nye metoder for maskinlæring som kostholdstatistikken og forbruksstatistikken vil ta i bruk. Algoritmene er i hovedsak algoritmer for imputering og for å predikere ulike typer statistiske klassifikasjoner.