En innføring i data

Publisert

#205

Hva er data og hvordan skaper det verdi?

Her forklarer vi hva data er, hvordan det relaterer seg til den digitale infrastrukturen og ulike muliggjørende teknologier og hvordan data skaper verdi. Dette er en del av rapporten "Er verdiskaping med data noe Norge kan leve av?".

Hva er data?

Med data mener vi enhver representasjon av opplysninger, viten, meninger og lignende. Dette skiller seg fra det man henter ut når dataene analyseres, informasjon. Data kan etter denne definisjonen være alt fra personlige data som alder og kjønn, til data samlet inn om produksjonsprosessen ved en fabrikk.

I denne artikkelen fokuserer vi på data som representeres digitalt. Det er også viktig å ikke forveksle data med teknologiene som gjør det mulig å skape verdi av data. Vi fokuserer altså på selve råvaren data, og ikke på analyseverktøyene, kunstig intelligens og den digitale infrastrukturen som gjør det mulig å realisere verdien av data.

Tre sentrale egenskaper ved data

  1. Data er et ikke-rivaliserende gode: Samme data kan brukes og gjenbrukes i flere ulike anvendelser, f.eks. i ulike algoritmer og programmer, uten at verdien forringes. Tvert imot blir som oftest verdien større jo mer dataene benyttes. Men det betyr samtidig at det kan være vanskelig å avklare rettigheter knyttet til bruken av dataene, som i sin tur kan føre til at dataene ikke benyttes.
  2. Data kan gi positive eksternaliteter: Verdien av data er ofte større for samfunnet enn for den som kontrollerer dataene. Åpen bruk av data kan føre til alternative anvendelser som kan gi betydelig større samfunnsnytte enn om dataen holdes lukket hos den opprinnelige eieren. Verdien av dataene for samfunnet kan forbli urealisert uten insentiver til å dele og sikre en bredere anvendelse. Dette omtales også gjerne som fellesgode-problematikk.
  3. Bruk av data har skalafordeler: Sammenslåing av to komplementære datasett kan gi mer innsikt enn å holde dem atskilt, og bearbeiding av store mengder data kan være mer effektivt enn å behandle hvert enkelt datasett for seg. Igjen betyr det at den mulige verdien av data kan forbli urealisert hvis ikke aktørene som kontrollerer dataene har insentiver som bidrar til at storskalafordelene utnyttes.

Sosiale og økonomiske aktiviteter foregår i stadig større grad på internett. Samtidig fører digital utvikling til at kostnaden ved å samle inn, lagre og prosessere data stadig reduseres. Resultatet er at det skapes et enormt datavolum i et stadig økende tempo. Samtidig er det kostnader knyttet til både innhenting, vasking, organisering og oppbevaring av data.

Hvor mye data som skapes i verden, har ingen fullt ut oversikt over. Men, hvert minutt genereres nå mer data enn vi hadde samlet i 2003. Den globale datasfæren, det vil si volumet av data som er opprettet, fanget og kopiert, forventes å vokse fra 33 zettabyte i 2018 til 175 zettabyte i 2025. Én zettabyte tilsvarer tusen milliarder gigabyte.

Volum av data opprettet, fanget og kopiert. Kilde IDC (2018).

En viktig bakenforliggende årsak til den raske veksten i aggregert datamengde er den generelle digitaliseringen i samfunnet. Dette kan for eksempel illustreres gjennom hvordan ulike persondata samles inn gjennom en dag. Bruk av sosiale medier og applikasjoner har ført til en eksplosiv vekst i personlige data. Personlig data innhentes i hovedsak på tre ulike måter:

  1. Data som blir frivillig gitt fra brukeren når man registrerer seg digitalt, f. eks i sosiale media.
  2. Observert data fra individer, f.eks.: stedsplassering når man bruker tjenesten eller søkehistorikk på nett.
  3. Dedusert data man får ved å analysere data fra punkt 1 og 2, som f.eks. kredittscore.

OECD beskriver utviklingen som en «datafisering» av økonomien. Det innebærer at data påvirker alle deler av økonomien og er en sentral driver for utvikling i både privat og offentlig sektor. Det er åpenbare og betydelige gevinster knyttet til datadreven innovasjon, men det er utfordrende å forstå det fulle potensialet som ligger i å forvalte data optimalt. Det kan føre til at betydelige muligheter går tapt.

Digital infrastruktur

En digital infrastruktur er ulike teknologier som gjør det mulig å nyttiggjøre seg av data. Det innebærer blant annet teknologier som kan brukes til å fange data, å knytte data sammen, å dele data og til å analysere data. Den digitale infrastrukturen er derfor et premiss for at data skal ha verdi.

Digital21 skiller mellom basisteknologier og systemteknologier. Basisteknologi beskrives som grunnleggende teknologier, som isolert sett ikke har noen direkte nytte. Dette omfatter for eksempel sensorer til å detektere tilstander og konvertere dette til data, datalagringskapasitet, evnen til å prosessere og dra nytte av data stadig raskere og ikke minst det som samlet kan betegnes som kunstig intelligens.

Systemteknologier omfatter løsninger på et høyere systemisk nivå, der basisteknologi sammen med andre teknologier og kunnskapsområder settes sammen og kan tas i bruk innen mange områder, næringer og sektorer. Eksempler på dette er roboter, droner og autonome systemer. I flere tilfeller vil det være et uskarpt skille mellom hva som defineres som basisteknologi og hva som defineres som systemteknologi.

Digital21 trekker frem bruksområder der basis- og systemteknologi vil være av særlig betydning for norsk verdiskaping. Næringssektorene som trekkes frem er eksempler og ikke en uttømmende liste. En viktig trend er en stadig økende konvergens, der bransjer smelter sammen, og at samhandlingen mellom enheter i ulike bransjer øker.

Noen sentrale muliggjørende teknologier, og hvordan de er relevante for dataenes verdi

1. Kunstig intelligens og maskinlæring:

Kunstig intelligens (AI) er et stort område med mange underfelt, men hvor maskinlæring har vært den viktigste driveren for verdiskaping. Maskinlæring er modeller hvor sammenhenger mellom input og output tilpasses data, og brukes til klassifisering av input eller prediksjon. Accenture og Frontier Economics sier i en rapport fra 2016 at AI alene kan øke lønnsomheten til firmaer som tar teknologien fullt i bruk, med i gjennomsnitt 38 prosent innen 2035.

2. Stordataanalyse:

Stordata er datasett som er så store at tradisjonelle analyseverktøy ikke kan analysere dem. Nye metoder må derfor tas i bruk for å kunne anvende dataene med sikte på å skape ny innsikt.

Stordataanalyse har oppstått som følge av behovet for å kunne bruke de enorme datamengdene som skapes. Teknologien brukes gjerne i forbindelse med maskinlæring, prediktiv analyse, bildegjenkjenning og andre avanserte analysemetoder for å trekke mening ut av data – ofte uten binding til bestemte datasett, men heller på tvers av datasett.
Ved å identifisere trender på tvers av mange ulike datasett skapes ny innsikt. Teknologien har en rekke bruksområder, f.eks. industri, bekjempelse av sykdom og kriminalitet, internasjonal handel og markedsføring.

3. IoT - tingenes internett:

IoT dreier seg om å plassere sensorer på «ting» - maskiner, installasjoner, i transportcontainere og emballasje – og så koble tingene til et nettverk som gjør det mulig å hente ut data fra sensorene. Data kan være posisjon, temperatur, bilder, hastighet og mye annet. IoT har blitt en viktig kilde til datafangst og forventes å vokse eksponentielt fremover. Driverne bak veksten er fallende kostnader i anskaffelse og drift, bedre nettverk for oppkobling og AI-revolusjonen som drastisk forbedrer mulighetene til å trekke verdi ut av dataene som genereres.

Hvor stor betydning teknologien har i ulike næringer vil variere med hvordan mulighetene oppfattes og utnyttes i ulike næringer og i ulike selskaper. For å bedømme ulike teknologiers betydning Norge som helhet, bør teknologien vurderes etter fire sentrale kriterier:

  1. For det første må teknologiens betydning for sentrale næringer i norsk økonomi vurderes.
  2. For det andre må det vurderes i hvilken grad teknologien har betydning for bredden av norsk næringsliv.
  3. For det tredje må det vurderes om Norge har den kompetansen som kreves til å nyttiggjøre seg av teknologien, gjennom sterke norske forsknings- og teknologimiljøer.
  4. Til slutt må teknologiens internasjonale markedspotensial vurderes.

Forventet utvikling i inntekter fra AI-programvare globalt fra 2018-2025. Kilde: Tractia (2018).

Hvordan skaper data verdi?

Det er først når man kan fatte bedre beslutninger, basert på data, at data skaper verdier.10 Det betyr at det ikke er tilstrekkelig å ha store, mange eller omfattende datasett. De må kobles, bearbeides, tilgjengeliggjøres og nyttiggjøres.

Illustrasjon av hva som kreves for at det kan skapes verdier av data.

Ved å bruke data for å danne grunnlag for beslutninger, kan man skape verdier gjennom forbedring og fornying av allerede eksisterende forretningsmodeller, og gi opphav til nye.

Verdiene som skapes, tilfaller flere parter. Dette er godt illustrert innen helsesektoren ved at bruk av helsedata gir økt produktivitet i helsevesenet, bedre helse for pasienter/innbyggere og utvikling av helsenæringen. Utredninger har vist at selskaper som benytter seg av datadrevet beslutningstaking kan ha 5 til 6 prosent høyere produktivitet enn øvrige aktører.

Data gir forbedring og fornying

Å bruke data til å realisere verdi gjennom å forbedre eksisterende drift vil ofte være det første steget i hvordan data skaper verdi. Det kan innebære å effektivisere organisasjonsmodellen, implementere mer strømlinjeformede kommunikasjonslinjer og heve kvaliteten på produkter og tjenester.

Det er identifisert seks ulike mekanismer som gjennom informasjon og innsikt fra innsamlet data, bidrar til å forbedre driften av organisasjoner og tilføre verdi til samfunnet. De seks mekanismene er:

  • Klientforståelse
  • Verdikjedestyring
  • Kvalitetsstyring
  • Risikostyring
  • Resultatstyring
  • Svindelforebygging

Tilgang på og utnyttelse av data kan påvirke organisasjoners evne til fornying. Med å fornye menes å ta i bruk nye metoder. Det kan være å utvikle en ny organisasjonsmodell, nye kommunikasjonskanaler eller nye produkter og tjenester. Mens forbedring gir mer eller mindre umiddelbare effekter i form av økt produktivitet, er fornying viktig for å holde virksomheten relevant og sikre mer langsiktig gevinstrealisering.

Videre er den digitale infrastrukturen med ulike muliggjørende teknologier avgjørende for å utnytte data effektivt. Samtidig er mulighetene til å digitalisere helt avhengig av data. Denne gjensidige avhengigheten danner grunnlag for en multiplikatoreffekt. Dersom man lykkes med å tilgjengeliggjøre data for FoU, kan dette igjen bidra til økt innovasjon av nye eller mer effektive teknologier, økt digitalisering og økt tilfang av data for ytterligere FoU.

Forbedring og fornying av næringslivet kan, isolert sett, ha positive effekter for norske arbeidsplasser. Et moderne næringsliv med høy produktivitet er viktig for å opprettholde norsk konkurransekraft internasjonalt. Utnyttelse av dataressurser er derfor viktig for å hindre nedleggelse av virksomheter eller at virksomhet flyttes ut av landet og dermed bevare arbeidsplasser. I tillegg kan forbedring og fornying skape behov for nye arbeidsplasser. Økt effektivitet og mer lønnsom drift frigir midler til å ansette flere. Samtidig kan forbedring og fornying gjøre arbeidsplasser overflødige når oppgaver effektiviseres.

Data gir nyskaping og nyetablering

Tilgang på data øker mulighetene for oppstart av ny virksomhet. Økt innsikt fra data vil, som vi har vært inne på tidligere, ofte ikke bare ha en nytteverdi innenfor sektoren hvor innsikten utvinnes, men også i flere tilfeller  på tvers av sektorer. Dette kan legge grunnlag for nyskaping på flere plan, både ved at det etableres nye selskaper og ved at enkeltselskaper eller hele sektorer transformeres.

Med transformasjon av et selskap mener vi at selskapets primærvirksomhet endres. Dette vil for eksempel kunne skje der data fra en produksjonsprosess har større verdi for et selskap enn selve produksjonen. Data kan skape verdi enten gjennom salg av data direkte, eller gjennom salg av analyse og rådgivningstjenester basert på datamaterialet.

Med transformasjon av en sektor sikter vi til bransjeglidning. Bransjeglidning er en av vår tids megatrender, og drives frem av økt digitalisering, og data har en ikke ubetydelig rolle som driver. Ofte vil data fra en sektor være vel så nyttig i en annen sektor. Dette åpner for nye og effektive samarbeid, eller at lite effektive selskaper utkonkurreres av selskaper med bedre løsninger fra en annen sektor.

Samfunnsøkonomiske effekter av forbedring, fornying og nyskaping

Når vi snakker om verdien av en vare eller tjeneste tenker vi vanligvis på omsetningsverdien om den skulle selges i et marked. For verdien av data er vi imidlertid nødt til å tenke annerledes. Verdien ligger ikke i dataene som sådan, men i hvordan de utnyttes som innsatsfaktor til nettopp forbedring, fornying og nyskaping. Verdien av data måles derfor gjennom hvilke gevinster virksomheter, og samfunnet, oppnår gjennom å utnytte data.

Samfunnsøkonomi som fag defineres gjerne som: «studien av allokeringen av knappe ressurser». De to viktigste begrepene i denne sammenheng er alternativkostnad og effektivitet. Alternativkostnad måler verdien en knapp ressurs kunne generert i alternativ bruk. Effektivitet er et relativt begrep, brukt til å sortere ulike ressursallokeringer hierarkisk. Effektivitet er først oppnådd når samlede alternativkostnader minimeres. Jo høyere alternativkostnadene er, jo mindre effektiv er allokeringen. Som innsatsfaktor i produksjon brukes data til å gi bedre informasjon og gi et bedre beslutningsgrunnlag for en mer effektiv allokering av øvrige ressurser.

Figuren under illustrerer sammenhengen mellom ressursbruk (venstre akse) og produksjon (høyre akse) slik den typisk fremstilles i samfunnsøkonomisk faglitteratur.

Imitasjon og innovasjon i en samfunnsøkonomisk kontekst.

Den heltrukne linjen (PMK) viser maksimal produksjon som er mulig å frembringe med ulike nivåer av ressursbruk. At PMK krummer oppover viser at man får mindre produksjon igjen for økt ressursinnsats dersom man allerede bruker mye. Ressursene kaster med andre ord stadig mindre av seg.

Ved å lære av og imitere beste praksis, vil man kunne oppnå økt samfunnsøkonomisk effektivitet. Effektiviteten øker når tilpasningen flyttes ut mot produksjonsmulighetskurven. Så lenge tilpasningen ligger innenfor PMK er det rom for å øke samfunnsøkonomisk overskudd gjennom imitasjon.

Fra dette kan vi slutte at etter hvert som data skaper verdi gjennom å bidra til en mer effektiv ressursallokering, gjennom forbedring, fornying og nyskaping, vil «dagens tjenestetilbud» bevege seg ut mot PMK. Etter hvert som produksjonen flyttes ut mot PMK, avtar muligheten til å tilføre verdi gjennom å utnytte data.

I tillegg til å illustrere effekten av imitasjon viser figuren effekten av innovasjon. Som det kommer frem av figuren vil slik innovasjon innebære at produksjonsmulighetskurven flytter ut. Det betyr at man med samme ressursbruk vil kunne produsere mer. Eventuelt kan man produsere det samme og bruke mindre ressurser. For å realisere én eller begge effekter må tilpasningen flyttes ut mot PMK.

Data og arbeidsplasser

Det pågår en stor debatt om hvordan fremtidige arbeidsplasser vil påvirkes av den raske teknologiske utviklingen (e.g. automatisering og robotisering). Denne vil til dels redusere behovet for den manuelle arbeidskraften som kreves for å produsere samme volum av varer og tjenester som tidligere.

På NHOs årskonferanse i 2018 ble det presentert tall og analyser knyttet til automatiseringspotensialet i norsk næringsliv som viste at mange hundre tusen arbeidsplasser vil bli berørt de neste tiårene. Innenfor enkelte bransjer vil mer enn halvparten av dagens arbeidsinnsats kunne bli overflødig. Ettersom dette ikke er en problemstilling som er knyttet til bruk av data som ressurs alene, går vi ikke inn på en dyp drøfting av dette . Vi nøyer oss her med å beskrive de tre måtene data kan skape arbeidsplasser på:

  1. For det første skaper data arbeidsplasser direkte gjennom jobber knyttet til databehandling. Det tydeligste eksemplet på dette er kanskje IKT-næringen, der data er en særlig viktig innsatsfaktor. 
  2. For det andre bidrar ressursen data indirekte til å skape nye arbeidsplasser og økt produksjon. Eksempel på dette er hvordan data brukes i oppdrettsnæringen til å oppnå økt biomasse, eller hvordan data i petroleumsnæringen bidrar til å oppdage oljefelt som ellers ikke ville blitt oppdaget.
  3. For det tredje kan data heve norsk konkurransekraft internasjonalt, dersom vi makter å ligge i forkant av utviklingen. Dette er viktig for å sikre at arbeidsplasser blir værende i Norge, fremfor at produksjon flyttes til land med et lavere kostnadsnivå. Dette er en utvikling som allerede har pågått i flere tiår i norsk næringsliv (med bruk av datastøttede verktøy helt siden 60-tallet), og bidratt til å sikre at norsk industri har kunnet opprettholde sin konkurransekraft tross verdens høyeste lønnsnivå. Data er slik sett allerede en helt grunnleggende faktor i «den norske modellen».
Hvem skaper data verdi for?

Det er ingen tvil om at data har stor verdi, og at verdien av data vil øke i fremtiden. Men verdiene som skapes for samfunnet er av ulik karakter. I tillegg til å skape verdi i det private næringsliv i form av økt lønnsomhet og flere arbeidsplasser, har data vel så stor verdi i andre deler av samfunnet. Et eksempel på dette er hvordan utnyttelse av helsedata, i tillegg til å skape verdi for helsenæringen, også bidrar til et forbedret og mer effektivt offentlig helsevesen og redusert sykdomsbyrde for innbyggerne. I samfunnsøkonomiske termer snakker vi gjerne om økt velferd for befolkningen (også kjent som «konsumentvelferd»).

Et annet eksempel er hvordan bruk av data kan brukes for å nå FNs bærekraftsmål. Bærekraftsmålene angir spesifikke, tidsavgrensede mål for fremgang og utvikling. Målene gjelder for, og forplikter, alle verdens land. Bedre utnyttelse av data vil også være helt nødvendig for å nå alle de tre aspektene ved de 17 bærekraftsmålene, både de miljømessige, sosiale og økonomiske. Bruk av data danner et faktagrunnlag og identifiserer de viktigste problemområdene, samt hvilke tiltak som vil kunne være hensiktsmessige for å adressere utfordringene. Effektene av dette er igjen økt velferd for befolkningen i form av reduserte klima- og miljøproblemer, som i tillegg også vil kunne ha positiv effekt på vår økonomi over tid.