You are on page 1of 77

DIGI110 er om “Hva er det teknologiske, juridiske, etiske og kulturelle aspekter ved bruk av

data?”

Literacy er et sett med ferdigheter som gjør at man kan forstå, skape, kommunisere, orientere
seg og delta I samfunn som er I endring. FN definerer literacy som menneskerettighet.

Lovgivere og myndigheter jobber på spreng for å holde tritt. Det vi har opplevd de siste årene
er et ville vesten – et heseblesende kappløp lik tidligere tiders gullrush og oljeeventyr, der
målet er å sikre kontroll og eierskap over vår tids mest ettertraktede ressurs.
Vi snakker selvfølgelig om data.
Data kan være enormt verdifullt.
Ikke bare er data nøkkelen til mer og bedre innsikt. Data er også en forutsetning for (og
samtidig et produkt av) alle digitale teknologier, dingser og tjenester – fra sosiale medier til
nettbutikker, treningsklokker, tingenes internett og kunstig intelligens. Data er like viktig for
disse som oksygen er for deg og meg.

Alt du gjør digitalt, og mye av det du gjør offline også, etterlater seg spor.
Data finnes i ulike former og formater. Det brukes, både på godt og vondt, til å koordinere,
organisere, kontrollere, autentisere og manipulere – enten vi snakker om subjekter
(mennesker, dyr), objekter (maskiner, systemer, selv naturfenomener som vassdrag) eller
andre prosesser i samfunnet.
Du må gi fra deg en rekke data for å kunne delta i samfunnet, med tilgang på arbeid,
velferdstjenester, utdanning og pass. Vi er avhengig av data for å opprettholde
samfunnskritisk infrastruktur og organisere alt fra at det finnes mat i dagligvareforretningene
til at kunnskapsarbeidere har en jobb å gå til.
For den saks skyld, uten data som seismiske data og reservoardata kunne vi ikke hentet ut den
gamle olja.

Data + digital teknologi = dynamitt

Data er verdens mest verdifulle ressurs (og du eier litt av den)

Det finnes både små data og store data. Begge deler kan gi både små og store innsikter – og
løse både små og store problemer. Data gir kort sagt fantastiske muligheter – og samtidig
noen store utfordringer, ikke minst med tanke på sikkerhet og personvern.

 Sosiale medier: Alt du klikker på, hva du taster inn, hvordan du navigerer, hva du
dveler ved – alt kan bli lagret og bli til informasjon om oss som kan brukes videre.
 Nettsider og apper: På samme måte som i sosiale medier kan alle dine interaksjoner i
apper og nettsider registreres, enten det er på en nettavis eller en digital
læringsplattform
 Smarthus: Ikke bare TV-er og høyttalere, men dørlåser, kaffetraktere, lyspærer,
varmeovner og stekeovner får WiFi-funksjoner og kan styres via en app. Bruken av
både enhetene og appen produserer data som samles inn og brukes av leverandøren
 Smarte byer: Stadig mer i bybildet utstyres med sensorer og kobles på nettet, slik at
det kan generere, sende og motta data. Det gjelder alt fra bilene våre og smarte
bompengestasjoner til belysning styrt av bevegelsessensorer og infrastruktur for vann
og avløp
 Industri: Industri og infrastruktur blir stadig mer digitalisert og automatisert, med
datainnsamling og optimalisering i alle ledd – fra logistikk til maskiner og utstyr
 Tjenester: Både offentlige (for eksempel NAV, Lånekassen) og private aktører (for
eksempel bank og forsikring) avhenger av data fra deg og tredjeparter (for eksempel
personopplysninger, kredittvurderinger, etc.) for å levere sine tjenester

Dataene skaper verdi på to måter. For det første gir de deg mer og bedre innsikt. For det
andre kan de brukes som grunnlag for praktiske applikasjoner.

Data kan på denne måten direkte eller indirekte ha verdi for alle aktører i samfunnet, fra
offentlige myndigheter til private bedrifter, hackere, aktivister og privatpersoner.

Data på godt og vondt


Hver eneste interaksjon vi har med digital teknologi produserer data. Enten du er bevisst det
eller ikke, er du en medskaper og en produsent, ikke bare en passiv bruker av denne nye
digitale virkeligheten.
Det aller meste av vår dataproduksjon er usynlig og ubevisst. Det er litt som når du kjører bil:
Du er bevisst på rattet og veien – men likegyldig til hvordan bensin og luft blandes i
forgasseren i motoren (eller hvordan en elmotor fungerer, for den saks skyld). Sånn er det
også med data.
Men data er også mye mer – og mye nærmere – enn bare dette store og uhåndgripelige som
store tech-selskaper holder på med, med loggfiler, servere og databaser. Også notatblokka du
bruker som treningsdagbok er full av data, som du fullt og helt har oversikt og kontroll over
selv.

Quantified self
Det er mange som med viten og vilje samler mest mulig data om seg selv og hverdagen sin.
Trenden kalles «quantified self». Målet er å få oversikt, innsikt og statistikk over alle deler av
tilværelsen sin.
Selv med tredjeparts digitale tjenester kan du være bevisst på datainnsamlingen du driver
med. Ved hjelp av treningsklokker, sensorer, apper, IoT-enheter og andre verktøy kan du
samle data om alt fra din egen søvnkvalitet til puls, blodtrykk, kaloriinntak, treningsmengde,
humør, gjøremål og vaner.
Dataene kan du bruke til potensielt å oppdage interessante og uventede mønstre og innsikter
om deg selv. I neste omgang vil du forhåpentlig kunne bruke dette til å ta bedre beslutninger,
og forbedre og optimalisere ditt eget liv. Ny teknologi som sensorer under huden og briller
med øye-sporing og ansiktsgjenkjenning vil kunne ta dette til neste nivå, og automatisk
loggføre alt du ser og gjør. Dette er helt reelt – og åpner for både spennende og skumle
muligheter.

Selv om du er bevisst på at du samler data, er det dataene på toppen av isfjellet du forholder


deg til. Under overflaten er det andre data – som det vi kaller analysedata, diagnostiske data
og funksjonsdata – som er data du ikke ser noe til, og som du sannsynligvis ikke er like
bevisst på.

Datafiseringen – altså det at alle deler av livene våre, jobbene våre og samfunnet
representeres i digitale data – er sånn sett en risikosport. Det kan knyttes til potensielt store
muligheter og gevinster, men også farer og negative sideeffekter. Derfor er det ikke bare for å
kunne utnytte mulighetene at det er viktig å lære om data. Det er også veldig smart å ha en
forståelse på hva som skjer med dine data, og evnen til kritisk tenking rundt dette.
Hva er data
Det finnes mange definisjoner av data, som passer i ulike sammenhenger. Ordet i seg selv er
opprinnelig flertall av det latinske datum, som betyr «det som er gitt». I dag bruker vi det som
oftest i betydningen «verdi», «opplysning» eller «råinformasjon» (i betydningen ikke-
bearbeidet).
For å lene oss på definisjonen i Store norske leksikon, er data kort sagt opplysninger eller
verdier som eksisterer i et eller annet bestemt format. De kan dermed lagres, overføres og
prosesseres etter bestemte regler – slik at det blir forståelig og brukbart for en mottaker. For å
kunne analyseres og anvendes, må dataene altså finnes i et dataformat som er lesbart og
forståelig for mennesker og/eller maskiner.
Data kan være analog eller digital. Hva som teknisk sett er forskjellen, vil du lære om i neste
kapittel. Den enkle forklaringen er likevel at digitale data er data som kan leses og brukes av
datamaskiner.

data er også mye mer enn bare tall og tabeller. Det finnes mange ikke-numeriske former for
data – som observasjoner, fotografier, bokstaver, symboler, bilder, lyd, elektromagnetiske
bølger og så videre.
Data er heller ikke alltid pent og pyntelig sortert som i det tenkte Excel-arket vårt. Her har vi
strukturerte data (dette gjelder ting som lister og tabeller, kirkebøker og handelsregistre), men
data kan også være ustrukturerte (for eksempel tekstdokumenter, bilder og musikk). Og de
kan finnes i en rekke ulike formater. Hva alt dette innebærer og hva slags dataformater som
finnes, vil du lære mer om senere.
Selv om du hører ord som «råinformasjon», er det viktig å understreke at data aldri egentlig
er «rå» eller «nøytral». Vi abstraherer virkeligheten med data: Vi bruker det til å lage
representative kategorier og målinger av verden rundt oss og oss selv. Hvordan denne
representasjonen blir seende ut er alltid påvirket av hvem som samler dataene, og av hvordan
de samles, analyseres og tas i bruk.

Data må dessuten settes i kontekst, og så tolkes og etterprøves, før det kan kalles informasjon
eller kunnskap.
Data er ikke helt det samme som informasjon eller kunnskap, selv om alle disse henger tett
sammen. Enkelt sagt er det først når dataene tolkes og settes i kontekst – altså tillegges en
mening eller betydning – at de blir informasjon. I neste omgang kan vi lene oss på data og
informasjon for å tilegne oss og utvikle kunnskap.
Du kan se på dette som tre nivåer:
Data -> Informasjon -> Kunnskap.

I dette eksempelet finnes det nok et fasitsvar. Mye av det vi ønsker å finne ut i den virkelige
verden er litt mer komplisert. Kunnskap er da resultatet av et vedvarende informasjonssøk,
tolkninger og argumentasjonsarbeid; den er alltid i bevegelse. Den kan lene seg på mange
ulike kilder til informasjon – som igjen kan komme frem fra mange forskjellige data.

Data som råvare


Data kan altså på den ene siden sees på som råinformasjon. På den andre siden kan det sees
på som en råvare som former de digitale produktene og tjenestene som omgir oss. De mates
inn i algoritmene som styrer de digitale tjenestene vi bruker hele tiden.

Algoritmer
Algoritmer er nøyaktige og entydige instrukser som forklarer en datamaskin hvordan den skal
løse en bestemt oppgave. Det følger samme logikk som en oppskrift. Algoritmer kan
programmeres eksplisitt av et programmerer, eller det kan for eksempel dreie seg om
maskinlæringsalgoritmer («modeller», som vi skal se på senere).

Algoritmen i seg selv følger bare et sett med instrukser; det er hvilke data den har å jobbe
med som gir et ulikt resultat.
Algoritmer er overalt, og de trenger data for at noe skal skje. Derfor er data en forutsetning
for alle digitale programmer og tjenester, og former hvordan disse fremstår og fungerer.

Hva er datafisering?
Å representere aktivitetene våre i form av data er så gammelt som sivilisasjonen selv. For å
bygge et samfunn må du for eksempel ha systemer for handel og oversikt over hvor mye korn
som finnes på lager.
Forskjellen nå er at alle deler av livene våre, jobbene våre og hele samfunnet gjøres til data –
helt ned til hvor mange skritt du rekker å gå før frokost.
Det engelske begrepet datafication (som kan oversettes som datafisering på norsk) beskriver
denne strukturelle oversettelsen av hverdagslige aktiviteter og interaksjoner til data. Veldig
ofte snakker vi da om tabulert informasjon – altså verdier i tabellform – på et eller annet nivå,
som gjør verdiene sorterbare og sammenlignbare. Vi skaper kort sagt representasjoner av
virkeligheten i et dataformat, som blir gjort tilgjengelig for analyseprosesser.
I neste omgang kan vi spore, overvåke og optimalisere hva enn det er snakk om. Og det kan i
praksis være hva som helst.
Gjennom mulighetene som digitale teknologier åpner for tas dette nå til et helt nytt nivå. Alt
vi gjør og alt som skjer kan blir til data, som i neste omgang kan blir til informasjon, innsikt
og verdi. Det kan lære oss nye ting om samfunnet og miljøet, og åpner for at vi kan se oss
selv og våre handlinger fra nye perspektiver.Men medaljen har også en bakside: det lar også
andre se ting om oss, som vi kanskje helst ikke ønsker å dele.

Digital transformasjon
Det er ikke bare hvordan vi ser film og tv som har endret seg, men hvordan vi lever, hvordan
vi jobber, hvordan vi lærer, hvordan vi har sosial kontakt og hvordan vi interagerer med
hverandre.
Det er dette som menes med en digital transformasjon. Det er ikke snakk om at vi gjør de
samme gamle tingene, bare digitalt. Som et resultat av data og digital teknologi gjør vi både
ting på helt nye måter – og vi gjør helt nye ting. Enda mer enn det handler om teknologi,
handler det om oss mennesker.
Digital teknologi er blitt en integrert del av livene våre, arbeidsplassene våre og samfunnet
– og alle disse er blitt forvandlet og transformert som en konsekvens av digitale data.

Digitisering og digitalisering
Ordet digitalisering brukes i dagligtalen i flere betydninger. Det en ofte mener med ordet er
det å konvertere data til digitalt format – som når du får overført gamle familievideoer fra
VHS-kassetter til digitale videofiler. Samtidig snakker en om digitalisering av næringslivet
og offentlig sektor, der det handler om hvordan digital teknologi endrer samfunnet,
arbeidsplassene og livene våre.
Det er nyttig å kunne skille mellom disse betydningene. Derfor bruker vi digitisering (altså
uten «al» i midten) om spesifikt det å konvertere analoge data til digitale data. Digitalisering
på sin side brukes for den bredere betydningen, nemlig å utnytte mulighetene i digital
teknologi for å fornye måten vi gjør ting på, effektivisere prosesser, og å skape nytt.
Digitsering er en forutsetning for både digitalisering og digital innovasjon – som igjen leder
til den digital transformasjonen.

Når data er digitale, kan de brukes og deles på andre og nye måter.

Ikke bare skapes nye digitale data hele tiden. Vi digitiserer også alle mulige analoge data slik
at disse også kan behandles av datamaskiner.
Samtidig som dette skjer, er teknologien kommet langt nok til at vi kan samle og utnytte disse
dataene fra alle mulige kilder i en helt annen skala enn tidligere. Lagringskapasiteten er nå
enorm gjennom nettskyen, og «alle» har tilgang på mye kraftigere og raskere prosessering og
regnekraft – som gjør at vi kan kombinere data og finne sammenhenger som aldri før.
I den ene enden kan du lage enkle visualiseringer av små datasett. I den andre enden kan du
oppdage fullstendig overraskende, ikke-åpenbare innsikter ved hjelp av kunstig intelligens.
Og selv denne typen avansert dataanalyse blir nå stadig mer tilgjengelig for allmennheten.

Data må representere noe, eller handle om noe, for å ha en verdi og kunne bli til informasjon
og kunnskap. Eksempelet viser at data trenger kontekst.
Det eksempelet også viser, er at dataene har et opphav. Tallene er ikke hentet ut av luften,
men har en forankring i en eller annen situasjon eller aktivitet. Det finnes noe forut for dem;
de oppstår ikke ut av det blå. Dette gjelder også for eksempel analoge data slik som en
lydbølge – det er noe som skaper lyden.

Dataene er altså uløselig knyttet opp mot de situasjonene de oppstod i eller angår, og det er
derfor viktig å kunne relatere data tilbake til situasjon (kontekst) – hvis ikke risikerer man
altså at dataene mister sin potensielle verdi. Slik kontekstuell informasjon både kan og bør
reflekteres gjennom metadata, som betyr «data om data».

For å forstå hvordan data fungerer, og hvordan det gir oss innsikt og lar oss gjøre nye ting,
må vi følge dataenes egen reise – der de blir samlet inn, lagret, behandlet og analysert – og
kanskje rapportert og visualisert – før de tas i bruk. Dette er dataenes livssyklus.
Denne syklusen er mye brukt i akademiske og forretningsperspektiv, og kan også være
aktuell for oss som privatpersoner når vi søker innsikt fra for eksempel treningsklokker og
andre IoT-støttede enheter (IoT står for Internet of Things – tingenes internett). I tillegg er
den også relevant for eksempel med tanke på personvern. Da handler det om hvem som eier
dataene, hvor lenge de beholder dem og hvilke formål de brukes til.

Livssyklusen del 1 – fra situasjon til lagring


Situasjon / aktivitet
Data har altså utgangspunkt i en eller annen situasjon eller aktivitet. Dette kan i prinsippet
være hva som helst. Det kan være noe du gjør, eller noe som skjer – alt fra at du tæpper kortet
for en kopp kaffe, til at en stjerne eksploderer i et gigantisk supernova i en annen galakse.
Datainnsamling
Når noen ble født i Indre Troms på 1700-tallet, og fødselsdatoen ble nedskrevet i en
kirkebok, er det et eksempel på datainnsamling.

Lagring
Lagring av data er essensielt for at dataene ikke skal gå tapt. En datamaskin forstår kun – og
kan bare lagre – digitale data. For eksempel med lydbølger, de må lagres som en lydfil.
Lydbølger kan også lagres analogt, for eksempel på tradisjonelle medier som LP-plate eller
lydkassett.
Når vi tar lydbølger som eksempel, er vi nå fremme ved å ha lagret det som brukbar data.
Lydfilen, LP-en eller kassetten kan spilles av og lyttes til; den trenger ikke for eksempel å
analyseres eller visualiseres for å ha verdi.
I andre tilfeller må vi gå noen flere skritt for å gjøre dataene virkelig verdifulle, enten vi vil
bruke dem i en statistisk analyse, mate dem inn i et program eller visualisere dem for å få
støtte til å ta en beslutning.
Livssyklusen del 2 – fra lagring til handling
Behandling / prosessering

Det er altså ikke alltid slik at idet data er lagret så er de brukbare. Hvis du skal innrede en
snekkerbod, er det ikke nok å slenge inn alle verktøyene og materialene tilfeldig utover
gulvet. Det må også ryddes og sorteres. Du vil sette opp reoler med små bokser til ulike typer
skruer, henge verktøyene perfekt oppstilt på veggen, og så videre.
Slik er det også med data du ønsker å gjøre noe mer med: Du må dobbeltsjekke dataenes
opphav og pålitelighet og hvor godt de stemmer overens med det de skal representere. Du vil
gjerne sørge for at de har riktig format og verdier slik at de er sammenlignbare. Du vil fjerne
duplikater. Og du vil sørge for at det er riktige og tilstrekkelig metadata (data om dataene,
som for eksempel gjør dem identifiserbare og søkbare, og setter dem i riktig kontekst). Og så
videre. Kort sagt må dataene ryddes opp i og rengjøres, slik at det er klart og oppstilt du er
klar til å starte å snekre.

Metadata
Metadata er tilleggsdata som gir informasjon om tolkning av data. For eksempel når du tar et
bilde med mobilen, vil galleri-appen din la deg velge å se mer informasjon: Hvor og når
bildet er tatt, hvilke innstillinger som er brukt, antall piksler, filtype, filstørrelse og plassering
på enheten. Alt dette er metadata. Metadata er i seg selv data.
Analyse
Hvorvidt og hvordan data skal analyseres handler om hva du prøver å oppnå. Du snekrer
neppe for moro skyld, men for å lage en TV-benk, en garderobe eller en tresleiv. Dette vil
også forme hva slags verktøy og materialer du trenger, og hvordan du går løs på oppgaven.
Motivasjonen for å analysere data vil ofte være å lete etter innsikt – som å se etter mønstre,
prøve å forutsi en fremtidig atferd eller å komme med en anbefaling. Her brukes teknikker
som statistikk, data mining (kort sagt teknikker for å identifisere mønstre) og maskinlæring
(det som på folkemunne menes med kunstig intelligens).

Rapportering og/eller visualisering


Etter analysen kan du eventuelt rapportere og/eller visualisere dataene. Hvis målet med
dataene er å hjelpe deg med å ta en beslutning, vil en rapport eller visualisering ofte være
svært nyttig.

Det skal sies, du kan visualisere data som ikke er analysert også. Lydbølger, for eksempel,
kan visualiseres uten å måtte gjennomgå en analyse som beskrevet over. Mens for andre typer
data vil dette gjerne innebære å fokusere på kun et utvalg av de relevante dataene, for
eksempel data fra et avgrenset tidsrom, eller å kun visualisere noen bestemte egenskaper.
I slike tilfeller må du ikke bare ta hensyn til hva som er teknisk mulig, men også hva som er
greit (etiske vurderinger rundt personvern) og hva som er lov (gjeldende lovgivning som
GDPR).
Tiltak, beslutning, handling
Siste steg i syklusen er at det hele leder til en form for beslutning eller anvendelse. Da tenker
vi gjerne på et tiltak, en beslutning eller en handling som utføres av mennesker. Men
«output» fra analysen kan også sette i gang en form for automatisk handling, slik som
automatiske varslinger («alerts»).

Dette siste steget i syklusen vil også være relevant for data som ikke har vært gjennom noen
analyse, rapportering og/eller visualisering, altså andre del av livssyklusen.

Uten at du ser det, har du også en digital skygge som følger deg hvor enn du går. Alt omkring
oss kan gjøres til data. De som vet hva de skal se etter, kan sette sammen alle sporene fra
mennesker og maskiner til et levende, komplekst, interaktivt speilbilde av virkeligheten.

Vi kan skille mellom data i tre kategorier: Innholdsdata, analysedata og funksjonsdata.


Innholdsdata
Innholdsdata er alt som finnes av åpenlyst innhold og kommunikasjon – det som tydelig er
synlig for oss. For eksempel innholdet i en e-post, tweet, video, lydfil eller grafikk, og andre
ting vi bevisst fôrer maskinen med. Det kan være videoen i et Zoom-møte eller bildet i en
Snap. Det kan for den saks skyld også være mappesystemer eller innhold vi laster opp i en
skytjeneste.
Dette er kort sagt dataene du er bevisst på at du skaper. Men under overflaten er det en sjø av
ulike andre data, som ikke er like synlige.
Analysedata og diagnostiske data
Når du ser på Netflix, overføres det åpenbart innholdsdata – selve serien eller filmen. Like
åpenbart er det at Netflix vet hva du ser på.
En del av dette er metadata. Noen av metadataene er synlige og deles med oss. For eksempel
når en sender e-post, står det kanskje «sendt fra min Huawei» eller «sendt fra iPhone» helt
nederst.

Selv om vi kaller dette analysedata, må vi påpeke at det selvsagt ikke utelukkende er ting som
loggfiler og metadata det er mulig å analysere. Innholdsdata kan for eksempel analyseres via
statistiske teknikker og maskinlæringsteknikker.

Funksjonsdata
Nederst i isfjellet finner vi funksjonsdata. Funksjonsdata er data som er nødvendig for at
maskiner kan kommunisere med hverandre, og for at applikasjoner og programvare fungerer.
Her snakker vi egentlig om data som utveksles via protokoller, for eksempel for å identifisere
en bruker på et nettsted. Protokoller – som du vil lære mer om i neste kapittel – er
rammeverket som gjør det mulig at utveksling av informasjon kan finne sted.
Dette er i utgangspunktet ren maskinkommunikasjon. Det vil likevel ikke si at dette ikke kan
være interessant for mennesker, eller brukes i andre sammenhenger. For eksempel kan politi
og sikkerhetsmyndigheter være interessert i funksjonsdata fra en mobiltelefon som
kommuniserer med nettverket om hvor den befinner seg, hvilket nettverk den er logget inn i,
og så videre.
De ulike nivåene av data i isfjellmodellen kan du kjenne igjen når du blir bedt om å akseptere
informasjonskapsler (cookies) på en nettside. Hvis du velger «Kun nødvendige cookies», får
ikke nettstedet samle analytiske og diagnostiske data om deg. Men du kan ikke avvise
funksjonsdata, for da ville nettsiden rett og slett sluttet å fungere.

Hva betyr dette for deg og meg?


Vi begynte emnet med å si at vi er produsenter og brukere av data.

Det er i vår interesse å dele en del data; det muliggjør fremskritt og det er noe samfunnet som
helhet tjener på.
Men det er også problemer og utfordringer med at disse tingene foregår i det skjulte. Sett fra
et personvernperspektiv er det problematisk at en ikke vet hvilke data man sprer; det deles
anonyme data som du ikke blir fortalt at finnes, eller hvem som bearbeider det. Selv om data
om oss anonymiseres, kan vi likevel ofte identifiseres under gitte betingelser.

Når du ikke vet hvem som har tilgang på dataene dine, blir du sårbar på en ny måte. Vi
beskyttes til en viss grad av lover og regler, men utviklingen skjer så raskt at selv eksperter
har vanskelig for å se hva som er mulig å gjøre med dataene vi legger igjen. Du kan gjøre
visse ting for å gjemme deg – som å bruke VPN, eller slå av lokasjonsdata på mobilen – men
å være helt inkognito er praktisk talt umulig med mindre du vil bo i skogen og leve av jakt og
fiske.
Så lenge du lever som normalt og deltar i samfunnet, vil du etterlate en digital skygge.

Digital tvillinger
Digitale tvillinger er et konsept som foreløpig er mest utbredt i industrien. Det er en metafor
for en digital representasjon av et system eller en prosess som finnes i virkeligheten – der den
virkelige tingen og den digitale kopien ofte er koblet sammen og utveksler data. Den digitale
tvillingen kan da i neste omgang brukes til å simulere ulike scenarier, overvåke funksjoner og
tilstand, eller prøve ut nye ting.
Digitale tvillinger kan lages av hva som helst, enten materielt eller immaterielt, et objekt eller
et subjekt – fra en heisekran til en bankkunde eller økosystemet i Amazonas

For at dette ikke skal skje er vi til en viss grad beskyttet av lover som GDPR, som sier at alle
har en rett til å ikke være gjenstand for en avgjørelse som utelukkende er basert på
automatisert behandling. Her er det likevel mange gråsoner.

Her har grensene vært mer uklare. Det er imidlertid i ferd med å endre seg. De som bruker
data på bekostning av folks sikkerhet og personvern møter nå økende press både ovenfra og
nedenfra, fra lovgivere og enkeltpersoner.
Det var blant annet reglene på dette området som ble oppdatert og strammet inn i 2018, da
lovverket General Data Protection Regulation (GDPR) ble innført i EU og EØS. I Norge
kaller vi det personvernforordningen. Den ble tatt inn i personopplysningsloven og gjelder
som norsk lov fra juli 2018. Loven har gitt oss flere og sterkere rettigheter.
For å beskytte deg og interessene dine på nettet kan du praktisere disse rettighetene. Det er
også andre grep du kan ta for å være trygg på nettet og skjule dine digitale spor. I dette emnet
vil vi gå gjennom både hvilke rettigheter du har, og noen grunnleggende teknikker for digitalt
selvforsvar.
Hva er personvern?
Alle har rett til privatliv. Det står faktisk i grunnloven: Enhver har rett til respekt for sitt
privatliv og familieliv, sitt hjem og sin kommunikasjon. Det er kort og godt dette som menes
med personvern.
Det er altså en grunnleggende rettighet at våre private sfærer skal respekteres og vernes om.
Med private sfærer mener vi for eksempel:

 Psykisk (mobbing, baksnakking)


 Kroppslig (intimsoner, medisinske undersøkelser)
 Geografisk (kameraovervåkning, titte inn i et vindu)
 Kommunikasjon (innbrudd i e-postboksen)

I tillegg omfatter dette vern av våre personopplysninger. Det vil si enhver opplysning om en
identifisert eller identifiserbar fysisk person.
Hva som regnes som en personopplysning er veldig bredt: Det gjelder alle data som kan
identifisere deg direkte eller på en annen måte knyttes til deg som enkeltperson – alt fra
navnet ditt og posisjonen din, til ganglaget ditt eller hvordan og hvor fort du skriver på et
tastatur. Alt dette er beskyttet under GDPR.
Personvernet har direkte betydning for et demokratisk samfunn. Uten det kan vi rett og slett
ikke ha et demokrati – fordi vi blir manipulerbare hvis vi ikke har en fundamental form for
privat sfære hvor vi kan ha frie tanker, utvikle egne meninger og informere oss.
I den analoge verden har de rike store hus med store tomter, de har vektere og
kameraovervåking. Personvernet gjelder også i den analoge verden. I den digitale verden må
det forhandles på nytt.
Hvem skal eie dataene? Hvem skal eie infrastrukturen? Hvordan kan vi motarbeide sterke
sentraliseringstendenser der informasjon, data og makt er samlet i noen få hender? Dette er
politiske spørsmål, og det er også derfor EU har tatt lederskap på området.

Hvilke rettigheter har jeg?


Du etterlater deg altså massevis av digitale spor, som ulike aktører og virksomheter har
innsyn i. Mye av dette regnes som personopplysninger; det er knyttet til deg som en
identifisert eller identifiserbar person.
Misbruk av personopplysninger kan være krenkende og ubehagelig, og i verste fall føre til
ting som utpressing eller identitetstyveri. Men andre større og mindre overtramp er ikke bare
mulig, det er svært vanlig – for eksempel misbruk av samtykke, som egentlig skal være både
spesifikt, gitt gjennom en aktiv handling og oppfylle flere andre krav for å være gyldig.
Her trenger det ikke engang være onde hensikter som ligger bak. Det skjer for eksempel ofte
at de som ber om samtykke rett og slett ikke helt forstår hva et gyldig samtykke er.
Virksomheter som behandler personopplysninger – altså gjør noe som helst med dem: samler
dem inn, ser på dem, lagrer dem, sletter dem og så videre – har en rekke plikter, som nettopp
å forstå reglene for samtykke og å ha et rettslig grunnlag for behandlingen (se kapittel 3). De
kan ikke gjøre hva de vil.
Du som enkeltperson har på den annen side mange rettigheter.

Fakta:

GDPR gir deg rett til …

 Informasjon: Du skal bli informert om formål, behandlingsgrunnlag, hvem som


mottar dataene, eventuell automatisk behandling, overføring ut av EU/EØS, og så
videre
 Innsyn: Den registrerte (den det gjelder) kan be om svar på alt det ovennevnte, samt
be om innsyn i hvilke personopplysninger den behandlingsansvarlige har om dem
 Retting: Dersom opplysningene er uriktige eller ufullstendige eller den registrerte er
blitt forvekslet med en annen, kan en kreve at disse rettes
 Sletting: Noen ganger, men ikke alltid, har du «rett til å bli glemt» og kan be om
sletting
 Begrensning: Hvis en for eksempel mener at opplysningene er uriktige, må dette
undersøkes av den behandlingsansvarlige og behandlingen begrenses eller stanses
 Dataportabilitet: Visse opplysninger kan du be om å få utlevert slik at de f.eks. kan
gjenbrukes eller overføres til en annen tjenesteleverandør
 Å protestere: Du kan alltid motsette deg direkte markedsføring, og gitt din særlige
situasjon kan du i visse tilfeller protestere også mot annen behandling (f.eks. ved
interesseavveiing)

Her skraper vi bare på overflaten. Hva disse tingene betyr – fra behandlingsgrunnlag til
interesseavveiing – vil du lære mer om i kapittel 3. Du kan også bruke Datatilsynets nettsider
for å gå i dybden på de enkelte punktene og finne ut hvilke spesifikke lover, regler og
rettigheter som er knyttet til hver av dem.
Så må det også understrekes at personvern ikke er en absolutt rettighet. Det må alltid
balanseres mot andre friheter, som for eksempel ytringsfrihet. Det må veies mot verdier som
liv og helse. Og vi må ta hensyn til andre rettigheter – som for eksempel retten til å drive
økonomisk og kommersiell aktivitet.
Det ville for eksempel vært absurd om ikke et forsikringsselskap kunne selge innboforsikring,
ettersom det krever kundens navn og adresse. Det finnes også andre grunner til at noen sin
interesse av å behandle personopplysninger veier tyngre enn den enkeltes personvern. Ingen
regler uten unntak – og skjønnsvurderinger.
Det er fortsatt både lovlig og fullt mulig å behandle personopplysninger, men det må skje
innenfor visse rammer, og på et definert grunnlag – der behandlingen er forholdsmessig
sammenlignet med formålet.
Følg disse prinsippene for å beskytte personvernet
Det kan være lett å føle seg maktesløs når det gjelder personvern. Det at det er en fare for at
du som privatperson kan re-identifiseres selv ut fra «anonymiserte» data er bare ett eksempel
på hvorfor.
Lover og regler som GDPR hjelper. Loven setter for eksempel krav til dataminimering, det
vil si at en ikke skal samle inn mer data enn det som er strengt nødvendig for formålet – og
dataene skal heller ikke brukes til noe annet enn dette formålet. Men som vi har sett, er det
vanskelig å lage lover og reguleringer som fullstendig holder tritt med utviklingen, og som
samtidig ikke blir så strenge at de hemmer innovasjon.
Derfor må hver av oss selv ta grep for å beskytte oss selv. Da kommer du langt med disse
prinsippene:

1. Vær bevisst
2. Velg alternative tjenester
3. Informer deg bredt og utvis kildekritikk

Det viktigste er at en har kunnskap og bevissthet om dette, og handler deretter. Enkle grep du
kan ta er for eksempel å installere utvidelser til nettleseren din som automatisk begrenser
sporing og sletter cookies, bruke en passord-manager som hjelper deg med å ha sterke, unike
passord for å sikre informasjonen din, eller å bruke VPN-tjenester for å gjøre deg mer usynlig
på nettet. For å ta bare noen få eksempler på hva du kan gjøre. Dette kommer vi tilbake til i
neste kapittel, når vi snakker om sikkerhet.
Videre kan du unngå å dele mer data enn nødvendig med de store plattformene gjennom å
velge alternative tjenester. Du kan for eksempel velge andre tjenester for e-post og meldinger
enn dem som er eid av Google eller Meta (Facebook). Velger du tjenester med såkalt ende-
til-ende-kryptering vil selve innholdet dessuten ikke være synlig for andre enn deg selv og
mottakeren.
Tilsvarende kan du velge alternative tjenester – gjerne såkalt open-source – for nettlesere,
søkemotorer og så videre. En tommelfingerregel er at hvis du betaler for tjenesten, er det
mindre sannsynlig at det er du som er produktet.
Til slutt er det viktig å kjenne forskjellen på menneskelig og algoritmisk kuratert informasjon.
Vi informerer oss i økende grad gjennom digitale flater. Det er ikke bare sosiale medier som
kuraterer innholdet for hver bruker ved hjelp av algoritmer. Når du søker på noe, kan du få
servert andre resultater enn noen andre basert på dine tidligere søk. Dermed får du potensielt
et helt annet bilde av verden enn naboen din.
Vi har ikke innsyn i premissene som ligger til grunn for algoritmene når de velger ut hvilke
søkeresultater vi ser i Google, hva vi får anbefalt å se eller høre på YouTube eller Spotify
eller hvilket innhold vi ser på Instagram og TikTok – annet enn at det er det innholdet
algoritmen mener vil fenge oss mest. Disse digitale profilene brukes i neste omgang til å
selge skreddersydd reklame.
Derfor er det viktig å informere seg bredt, oppsøke alternative kilder, og ta grep som å bruke
personvern-rettede søkemotorer og nettlesere for å finne mest mulig nøytralt innhold.

Data og personvern fra et etisk perspektiv


Husker du appen Smittestopp, som norske myndigheter tilbød fra april 2020 for å hindre
spredning av koronaviruset, og som Datatilsynet stoppet i juni 2020? Datatilsynet mente at
personvernet ikke var godt nok ivaretatt i appen, og at innsamlingen og behandlingen av data
ikke var godt nok begrunnet. Historien om Smittestopp minner oss om noe vi ofte ser med
nye digitale løsninger: Selv de beste kan ta feil.
Smittestopp fikk tilsyn av Datatilsynet, som er tilsynsmyndighet for GDPR i Norge. Appen
kunne og skulle imidlertid vært mer grundig vurdert av utvikleren selv, og dermed kunne
personvernproblematikken (brudd på prinsippet om dataminimering – se kapittel 3) ha vært
adressert og løst, før det ble en sak.
Det kan være juridiske eller sikkerhetsmessige problemer med nye digitale løsninger som
selv de beste kan overse. Det kan også være situasjoner der utviklere enten ikke har satt seg
godt nok inn i regelverket – eller de vet at de er i en gråsone eller går over streken, men håper
å slippe unna med det. I alle tilfeller er det de færreste løsninger som er blitt spesifikt
gransket og vurdert av en tredjepart som Datatilsynet.
Med andre ord, det at vi har lover som GDPR gjør ikke automatisk at alle tjenester er trygge å
bruke. Det vil til enhver tid være et gap mellom antallet apper og programmer som du kan
velge, og antallet som er juridisk vurdert og kontrollert av en uavhengig tredjepart. Dessuten
vil det alltid oppstå nye typer situasjoner og problemstillinger som ikke loven har tatt høyde
for. Lovene våre utvikles i en demokratisk prosess, og demokrati tar tid.
Noe vi imidlertid kan gjøre for å minske risikoen ved å ta i bruk ny teknologi er å vurdere
etikken. Etikk handler kort sagt om å vurdere hva som er godt og riktig. Vi kaller det digital
etikk når vi reflekterer over etikk knyttet til ny teknologi, eller når handlingen utføres med
digital teknologi.
Hva er digital etikk?
I etikken reflekterer vi over hvordan mennesker bør handle for å handle moralsk. Å handle
moralsk er å bidra til å gi andre og en selv gode liv, og å velge det som er godt.
Globalt sett er det ulike forestillinger om hva det vil si å handle godt og riktig. I Norge – og
mange andre steder i verden – regnes menneskeverd og likeverd som to viktige grunnverdier,
og en handling blir god hvis den fremmer menneskeverd og likeverd.
Det er ikke bare etikken som bygger på disse grunnverdiene, det gjør også lovgiving. For
eksempel konkretiserer menneskerettigheter og lover om likestilling hva menneskeverd og
likeverd vil si. Også personvernforordningen bygger på disse verdiene. Tanken er at hvis alle
mennesker er like mye verdt, har de også lik rett til å delta i samfunnet, og de skal ha rett til å
dele det de vil dele, og holde tilbake det de vil holde tilbake. Da trenger de rett til privatliv,
og altså personvern.
Samtidig er digital etikk mer enn nettvett. Data samles inn, analyseres og brukes på måter det
er vanskelig for vanlige folk å forstå, og derfor er en viktig del av den digitale etikken å
avdekke hvordan dette foregår. Det er først når vi forstår mer om data og hvordan de kan
brukes at vi kan vurdere om bruken er etisk forsvarlig.
Hva slags samfunn vil vi ha? Mens personvern handler om hva som er lov, handler digital
etikk om hva som er ønskelig og bra for den enkelte og for samfunnet både på kort og lang
sikt.
Hva er etisk forsvarlig innsamling og bruk av data?
Ofte må vi veie ulike hensyn mot hverandre når vi skal gjøre noe, og slik er det også i den
digitale etikken. For eksempel i tilfellet med den første versjonen av appen Smittestopp (det
har senere kommet en ny app med samme navn), valgte myndighetene hensynet til samfunnet
fremfor individet. De fikk laget en løsning som delte data til forskning og til å analysere
sykdom i befolkningen, til tross for at dette ikke godt nok ivaretok personvernet for den
enkelte.
Graden av innsyn og overvåking ble vurdert av Datatilsynet som uforholdsmessig
inngripende i forhold til hva som ville vært nødvendig for å oppfylle appens grunnleggende
funksjon.
Det er mange andre eksempler på hvordan digitale løsninger tvinger oss til å velge mellom
ulike verdier. Et aktuelt eksempel er diskusjonen om hvor mye overvåking vi skal tillate på
nett for å hindre kriminalitet eller overgrep mot barn.
Etisk refleksjon gir ikke ett svar med to streker under, men fører frem til velbegrunnede
avgjørelser. Slik er det også i den digitale etikken.
Sett fra perspektivet til den som skal dele eller samle data vil en være nødt til å vurdere ulike
hensyn mot hverandre. Da vil de trenge å vite litt om hvordan du går frem for å vurdere et
spørsmål etisk, og å dokumentere avveiingene slik at du senere kan forklare hvordan du eller
dere har tenkt.
Det er ikke slik at det er gitt hva som er etisk forsvarlig innsamling og bruk av data. Det kan
være mange ulike hensyn som spiller inn og som må veies mot hverandre. Å vurdere dem er
vanskelig, men viktig. Å ikke gjøre det kan få alvorlige konsekvenser både for
enkeltmennesket og samfunnet.
Bare tenk på Cambridge Analytica-skandalen, der Facebook tillot en ekstern aktør å laste ned
data fra Facebooks brukere uten samtykke. Dataene ble brukt til å manipulere velgere i
demokratiske valg over hele verden, og kan ha bidratt sterkt til seirene for både Trump og
Brexit-bevegelsen.

Hvilke muligheter og utfordringer gir data?


Snakker du om data i dagligtalen, mener du sannsynligvis computer. Ikke opplysning.

En som er datakyndig er en racer på en PC. En med datakompetanse blir kjapt satt i rollen
som IT-support for venner og familie. Vedkommende er flink med datamaskiner.
Å være flink med data i vår betydning (altså verdier i et bestemt format, opplysninger i et
datasystem, tabulert informasjon – du skjønner hvor vi vil), det er noe litt annet.
For å komme et nivå videre må vi evne å jobbe med data for å skape verdi og hente ut
innsikter. Da må vi aller først forstå oss litt på ting som «data literacy» og «data science».
Disse begrepene er litt vriene å oversette til norsk, av de grunnene vi nettopp har forklart.
Data literacy kan kanskje oversettes som dataforståelse, men det er lett å forveksle med
data(maskin)kompetanse. Og som du nå forstår: Data science og computer science er to ulike
ting.
Hva «data literacy» og «data science» er for noe, og hvorfor det er viktig, vil du lære om i
denne seksjonen. Da kan vi i neste omgang se på hva slags utfordringer vi kan løse når vi har
den rette kunnskapen og ferdighetene som «data literacy» og «data science» innebærer – og
på den annen side, hvilke utfordringer bruken av data også skaper, for oss selv, miljøet og
samfunnet.
Men la oss i første omgang se litt nærmere på akkurat hvem som bruker data:

Hvem bruker data i dag – og hvordan


Politikere, politiet, offentlige myndigheter og nasjonale sikkerhetsmyndigheter. Forsvaret,
forskere og finansfolk. Sportsklubber, TV-kanaler, produksjons- og industriforetak. For alle
disse og mange andre er data allerede essensielt. Og i det som i en økende grad er et datafisert
informasjonssamfunn, kommer de fleste til å jobbe med data og bruke data på et eller annet
nivå.
Kjernekompetanse i databruk trengs kanskje aller mest blant dem som jobber i tilknytning til
samfunnskritisk infrastruktur. Men det er på ingen måte begrenset til det. Aktivister,
markedsførere, selv bønder jobber stadig mer datadrevet – smart landbruk er allerede i
høyeste grad en ting.
Du har kanskje selv vært borti et regneark, fakturaprogram eller et kassaapparat? Det er alle
eksempler på enkle systemer som på ulike håndterer og strukturerer data. Stadig utvikles det
også programvarer som gjør det enklere for lekfolk og folk flest å forstå data, uten selv å ha
studert programmering, IT eller data science i flerfoldige år. Denne «demokratiseringen» av
data skal vi komme tilbake til i avsnittet om data literacy.
Uansett: Det er ingen tvil om at data bare vil bli viktigere og viktigere i folk flests liv og
arbeidshverdag. I en stortingsmelding fra 2021 står det at «Regjeringen vil at Norge skal
utnytte mulighetene som ligger i data til økt verdiskapning, flere nye arbeidsplasser i hele
landet og en effektiv offentlig sektor».
Konkrete tiltak fra regjeringens side er å inngå internasjonale samarbeid på tvers av Norden
og EU og kompetansehevinger i utdanningsinstitusjoner og næringslivet. Men en av de
største satsningene er å styrke tilgangen til offentlige data. For å forstå hvorfor offentlige data
er så viktig, bør du vite litt om hva det er:
Offentlige data – bedre tjenester
Offentlig sektor innhenter, produserer og lagrer enorme mengder data. Data om hvor vi bor
og hva vi jobber med – men også om vær, geografi, og informasjon om trafikk og samferdsel.
Offentlige data er en gullgruve av ressurser som gründerbedrifter, etablert næringsliv og
offentlige virksomheter bruker til å skape innovasjon og mer effektive tjenester hver eneste
dag. I Norge er nemlig hovedregelen at slike offentlige data skal være gratis og tilgjengelig
for alle.
Det har blitt estimert at offentlige data i EU er verdt 75 milliarder euro. I tillegg kommer
indirekte effekter på rundt 200 millioner euro. Det sier litt om mulighetsrommet som ligger i
åpne data!
Kartdata og trafikkdata kan brukes til å effektivisere leveringsruter. Statistikk fra SSB kan si
noe om befolkningsvekst i en kommune – og hvorvidt en frisørkjede bør opprette en ny filial
der eller ikke. Når banker vurderer lånesøknader, kan de automatisk hente ut og sammenstille
økonomisk informasjon som inntekt, formue og gjeld fra skatteetaten.
I Trondheim har et helseteknologiselskap funnet ut de kan bruke blant annet værdata for å
predikere når ansatte blir syke. Dataene blir brukt for å oppbemanne på dager der det er
ventet mye sykefravær. Dette, bare for å ta ett konkret eksempel.
Offentlige data skal vi se nærmere på i kapittel 3.
Data science
Nå har vi sett litt på hvem som bruker data, og det viser seg å være ganske mange! Det finnes
derimot også et helt spesifikt fagområde om data. Det heter data science, og en ekspert på
data science kalles for en data scientist.
Som vi har nevnt tidligere i kapittelet uttrykket data science forvirrende for mange. Siden
uttrykket dukket opp en gang på 80-tallet har tittelen data scientist i mange tilfeller blitt brukt
som et alternativt navn for statistikere og informatikere.
I den digitale tidsalderen, hvor data nå anses som vår fremste ressurs, favner derimot
uttrykket bredere. Data science kombinerer statistikk, programmering, dataanalyse,
algoritmer og forretningsinnsikt i et tverrdisiplinært fagområde.
I bunn og grunn kan data science forklares som kunsten å bruke alle (vitenskapelige)
metoder, prosesser og verktøy man har i verktøykassa for å strukturere, analysere og
tilgjengeliggjøre data. Akkurat på samme måte som naturvitenskap handler om å forstå
naturen og naturlige fenomener ved hjelp av biologi, kjemi, fysikk, geologi og så videre.
En data scientist er dermed en ekspert på å strukturere data og hente ut datadrevet innsikt.
Om du setter deg ned med en data scientist en hel arbeidsdag, vil du sannsynligvis se en
person som først og fremst jobber med koding og programmering med den hensikt å tolke,
hente ut, analysere og sette data i system for en virksomhet.
Selvsagt kan en bruke data science-ferdigheter både til private, politiske, frivillige og andre
aktiviteter. Det finnes mange eksempler på at data brukes til å for eksempel optimalisere
trening og kosthold. Om du har et Fantasy Premier League-lag på kontoret, kan du faktisk
bruke data science for å bygge et lag, og ta innersvingen på kollegaene dine.
Men når vi snakker om data science mener vi typisk hvordan det brukes i offentlige og
kommersielle sammenhenger.
I de fleste bransjer har man data om salg, innkjøp, lager, finans, kunder, ordre, transport,
vedlikeholdsinformasjon, utstyrsdata og data fra leverandører, for å nevne noe.
Industribedrifter har i tillegg driftsdata, som kommer fra industrielt utstyr, maskiner,
prosesser og systemer under drift.
For å hente innsikter og skape verdi ut av disse dataene, er det flere ting som må skje.
For det første må du vite hva som er målet og hvilke grunnleggende problemer du skal bidra
til å løse. Deretter må du hente inn og strukturere dataene. Å finne, samle inn, rydde opp i –
og organisere de relevante dataene kan være svært tidkrevende og omstendelig arbeid –
typisk rundt 80 prosent av jobben i et gitt prosjekt, målt i tid og innsats. Du vil lære mer om
alle disse tingene i kapittel 3-5.
Når du til slutt sitter med ferdig preparerte og brukbare data, starter selve moroa – nemlig å
lage maskinlæringsalgoritmer eller «modeller» som kan brukes for å finne mønstre i dataene
og for eksempel anvende dem til beslutningsstøtte. Hva har skjedd? Hvorfor skjedde det?
Hva kommer til å skje, når vil det skje og hvorfor? Hva bør vi gjøre med det som skjer? Alt
dette er ting modellene kan hjelpe til med å finne svar på.
For å få til alt dette, må en data scientist for det første forstå teknologien. For det andre kreves
det en god forståelse av bransjen bedriften jobber innenfor – det vi kaller domenekunnskap.
Kombinasjonen av teknologi- og domenekunnskap gjør det mulig å se hvordan man kan
bruke data til å ta bedre beslutninger og effektivisere bedriften.
I dag er data science en spesialisert disiplin – men i stadig større grad blir den nødvendige
kunnskapen og verktøyene gjort mer tilgjengelige for ikke-spesialister.
Store data og ledelse
Data science er en viktig kompetanse spesielt i møte med store og ofte ustrukturerte
datamengder, som ikke er lett å forholde seg til med tradisjonelle verktøy og metoder. Det vil
si såkalte stordata.
Erik Brynjolfsson og Andrew McAfee, begge anerkjente forskere innen data og økonomi, har
skissert flere ledelsesutfordringer for utnyttelse av store data:

 Selve ledelsen: Altså deres målsetninger for å utnytte data. De bør kunne stille de
rette spørsmålene knyttet til data, forstå utviklingen i markedet, innovere, og
overbevise. Ledelsen må gå i førersetet for å endre organisasjonene til å bli mer
datadrevne.
 Kompetanse: Man trenger nødvendig kompetanse i organisasjonene for å utnytte
store data. Det er viktig med fagpersoner innen data science. Som vi har sett jobber
disse med områder som statistikk, programmering, dataanalyse, algoritmer, og de har
også domenekunnskap.
 Teknologi: Utnyttelse av store data krever gode verktøy og teknologi for innsamling,
analyse, og bruk. Det å utnytte denne typen verktøy og teknologi krever
spesialkompetanse.
 Beslutninger: Data er et viktig fundament for beslutningstaking. Data og analyser må
nå de som faktisk skal ta datadrevne beslutninger.

Organisasjonskultur: Fokus må være å basere beslutninger på faktiske data (fakta) heller


enn andre tidligere brukte parametre.
Nå vet du mer om hvem som bruker data. I neste seksjon skal vi ta et lite dypdykk ned i
hvilke utfordringer data kan hjelpe oss med å løse. Men også se litt på hvilke utfordringer
data er med på å skape:

Utfordringer vi kan løse med data


Hvordan kan vi løse klimakrisen, knekke kreftkoden, få ned kriminalitet, kvitte oss med
trafikkorker, spise sunnere, bli lykkeligere, smartere og bedre trent – ved hjelp av ett og
samme hjelpemiddel? Svaret er data!
Vel, det er nesten korrekt. Sannheten er at data benyttes som et hjelpemiddel i møte med de
aller fleste store og små problemer vi møter i verden. Å ikke benytte seg av data når du skal
forsøke å løse et problem, er litt som å spille golf uten golfkølle. Det er tungvint, det tar
lengre tid og resultatet blir sannsynligvis ikke helt optimalt.
Det er derfor sensorer måler karbonutslipp og maskinlæringssystemer identifiserer kreftceller.
Det er derfor prediktive modeller forutser kriminelle bevegelser. Og det er derfor så mange
bruker apper for å registrere, måle og forbedre kosthold og trening.
Det betyr ikke at data løser alle disse utfordringene ene og alene. Men sannsynligvis ville vi
ikke ha løst problemene på gode nok måter uten.
Samfunnet er blitt mer og mer komplekst med tiden. Fra et sosiologisk perspektiv kan vi
kanskje si at digitaliseringen er en måte å håndtere denne kompleksiteten på: Vi trenger
digital teknologi rett og slett for å finne oss til rette i en så kompleks verden som vi befinner
oss i. For eksempel har det vært en stor vekst innen teknologi som er i stand til å samle inn og
prosessere store mengder data.

Fakta:

Stordata
Det genereres og samles stadig inn nye data om oss alle. I alle mulige sammenhenger.
Drivere for økte datamengder inkluderer blant annet internett, tingenes internett (Internet of
Things, IoT), nettskyen og sosiale medier.
Stordata er datamengder som er så store, mangeartede eller komplekse at vi mennesker ikke
alene har kapasitet til å analysere, forstå og gi de mening. I stedet bruker vi teknologier som
maskinlæring for å skape orden og finne mønstre i dem.
Man kan si at store data har fem kjennetegn – kjent på engelsk som «5 Vs»: Volume (volum),
velocity (fart), variability (variasjon), veracity (sannhetsinnhold) og value (verdi).

 Volum (volume): Det er anslått at mengden data som skapes og prosesseres hvert år
vil øke fra 97 zettabyte (ZB) i 2022 til 181 ZB i 2025. 1 zettabyte er 1.000.000
terabyte – eller 8.000.000.000.000.000.000.000 bits.
 Fart (velocity): Data genereres i en enorm fart, noe som for eksempel kan gi mulighet
for data i sanntid.
 Variasjon (variability): Det handler ikke bare om strukturerte data i databaser, men
også ustrukturerte data som bilder, videoer, tekst, m.m.
 Sannhetsinnhold (veracity): Som vi vet er det ikke slik at alt som står på Internett er
sant Samtidig er det slik at data må være sannferdige for at vi skal kunne få verdi ut
av å analysere dem.
 Verdi (value): Data kan være verdifulle for bedrifter (både i videre analyser og som et
inntektspotensiale), men det er ikke gitt (f.eks. grunnet kvalitet og at de ikke er egnet
til å besvare spørsmål man søker å utforske vha. analyse). Ledere må lete systematisk
etter verdien i store data.

Selv om vi kanskje ikke tror det, så er både individer og samfunnet i seg selv veldig
rutinebaserte. Vi har mange individuelle og kollektive vaner og handlingsmønstre som kan
avdekkes, blant annet gjennom å analysere stordata ved hjelp av maskinlæring og andre
teknikker.
Teknologien hjelper oss med å se på disse på nye måter: Vi kan få mer kunnskap om hvordan
vi kan koordinere og organisere oss bedre. Vi kan støttes i å finne løsninger på komplekse
utfordringer, for eksempel innen klima og miljø.
Eksempler på utfordringer vi løser med hjelp av data
Det finnes mange helt konkrete problemer som data hjelper oss med å løse, og nye
datadrevne produkter og tjenester lanseres omtrent daglig. De fleste har relativt liten
betydning i det store bildet, mens andre er så innovative at de endevender bransjer og setter
helt nye standarder.
Felles for alle datadrevne produkter og tjenester som faktisk får fotfeste i samfunn og marked
er at de løser problemer og møter behov. Derfor er vi også i mange tilfeller villig til å gi fra
oss data og å bidra til virksomheters datainnsamling. Data kan løse utfordringer.
La oss se på noen eksempler på utfordringer vi løser med hjelp av data:

 Mobilitet
Data har endret hvordan vi beveger oss. Kollektivtrafikkens ruteplanleggere kan gi
oss reiseforslag basert på buss, tog og trikk sin sanntidsdata. Taxiapper,
elsparkesykler og bildelingstjenester kombinerer posisjonsdata med kartdata og
presenterer det for kunder i et brukervennlig grensesnitt. 

Det samme gjelder varetransport. Selskaper kan hente inn trafikkdata for å optimalisere
leveringsruter og maskinlæring for å beregne antall sjåfører og biler. I fremtiden vil vi
sannsynligvis også se selvkjørende biler dele data med hverandre på veiene for å sikre trygg
og effektiv trafikk.

 Helse
Alle individer er ulike og medisinsk forskning er ikke nødvendigvis representativ for
alle typer mennesker og kropper. Gjennom å dele data kan vi få en mye bedre
forståelse av hvordan kroppene våre fungerer og kan for eksempel skape tilpasset
medisinering, med virkestoffer og doser tilpasset våre individuelle behov.
 Energi og bærekraft
Elektrifiseringen av norsk sokkel er grunnleggende datadreven. Utbygging av
vindmølleparker lener seg på værdata. Statkraft, som forvalter vannkraft, solkraft og
vindkraft – og er Europas største leverandør av fornybar energi – lønner et av statens
største miljøer av dataanalytikere og data scientists. Data er også en viktig bærebjelke
innen sirkulærøkonomien. Sirkulær økonomi handler om bedre ressursutnyttelse,
ombruk og reduksjon av forbruk, avfall og svinn.

Hvis det finnes detaljerte data om hvilke materialer som er benyttet i en bygning – samt
akkurat hvor og hvordan de er brukt – blir det lettere og tryggere å gjenbruke disse i andre
prosjekter senere. En lignende idé i en annen bransje er matsvinn-appen Too Good to Go. De
lar deg kjøpe matvarer som er til overs på slutten av dagen i kafeer, restauranter og butikker,
som ellers ville gått i søpla. Applikasjoner som dette lar deg finne uutnyttede ressurser som
andre sitter på – som du ellers aldri ville fått vite om.
Hva kan du oppnå med data?
De mest fremoverlente og verdifulle selskapene i verden i dag er datadrevne. Det betyr at de
samler inn og analyserer data knyttet til virksomheten sin – og bruker dem for å effektivisere
driften og forbedre sine egne produkter og tjenester.
Alle typer virksomheter kan jobbe på denne måten. Om det så er et elektrikerfirma, en
student-startup eller et multinasjonalt teknologiselskap, kan god bruk av data gjøre bedriften
mer lønnsom og attraktiv.
Her skal vi se litt på gevinstene av å ta datadrevne beslutninger, og helt konkret hva du kan
oppnå med data:
Data utvikler helt nye produkter og tjenester: Smarttelefoner, elbiler, legemidler og
løpesko. Vipps, TikTok og hjemlevering av dagligvarer. Felles for de fleste nye produkter og
tjenester som etablerer seg i sine markeder i dag, er at de er datadrevne. Innsikter fra
dataanalyse, intrikate algortimer og integreringer av applikasjoner gjør at man kan jobbe på
helt nye måter, se andre sammenhenger og dekke flere behov. Data er nye byggeklosser vi
bygger nye reisverk med – tilpasset et ny og digitalisert verden.
Data øker kvaliteten på produkter og tjenester: Å foredle data er egentlig en måte å skaffe
deg oversikt over og lære mer om det du holder på med. Kan noe gjøres bedre? Raskere? Mer
presist? Ved å tolke data med hjelp fra for eksempel maskinlæring, kan du finne mønstre og
avvik. Modeller, algoritmer og prediktive systemer kan forutse fremtidige feil og bedrive
vedlikehold på demninger og minimere nedetid på anleggsmaskiner. Data kan identifisere og
oppfylle kunder og brukeres reelle behov ved å tilby bedre kundeservice i en nettbutikk eller
ved å gi mer presise diagnoser på et sykehus.
Data øker utnyttelsen av tid og kompetanse: Ved å automatisere manuelle oppgaver som
for eksempel timeføring og fakturering, frigjøres ressurser som kan bruke på andre oppgaver.
En annen ting: Digitale programvarer og roboter er raskere, mer effektive og har lavere
feilmargin enn oss mennesker. Ikke dumt å alliere seg med slike supersystemer om du ønsker
å oppnå et godt resultat!
Data gjør at du kan jobbe mer målrettet med kommunikasjon, markedsføring,
kunderelasjoner og salg: Markedsførere, selgere og kommunikatørers viktigste oppgave er å
nå ut til kunder. Før var den sikreste veien til mål å tapetsere bybilder og aviser med
budskapet ditt, med håp om at noen der ute vil være interessert i det du har å si.
I en digitalisert verden derimot, og med de myriader av muligheter som data har gitt oss, er
virkeligheten litt annerledes. Sosiale medier og digitale markedsføringsverktøy kan gi data
om spesifikke målgrupper, slik at du kan kommunisere med akkurat de du ønsker å nå, og
brekke ditt publikum ned i spesifikke segmenter. Programmer som Google Analytics, Hotjar
og Google Tag Manager kan analysere og spore brukervaner, oppførsel og sikre mest mulig
presis kommunikasjon.
… og hva med utfordringer som data skaper?
Nå har du lært om utfordringer som data kan løse. Men hva med alle utfordringene som data
skaper?
Som vi har lært bruker vi data og digital teknologi for å få kontroll og oversikt over et stadig
mer komplekst samfunn. Vi sorterer, strukturerer, rydder opp i og systematiserer informasjon
for å se mønstre og mening. Når vi foredler data skaper vi orden i kaoset av tall og
informasjon.
Men her finnes det også et paradoks. Når vi bruker data og gir det en praktisk nyttefunksjon
skaper vi samtidig mer kompleksitet.
Samtidig som data sorterer opp i floker og finner løsninger, setter det også opp fallgruver og
graver irrganger av informasjon man kan gå seg vill i og manipuleres av. Dette har gitt oss en
helt ny rekkevidde av problemer vi må forholde oss til. Blant disse er utfordringer knyttet til
personvern, som vi lærte om i kapittel 1.
Fra før av vet vi at data kan brukes til å ta mest mulig presise avgjørelser, predikere mulige
utfall og optimalisere for ønsket effekt. Dette gjelder også for hvordan data brukes til å
behandle oss mennesker. Det finnes mange eksempler på hvordan gambling- og
spillindustrien utnytter sårbarheter og avhengigheter for å få brukere til å bruke mest mulig
penger og holde seg lengst mulig på plattformen. Manipulativ design og elementer som
trigger belønningssystemene i hjernen er utbredt.
Det finnes også en rekke sikkerhetsperspektiver man må ta hensyn til. Datadrevne systemer
brukes til å beskytte, styre og kontrollere samfunnskritiske instanser. Og som samfunn er vi
da nødt til å beskytte oss mot et helt nytt trusselbilde. Strømnett i byer kan skrus av og
hackere kan skaffe seg tilgang til servere på Stortinget.
Selv om vi er gode på å framsnakke alt det fantastiske vi kan gjøre med data og digitalisering
når det kommer til bærekraft, må vi også nevne nedsidene.
Produksjon av elektronikk som smarttelefoner og pc-er står for store utslipp. Mange av
komponentene er dessuten laget med kostbare, ikke-fornybare mineraler som må hentes ut av
gruver – ofte i utviklingsland, med kummerlige arbeidsforhold.
Og hvor blir det egentlig av alle dataene vi bruker? Jo, de ligger lagret på fysiske servere
rundt i verden. Servere som står på og kjører 24/7 – og trekker enormt med strøm.
Det kombinerte karbonavtrykket av våre telefoner, pc-er, nettbrett, internett og systemene
som støtter det er på 1,6 milliarder tonn i året. Eller rundt 3,7 prosent av globale
drivhusgassutslipp. Det er avtrykk tilsvarende flyindustrien!
Hjelp til å redusere digitaliseringens klimaavtrykk med enkle grep
Her kan hver av oss – personlig og i virksomheter og organisasjoner vi er del av – ta ansvar
gjennom for eksempel å sørge for godt vedlikehold, resirkulering og gjenbruk av elektronikk,
og å unngå at maskiner, servere og skytjenester fylles opp og står på unødvendig.
Skytjenester (som du vil lære om i neste kapittel) kan typisk utnyttes bedre enn lokale
servere, ettersom det er flere som deler på dem.
Noe så enkelt som å slette gamle e-post og nyhetsbrev hjelper på (hvis det er lenge siden du
har ryddet opp i innboksen kan du helt sikkert fint slette langt nord for 10.000 e-post uten å
savne noe). Alt vi kvitter oss med som tar opp unødvendig lagringsplass gjør at færre servere
trenger å stå på døgnet rundt for å holde det tilgjengelig for oss.

Data literacy
Så langt i Datareisen har du lest litt om hva data er, litt om hvordan data fungerer og litt om
hva man kan bruke data til. Neste gang du havner i en samtale om data, er du dermed
forhåpentligvis ikke helt blank!
For det er lett å tenke at det er slags magi i data. I denne sammenhengen snakker en ofte om
ting som «skyen», og bruker ord som å «surfe». Det føles lett og luftig. De som selger
digitale produkter og tjenester vil gjøre det så lett og lettvint som mulig. Prosessene som
ligger bak og får det hele til å fungere, ser vi i liten grad noe til.
Teknologien er riktignok avansert – den er bygget skritt for skritt gjennom mange tiår – men
magisk er det definitivt ikke. «Skyen» og «nettet» er metaforer for en materiell infrastruktur
med sjøkabler og serverparker. Det er fysisk, håndfast og konkret.
Vi glemmer lett hvor komplekse disse systemene faktisk er.
De er bra om flere har en bredere forståelse for hvordan data fungerer – ellers risikerer vi å
bli umyndiggjort, mens makten ligger hos en elite som sitter på kunnskap og forståelse og
som kan utnytte dette fullt ut. Det er så mange databaserte avgjørelser som tas i samfunnet. Jo
flere som forstår grunnlaget for disse avgjørelsene – dess mer rettferdig kan disse
avgjørelsene bli. At egenskapene til data tilgjengeliggjøres for flere er bra for demokratiet.
Sett på en annen måte: Hvis du kan argumentere og snakke godt for deg, vil det kunne åpne
mange dører. Fra å lande drømmejobben til å få bedre vilkår i banken. Med et godt språk og
ordforråd kan du også forstå flere nyanser og referanser i det du leser og få en rikere
forståelse av verden omkring deg. Å være god med språk kan med andre ord være en fordel i
livet og i hverdagen.
Det samme kan sies om data.
Å ha evnen til å lese, forstå, analysere og tenke kritisk om data og dens bruk er noe vi kaller
for data literacy.
Literacy oversettes iblant som lese- og skriveferdigheter. Det er derimot en for snever
definisjon. Man bør si – slik Store norske leksikon gjør det – at literacy er et sett med
ferdigheter som gjør at man kan forstå, skape, kommunisere, orientere seg og delta i samfunn
som er i endring. FN definerer literacy som en menneskerett.
Men vent nå litt: Er det å snakke hundre prosent flytende data en forutsetning for å delta i
samfunnet? Må alle ta lange utdanninger innen IT for å i det hele tatt ha en jobb og et liv?
Selvsagt ikke.
Akkurat slik ikke alle er spesialister på for eksempel språk og økonomi, finnes det et generelt
nivå av kunnskap som er tilstrekkelig for å skjønne hva det handler om, og en grad av
forståelse som innebærer at man kan oppdatere seg på endringer innen feltet. Slik er det også
med data.
Forståelse og handlefrihet
Ved å utvikle din data literacy, vil du også utvikle din handlefrihet innen det digitaliserte og
datafiserte samfunnet.
Det er i grunn nettopp det hele dette kurset handler om!
Ikke alle trenger å kunne lage maskinlæringsalgoritmer eller jobbe med avansert
sannsynlighetsberegning. Men vi trenger flere som forstår noe av dette, og vi trenger alle til å
forstå hvordan data kan påvirke vårt liv, samfunn og demokrati.
I arbeidslivet trenger vi flere som kan sette spørsmålstegn ved datakvaliteten eller spørre om
hvor dataene er lagret. Vi trenger flere som kan være oversettere og brobyggere mellom data
og andre fag og perspektiver. Vi trenger flere som forstår verdien av data i beslutningstaking,
og reisen fra data til innsikt og handling.
Data literacy kan også være noe mer personlig. De fleste vil kunne kjenne seg igjen i at de
ikke helt klarer å finne ut hva som skjer med dataene deres, og at vi må bli mer obs på våre
rettigheter. Dette er også en type data literacy.
Databrukere og citizen data scientists
Å tolke, strukturere og foredle data er åpenbart ikke noe hvem som helst kan mestre på et
blunk. Denne kompetansen er i dag høyt etterspurt overalt i industrien og næringslivet.
«Alle» er på utkikk etter en god data scientist i dag.
Mye av det vanskeligste arbeidet, som å sammenstille data fra mange kilder, kan likevel i
stadig større grad støttes av gode verktøy. Samtidig kommer det også flere og bedre verktøy
som ikke-spesialister kan bruke for å utforske, analysere og finne innsikt i dataene.
Når flere deler av prosessen forenkles, og analyseverktøyene blir mer tilgjengelige, betyr det
at flere og flere vil få muligheten til å jobbe med data og finne nyttige innsikter. En ikke-
ekspert som jobber med data kalles noen ganger en citizen data scientist, eller enkelt og greit
en databruker.
Kort fortalt er det en enkel forståelse av data for oss helt vanlige lekfolk, som ikke har tatt
lange utdannelser eller jobbet i mange år innen feltet.
Hva slags kompetanse innebærer data literacy?
For å kunne skrive og lese trenger du å sette sammen en rekke ferdigheter. Noen er veldig
grunnleggende: Til å begynne med trenger du et ordforråd. Deretter en enkel forståelse av
grammatikk. Senere bør du lære deg setningsoppbygging, bøying av verb, ordklasser og så
videre. Enda et nivå høyere finner vi ting som formidlingsevne, kunnskap og evnen til å
argumentere.
Det er det samme med data literacy.
La oss ta en litt nærmere titt på ferdighetene og kompetanseområdene som utgjør data literacy
– grovt rangert fra grunnleggende til mer avansert:
Databevissthet
Vi begynner med databevissthet. Databevissthet handler rett og slett om å ha et
grunnleggende konsept om hva data er og gjør. Du kjenner til ulike datatyper og
datakonsepter som personvern og dataetikk. Om du har lest og forstått litt av det vi har gått
igjennom frem til dette punktet i kurset, kan vi slå fast at du allerede er rimelig databevisst.
Gratulerer!
Husker du da vi gikk gjennom dataenes livssyklus i første seksjon? Flere av ferdighetene som
utgjør data literacy henger tett sammen med dataenes livssyklus. Vi kan si at databevissthet er
kunnskapen om syklusens første steg, nemlig situasjon / aktivitet.
Dataoppdagelse, datainnsamling og oppretting og bruk av metadata
Dataoppdagelse handler om å ha kunnskapen og ferdighetene til å søke, identifisere, finne
og få tilgang til relevant data fra ulike kilder. Har du i tillegg kunnskap om hvordan dataen du
finner samles og lagres, er du på god vei.
Sammen med kunnskapen om oppretting og bruk av metadata, henger disse ferdighetene
sammen med datainnsamling fra dataenes livssyklus.
Datavisualisering og datatolkning
Datavisualisering er opprettelsen av og vitenskapen om visuell representasjon av data. Dette
er når du evner å gi dataene liv. Å visualisere data handler kort og greit om å presentere data
på en enklest mulig måte. De mest gjenkjennelige måtene data visualiseres på er gjennom
diagrammer som søyle, linje- og sektordiagram.
Datatolkning går ut på å kunne lese og forstå analyser og visualiseringer av data. Det gjelder
både å kunne forstå data som noen viser deg, og å sjekke at andre forstår dine egne analyser
og visualiseringer.
Datavisualisering og datatolkning henger sammen med rapportering og/eller visualisering fra
dataens livssyklus.
Historiefortelling
Som du kanskje forstår: Data er ikke særlig mye verdt om den ikke er lesbar, forståelig eller
brukbar for andre. Engasjerende og spennende data er derimot svært mye verdt. Derfor er
historiefortelling en del av ferdighetene som utgjør data literacy. Historiefortelling med data
møter vi for eksempel i journalistikken i form av infografikker, interaktive
forklaringsmodeller og presentering av data bygget rundt et narrativ.
Historiefortelling med data er derimot ikke forbeholdt journalister. Dyktige analytikere og
forskere tar i bruk fortellende grep for å gjøre data forstått.
Å evaluere databaserte beslutninger kan bety for eksempel at du bruker visualiseringer til å
gi deg oppdatert informasjon om noe som du vil ta beslutning om.
Dataforvaltning
Dataforvaltning er kunnskapen om å ta vare på, overse og administrere data. På engelsk
kalles denne kompetansen for data stewardship. Det er gjerne en enkelt person på en
arbeidsplass som har ansvar for å forvalte bedriften eller virksomhetens data.
I en virksomhet med høy data literacy vil dataforvaltning kunne være et slags felles ansvar.
Flere kan sjekke et datasetts egnethet, flere kan stille kritiske spørsmål og flere kan sørge for
at personvern og sikkerhet er tilstrekkelig ivaretatt.
Evidensbasert beslutningstaking
Evidensbasert beslutningstaking kan oppsummeres så enkelt som å bruke data til å gjøre
den jobben du har på en bedre måte. Du evner ta data fra innsikt til handling.
Du har en forståelse av hele dataenes livssyklus slik at du kan stille de rette spørsmålene. Du
vet å bruke passende datasett, gjøre gode prioriteringer og tenke kritisk rundt datakvalitet.
Oppsummert er evidensbasert beslutningstaking den siste bossen av kompetansen som utgjør
data literacy!

Oppsummering
I denne seksjonen har vi sett nærmere på hvilke muligheter og utfordringer data skaper. Vi
har lært om hvem som bruker data (egentlig de aller fleste – men noen yrkesområder er mer
datadrevne enn andre, for eksempel yrker innen samfunnskritisk infrastruktur). Og ikke minst
har vi sett at data ikke bare er viktig for å skape lønnsomhet i bedrifter og mer effektive
virksomheter – men for hele samfunnet.
Jo flere som kan delta i samtaler og beslutninger om data, jo mer rettferdig vil databaserte
avgjørelser bli. Å øke data literacy i samfunnet – altså evnen til å lese, forstå analysere og
tenke kritisk om data – er viktig for et mer demokratisk samfunn.
Vi har sett på hva data science er, fått en innføring i stordata, og sett på noen helt konkrete
eksempler på hva man kan oppnå med data. Data kan utvikle nye tjenester, øke kvaliteten på
produkter, sørge for bedre tidsutnyttelse og legge til rette for mer effektiv kommunikasjon og
markedsføring.
Samtidig har vi også lært litt om nedsidene ved data, og hvordan datafiseringen av samfunnet
faktisk har negative konsekvenser for blant annet klima og sikkerhet.

Kap 2. Teknologi og sånn


Hvor langt kan du telle på fingrene?

De fleste kommer til ti. Lærer du å telle med totallsystemet (binær), kan du imidlertid gjøre
det ganske mye bedre: Da kommer du helt til 1024.

Hvordan fungerer data – egentlig?


Tidligere i kurset har vi slått fast at digitaliseringen leder til en digital transformasjon der
skillelinjene viskes ut mellom den gamle analoge verden og den nye digitale.
Analoge og digitale data
Data kan være både analoge og digitale. En datamaskin kan imidlertid kun jobbe med digitale
data. Men hva er egentlig forskjellen?
I dagligtalen har analog rett og slett fått betydningen «ikke digital». Vi bruker det om FM-
radio, gammeldagse fotoapparater med filmrull og de gamle familievideoene som vi ennå
ikke har digitisert.
En litt mer komplisert definisjon av analog, som den vi finner i Det norske akademis ordbok,
er at det er noe «som er basert på fysiske, kontinuerlig varierbare størrelser eller
mekanismer».
Vi har allerede nevnt et eksempel på slike analoge data: Lydbølger. Lydbølger er nettopp
kontinuerlige signaler som varierer i styrke og frekvens. I de små rillene i en LP-plate er det
et mønster av bølger og daler (en fysisk representasjon av lydbølgene) som får nålen til å
vibrere, og når lyden forsterkes hører vi det som musikk.
Når du lytter fra Spotify eller YouTube, er musikken derimot lagret som en digital fil.
Musikken er spilt inn og lagret digitalt, før den på nytt gjøres om til analoge lydbølger som
treffer ørene dine. For å bli til digitale data, må musikken digitiseres – som teknisk sett betyr
«gjøres til siffer» (digit er engelsk for siffer).
For å forstå hva digitale data er i en mer teknisk forstand må vi da snakke om 0 og 1.

Bits og bytes
Hvordan fungerer egentlig en datamaskin?
Maskinen består av maskinvare (den fysiske maskinen) og programvare (instruksjonene vi gir
maskinen). Maskinvaren kan vi igjen grovt dele opp i to deler: prosessor og minne – i tillegg
til inn- og ut-enheter.
Det som får prosessoren og minnet til å fungere hver for seg og sammen i en datamaskin, er
til syvende og sist en uhyre stor mengde av elektriske signaler. Et slikt signal er enkelt sagt
det vi kaller en bit. Det er en forkortelse for «binary digit», altså et tall i binærsystemet, eller
totallsystemet.
Det er dette som er de berømte 0 og 1.
En bit kan representeres ved en elektrisk krets, der det på et gitt tidspunkt enten er et signal –
eller ikke. En bit har kun to tilstander: Enten er den av (representert med 0) eller den er på
(representert med 1).
Dette systemet må vi bli litt bedre kjent med for å forstå hva digitale data i praksis er for noe
og hvordan den digitale verden henger sammen.
Hvordan fungerer det binære systemet?
En enkelt bit gjør ikke så mye ut av seg, men i kombinasjon med andre bits er det dette som
er grunnlaget for hele den digitale verden. Kombinasjoner av bits kan representere hva som
helst: Fra bokstaver til lydbølger. Fra temperaturmålinger til kundedata.
La oss ta et enkelt eksempel for å forstå hva som gjør kombinasjonene av 0 og 1 så smart:
Tenk at du har en eske med Lego, og lurer på hvor mange klosser det er der. Du har ikke noe
å skrive på, og begynner å telle på fingrene … men kommer da åpenbart bare til ti. Det blir
litt for lite!
Men som vi nevnte i introduksjonen til kapittelet, kan du gjøre det bedre om du heller teller
med binære tall. Da kommer du helt til 1023 (eller 1024 hvis du regner med 0). Så spør du:
Hvordan?
Her er nøkkelen: Det er ikke antall fingre som gjelder, men antallet mulige kombinasjoner av
de ti fingrene. Hver finger har to mulige tilstander: Den kan enten peke til værs, eller holdes
ned inntil håndflaten. Med disse to tilstandene er det mulig å kombinere fingrene dine på
1024 ulike måter.
Antall mulige kombinasjoner kan vi enkelt regne ut med enkel potensregning, med 2 som
grunntall og antall bits som eksponent. Antallet mulige kombinasjoner med ti fingre er da to
opphøyd i ti, altså 2^10 = 1024.
Har du mer enn tusen Legoklosser, får du ta med et par av tærne også (selv om de er litt
vanskeligere å bøye). Allerede med én ekstra tå (bit) kommer du til 2048, med to kommer du
til 4096, og så videre.
Hva om du tar med alle ti tærne, og altså totalt jobber med 20 bits? Da blir det kanskje noen
tusen til? Vel, det er lett å sjekke: To opphøyd i tjue er … 1.048.576!
Prøv det selv – tell til 1024 på fingrene!
Vil du se hvordan det fungerer? Dette er egentlig ganske enkelt – og gøy – så snart du
skjønner logikken:
Hold opp hendene dine med håndflatene mot deg. Tenk at den høyre tommeltotten
representerer tallet 1 og pekefingeren representerer tallet 2. Da vil langfingeren bli 4,
ringfingeren 8, lillefingeren 16 og så videre; vi dobler for hver finger. Selv om hver bit i seg
selv bare er «av» eller «på», vil hver bitposisjon altså representere ulike ting. I dette tilfellet
altså en tallverdi som dobles for hver posisjon.
Bare med de to første fingrene – tommel og pekefinger – kan du telle til tre: Tommelen alene
er én (1 + 0), pekefingeren alene er to (0 + 2), og begge to sammen blir tre (1 + 2). Skrevet på
en annen måte, som bits, kan vi se at én er 00001 (tommelen er «på» mens de andre er «av»),
to er 00010 (nå er bare pekefingeren «på») og tre er 00011 (nå er både tommeltotten og
pekefingeren «på»).
Det vi teknisk sett gjør her, er å gange bitverdien (0 eller 1) i hver tallposisjon med verdien på
den posisjonen. Når tommelen er «på» blir det altså 1*1, mens når pekefingeren er «på» blir
det 1*2. Mens når tommelen er av blir det 0*1 og for pekefingeren blir det 0*2. Siden det
bare er bits som er «på» som vil gi en verdi større enn null, kan vi da enkelt og greit plusse
sammen verdien som de aktive fingrene representerer.
For å komme til fire må du nå «gi fingeren» (00100). Som sagt dobler vi for hver finger. Det
er jo ikke noe poeng i at langfingeren skal representere tallet 3, når vi allerede kan telle til tre
uten den.
Kan du tenke deg hva som da blir fem? Helt riktig, det er tommel pluss langfinger (00101).
Seks blir da pekefinger pluss langfinger (00110) og syv blir alle tre første fingre (00111).
Hvis du prøver det på fingrene er det enklere å se logikken.
Fortsett etter samme logikk, så kommer du til 8 med en enslig ringefinger og etter hvert 16
med bare lillefingeren til værs. Fyller du så opp hele hånden kommer du så langt som til 31 (1
+ 2 + 4 + 8 + 16). Her er alle fingrene på høyre hånd «på», mens alle på venstre er av. Ser vi
på begge hendene (ti bits) har vi nå 0000011111. Nå må du over på venstre lillefinger (alene)
for å få 32 (0000100000). Og så videre.
Bytes: Kombinasjoner av bits
Kombinasjonen av åtte bits er det som kalles en byte. En byte kan representere 256 ulike
verdier (2^8 = 256).
Hver bokstav og hvert tall du ser her vil være representert med én byte i datamaskinens
grunnleggende kode. Bits og bytes kan nemlig representere hva som helst, ikke bare tall, men
også bokstaver, farger, lyd eller hva som helst annet.
1000 (noen vil si 1024) byte er en kilobyte, 1000 kilobyte er en megabyte, 1000 megabyte er
en gigabyte, og så videre. Det er over en milliard bytes i en gigabyte, og dermed over åtte
milliarder bits. Hvis vi da tenker på antall mulige kombinasjoner og sammensetninger, får vi
et større tall enn vi har plass til å skrive her.
Alt du har på maskinen din – bilder, programmer, tekstdokumenter – er lagret og blir
behandlet på denne måten, som sammensetninger av bits og dermed også bytes. Det er slike
sammensetninger vi bruker for å representere ulike ting i data.
Slik jobber maskinen med bits og bytes
Det er datamaskinens programvare som forteller maskinvaren hva den skal gjøre med de
elektriske signalene den mottar (altså bits og bytes) i ulike sammenhenger.
For eksempel ble det allerede i 1963 innført en standard for hvordan tall, bokstaver og annen
input fra tastaturet skal representeres som digitale data. Da innførtes det såkalte ASCII-
tegnsettet (kort for American Standard Code for Information Interchange), som fortsatt er i
bruk i dag, som en del av den nyere standarden UTF-8 (Unicode Transformation Format 8,
altså en variant av Unicode-tegnsettet som bruker 8 bits).
Jobber du for eksempel i et tekstbehandlingsprogram og trykker på bokstaven «m» på
tastaturet, mottar da maskinen signalene 01101101. Hvis du nå telte deg frem til at dette
tilsvarer tallet 109 etter systemet du nettopp lærte, blir du glad for å høre at ASCII-koden for
en liten «m» er nettopp 109. En stor «M» på sin side er representert ved 01001101 (ASCII-
kode 077). Mens om du for eksempel trykker Escape, får maskinen servert kombinasjonen
00011011 (ASCII-kode 027).
Standarder som Unicode gjør at maskinen vet hva den skal gjøre med signalene den mottar.
Hvordan maskinen egentlig er bygget opp og fungerer, skal vi se nærmere på i neste emne.

Datamaskiner og databehandling
Husker du forkortelsen «EDB»? Det står for elektronisk databehandling. I dag går det inn i
det vi kaller IT eller IKT (informasjons- og kommunikasjonsteknologi). Det eldre begrepet
sier imidlertid mye om hva vi egentlig snakker om her: det er nettopp elektronisk behandling
av data.
Maskinvare: Prosessorer og minne
Vi sa tidligere at maskinvaren i en datamaskinen grovt sett kan deles inn i prosessor og
minne. I tillegg er inn- og utenheter relevant når det gjelder data. La oss se på disse i tur og
orden.
Prosessorer
En prosessor er en enhet som nettopp prosesserer, eller behandler data, etter instruks fra et
program. (NB: Her bruker vi prosessering i en mer generell betydning enn da vi tidligere
snakket om dataenes livssyklus). Instruksjonene hentes fra minnet. En prosessor kan bare
prosessere bits.
Minne
Når det gjelder minne skiller vi dette i to:
Primærminne betegnes også som internminne og arbeidsminne. Dette holder data når de
behandles. Vi snakker typisk om RAM som primærminne. RAM står for Random Access
Memory. RAM tømmes når datamaskinen slås helt av.
Sekundærminne lagrer data etter prosessering, for eksempel på en Solid State Drive (SSD)
eller harddisk. Disse tåler i utgangspunktet at strømmen slås av og vil da fortsatt beholde
dataene.
Inn- og utenheter
En innenhet er en enhet som kan hente inn, fange eller registrere data. Det kan for eksempel
dreie seg om en sensor, et lydkort eller – som sagt – et tastatur.
En utenhet er en enhet som kan presentere informasjon til en bruker, for eksempel en skjerm,
en printer eller et lydkort. Som vi ser her, kan noen ting, som et lydkort, være både en
innenhet og en utenhet.
Programvare: Instruksjoner og programmering
Maskinvaren trenger nøyaktige og presise instruksjoner for å gjøre noe som helst. Gjennom
instruksjonene forteller vi maskinen hvordan den skal løse en gitt oppgave.
Alt en maskin gjør er bygd opp av en rekke logiske instrukser. Et sett med instrukser som en
datamaskin kan bruke til å løse bestemte oppgaver kalles et program. Å skrive kode for å lage
disse programmene, heter å programmere.
Datamaskiner kan ikke tolke nyanser eller lese mellom linjene, eller gjøre noe på eget
initiativ. De gjør nøyaktig det de får beskjed om – hverken mer eller mindre. Vi som gir disse
instruksjonene må derfor være helt presise i beskrivelsene våre.
Siden en prosessor bare kan prosessere bits, trenger den instruksjoner som til syvende og sist
koker ned til 0 og 1. Men selv om det er lett å telle på fingrene i binærtall, er ikke
maskinkode spesielt intuitivt for mennesker når vi skal gi komplekse instruksjoner. Derfor
brukes som regel ulike programmeringsspråk, som er forståelig for mennesker, og som kan
oversettes til maskinkode for å også forstås av maskiner.
Noen språk er tettere på maskinkodespråk, altså 0 og 1 (lavnivåspråk), mens andre er mer
abstrakte og mer intuitive for mennesker (høynivåspråk). Selv om språkene er ulike, følger de
til syvende og sist de samme logiske prinsippene, og de vil alle oversettes til maskinkode når
de behandles av datamaskinen.
Noen kjente eksempler på programmeringsspråk er Python, Java, C, C++, og JavaScript. Det
finnes også andre typer datamaskinspråk som er mer begrenset i sitt bruksområde enn et
programmeringsspråk. For eksempel har du kanskje hørt om Hypertext Markup Language
(HTML). HTML, som brukes til å utvikle nettsider, er et markeringsspråk. Et
markeringsspråk hjelper med å forklare datamaskinen hvordan tekst og dokumenter skal
struktureres og presenteres.
Noen av datamaskinspråkene (for eksempel programmeringsspråk) egner seg til en rekke
oppgaver, mens andre er egnet til helt spesifikke ting som å jobbe med databaser eller til å
lage nettsider. Hvilket språk du velger er derfor avhengig av hva du skal gjøre.

Eksempler på digitale data: Lyd og bilde


Data kan som vi har sett være digitale eller analoge – men det er bare er digitale data som kan
behandles av en datamaskin.
La oss se på to konkrete eksempler, nemlig digitale representasjoner av lyd og bilde. Hvordan
ser egentlig dette ut i en datamaskin?
Lyd: Fra analog til digital

Her ser du et eksempel på hvordan analoge data fra lyd – altså lydbølger – kan representeres
digitalt i en datamaskin.
Lydbølger er analoge. Vi lærte definisjonen av analog tidligere – signalet er her basert på
fysiske, kontinuerlig varierbare størrelser. For å oversette dette til et digitalt format må vi ta
såkalte samples eller samplinger (bokstavelig oversatt: prøve eller stikkprøve) med jevne
tidsintervaller. Figuren viser punkter hvor det er tatt samples.
For en lyd-CD er det vanlig med en sample rate (frekvens) på 44.100 samplinger per sekund
(44,1 kilohertz, kHz). I tillegg er det relevant hvor mye informasjon som fanges opp hver
gang man leser av lydbølgen – altså hvor mange bits med data som lagres for hver enkelt av
disse 44.100 stikkprøvene. En såkalt bitdybde på 8 eller 16 biter er vanlig, mens hifi-
entusiaster gjerne vil ha 24. Og man trenger to kanaler for stereolyd (en for hvert øre), noe
som dobler informasjonsinnholdet. (Hifi-lyd kan ta opp flere gigabyte med harddiskplass per
album).
Du kan tenke på det som at vi måler lydbølgene i «to dimensjoner» – lengde/tid og dybde.
Altså både hvor ofte den samples, og hvor mye informasjon som lagres i hver sample.
Strømmetjenester som Spotify bruker algoritmer som komprimerer lyden, noe som betyr at
det typisk er mindre informasjonsinnhold når man spiller musikken fra Spotify enn når den
kommer fra en CD. Mens en CD vil spille av 1.411 kilobits per sekund (Kbps), vil MP3-filer
og musikken du strømmer typisk ha en såkalt bitrate på 96 til 320 Kbps. Du skal riktignok ha
et trent øre og godt utstyr for å virkelig sette pris på forskjellen i lydkvalitet.
Bilde: Fra lys til piksler

Som vi har sett i eksempelet med lydbølger, må analoge signaler representeres digitalt i form
av bits. Slik er det også med bilder. Dette er i utgangspunktet også analoge signaler – i form
av elektromagnetiske bølger som øynene våre (og kamerasensorer) oppfatter som lys og
farger.
Når vi skal digitisere dette, kan vi også her snakke om to dimensjoner som avgjør kvaliteten i
de digitale bildene: Nemlig oppløsning (ikke ulikt lydfilers «sample rate») og bitdybde.
Med oppløsning menes antall piksler / bildepunkter. Et fotografi på 24 megapiksler består for
eksempel av 24 millioner piksler, mens et bilde med 8 megapiksler består av 8 millioner
piksler. Mens en 4K-video (3840x2160 piksler) har fire ganger så mange piksler som en HD-
video (1920x1080 piksler).
Bitdybden er på sin side hvor mange bits med data som representerer hver enkelt piksel. Jo
flere bits, dess flere mulige farger kan vi gjengi.
I figuren ser du et forenklet eksempel på hvordan piksler kan representeres binært, altså
digitalt. Her brukes 2-bit representasjon av hver farge, noe som gir 2^2, det vil si 4 mulige
farger.
Et vanlig digitalt bilde i jpg-format bruker 8 bits for å representere hver av hovedfargene rød,
grønn og blå (RGB). Til sammen gir dette 24 bits per piksel. Det vil si 256 mulige nyanser av
hver farge, og til sammen 16,8 millioner farger når du kombinerer dem.
Når du tar bilder i råformat på et systemkamera, kan du jobbe med en bitdybde på 12, 14 eller
16 bits per kanal. Akkurat som at hifi-entusiasten vil ha større bitdybde og mer informasjon i
filene, gir dette fotografer flere farger og nyanser å jobbe med.
Data på ulike nivåer
For å understreke det vi har sett er data på sitt laveste nivå en eller flere biter i kombinasjon.
Men vi kan også snakke om data på et høyere nivå, for eksempler piksler i et bilde eller tegn i
et tegnsett. Eller et enda høyere nivå, hvor et bilde (satt sammen av piksler) er data og en
tekst (satt sammen av tegn/bokstaver) er data.

Oppsummering

Data kan altså være både analoge og digitale. Den minste byggesteinen av digitale data er bits
– de berømte 0 og 1. En kombinasjon av åtte bits kalles en byte, som igjen kan representere
256 ulike verdier.
All data du har på maskinen din er til syvende sist sammensetninger av bits og dermed også
bytes. Vi bruker programmeringsspråk for å gi datamaskinene logiske instrukser for hvordan
den skal bruke denne informasjonen på en måte som også er forståelig for oss.

Hvilke teknologier er data avhengig av?


Vi har alltid hatt data – selv om det ikke alltid har handlet om 0-er og 1-ere. Vi har nevnt
mange eksempler – fra lydbølger til kirkebøker. Også digitale data har eksistert i mange tiår.

Det som fremfor alt er nytt i dag, og som er drivkraften i den digitale transformasjonen, er at
alt og alle er koblet sammen på samme nettverk. Nettverk er en forutsetning for den typen
databruk og datadeling vi ser i dag. Derfor skal vi i denne seksjonen bli bedre kjent med
nettverk, internett og protokoller.
I denne seksjonen vil du bli kjent med nettets historie og litt om hvordan det fungerer – og
hva som gjemmer seg bak forkortelser som TCP/IP og HTML.
I tillegg må vi snakke om den såkalte nettskyen.
Mens vi har hatt internett en god stund (det går faktisk helt tilbake til 60-tallet), er det først i
senere år at nettskyen er blitt en svært viktig brikke i det digitale puslespillet. Dette er også en
helt sentral del av data-infrastrukturen. Hva nettskyen er og hvordan den henger sammen skal
vi derfor også se på her.

Nettverk, internett og protokoller


Et datanettverk er en samling noder (datamaskiner, smarttelefoner og ulike knutepunkt som
rutere) som er koblet sammen – enten med kabler eller trådløst – slik at de kan kommunisere
og dele på ressurser. Data overføres over datanettverket i form av bits.
Det finnes flere typer nettverk, for eksempel lokale nettverk i en bedrift eller et hjem (LAN –
Local Area Network) og nettverk som er spredt geografisk over flere steder (WAN – Wide
Area Network). Verdens største WAN kjenner du godt: Internett.
Internett har sine røtter tilbake til forskningsprosjektet ARPANET, som ble satt i gang etter
initiativ fra det amerikanske forsvarets Advanced Research Projects Agency (ARPA) i 1966.
ARPANET var det første WAN-nettverket som tok i bruk såkalt pakkesvitsjing. Det betyr at
informasjonen som skal sendes deles opp i små datapakker hos avsenderen, og settes sammen
igjen hos mottakeren.
Pakkene sendes hver for seg ut i nettverket, med en adresse for hvor de skal – som
konvolutter som inneholder hver sine deler av et byggesett. Underveis reiser disse via
forskjellige enheter (routere; «postkontor») som sender dem videre på de raskeste rutene mot
mottakeren der det finnes ledig kapasitet. Ulike pakker kan finne ulike veier til målet.
Det geniale med dette systemet er at det lar mange datapakker dele på de samme linjene
samtidig, til forskjell fra å måtte ha en sammenhengende og uavbrutt tilkobling mellom
sender og mottaker, som på gamle telefonlinjer (såkalt linjesvitsjing). Pakkesvitsjing var et
gjennombrudd i nettverksteknologien og grunnlaget for dagens TCP/IP-system (som vi snart
kommer tilbake til).
De første datamaskinene som ble koblet på ARPANET i 1969 befant seg på ulike
amerikanske universiteter, og allerede i 1973 knyttet Norge seg til nettet, ifølge SNL.
Internett og verdensveven
Når vi snakker om internett i dagligtalen, mener vi som oftest alt det vi kan finne gjennom en
nettleser. Med andre ord det verdensomspennende nettverket med hypertekstdokumenter –
altså nettsider – kjent som verdensveven (World Wide Web).
Mens internett altså har røtter tilbake til 60-tallet, ble verdensveven på sin side lansert i 1991.
Den var utviklet av Tim Berners-Lee ved den europeiske forskningsorganisasjonen CERN.
Her benyttes såkalt hypertekst, med linker som lar oss navigere mellom websider, og vi har
for eksempel domenenavn (som datareisen.no), som gjør at det er lettere å finne websider og
andre ressurser.
Verdensveven er altså ikke det samme som internett, men er en av internetts tjenester – ved
siden av for eksempel e-post og filoverføring. Strømmetjenester benytter seg av filoverføring
for å formidle film og musikk til oss forbrukere.
HTTP, TCP/IP og andre protokoller
Akkurat som at det må være regler i sport og spill for at det ikke bare skal bli anarki og kaos,
må også datamaskiner følge de samme spillereglene for å kunne kommunisere og utveksle
data med hverandre.
Et slikt regelsett er det som kalles en protokoll.
Nettverksprotokoller styrer overføringen av data mellom to punkter (for eksempel
datamaskiner) i et nettverk. Det å følge slike protokoller er nødvendig både for programvare
og for maskinvare på datamaskiner som skal kommunisere med hverandre, samt for
nettverksenheter som router og switch (se faktaboks).
Nettverksutstyr, klienter og tjenere
Klient-tjener-arkitektur er en måte datamaskiner kan kommunisere seg imellom på nettverk
og internett. Man har da en tjener – også kalt server – som kan tilby tjenester som lagring og
prosesseringskapasitet. Og man har en klient som bruker ressursene til tjeneren. Et eksempel
på dette er at en server kan tilby nettsider, og at en klientdatamaskin kan få tilgang til
nettsidene gjennom å laste dem ned. Dette skjer typisk gjennom at en bruker ber om tilgang
til disse nettsidene via en nettleser.
For at datamaskiner skal kunne kommunisere data over et nettverk, kreves det ulikt
nettverksutstyr. En svitsj lar maskiner kommunisere seg imellom på et nettverk. Mens en
ruter er bindeleddet mellom ulike nettverk, for eksempel mellom lokale nettverk og WAN
(som internett).
Et lokalt nettverk kan altså være koblet sammen trådløst eller via en svitsj, og er igjen koblet
til internett ved hjelp av en ruter. Over nettet kan en koble seg til ulike servere, for eksempel
servere knyttet til domenenavn som datareisen.no eller google.com.
Det er HTTP-protokollen (Hypertext Transfer Protocol) som gjør det mulig for en
klientdatamaskin å laste ned en nettside fra en server, slik at nettsiden kan vises i en nettleser
som Chrome eller Firefox.

Slik fungerer HTTP-protokollen


HTTP-protokollen har flere metoder, inkludert GET-metoden som forespør en ressurs (for
eksempel et HTML-dokument – altså en nettside) fra en server. Det er denne metoden som
gjør at websiden blir oversendt (lastet ned) til klientdatamaskinen og kan vises i nettleseren.
En annen HTTP-metode er POST-metoden. POST-metoden sender data til en server med
hensikt at serveren skal oppdatere en ressurs (for eksempel en nettside). Det er POST-
metoden som brukes når vi legger ut (poster) et nytt innlegg på sosiale medier.
En datamaskin koblet til et lokalnettverk via kabel eller trådløst kan altså sende en forespørsel
som formidles over nettverket, og gjennom ruteren, slik at den tilslutt når en server på
internett. Serveren kan da sende nettsiden og tilleggsinformasjon som en respons. Alt dette
skjer i henhold til HTTP-protokollen.
Vi kan se på et mer praktisk eksempel.
Klientmaskinen sender her en forespørsel til en server hos google.com (i realiteten kan mange
servere svare på forespørsel til det samme domenenavnet). HTTP-protokollen definerer som
vi har sett ulike typer metoder, slik som GET og POST. Eksempelet her viser hvordan GET
fungerer.
Først sender datamaskinen, via nettleseren Chrome, en GET-forespørsel – her vist i et utdrag.
Vi ser den første linjen GET / HTTP/2, med host www.google.com i den andre linjen. Det
betyr at klienten sender en forespørsel om ressursen tilgjengelig på www.google.com/, altså
hovedsiden til Google. HTTP finnes i ulike versjoner, HTTP/2 angir at det er versjon 2 av
HTTP som skal brukes. I linjene under spesifiseres blant annet hva slags dokumenttype
klienten vil ha tilbake (fortrinnsvis text/html, altså en nettside), hvilket språk (en-US, altså
amerikansk engelsk), samt mer teknisk informasjon om blant annet nettleseren og hvordan
nettsidene bør komprimeres for å bruke mindre plass under sending.
Gå til forsiden

Kapittel 2 / Seksjon 2 / Emne 1

1. 1.Derfor er data gull verdt (og verdt å verne om)

2.Teknologi og sånn
3.Slik får vi tak i data

Nettverk, internett og protokoller


Et datanettverk er en samling noder (datamaskiner, smarttelefoner og ulike knutepunkt som
rutere) som er koblet sammen – enten med kabler eller trådløst – slik at de kan kommunisere
og dele på ressurser. Data overføres over datanettverket i form av bits.
Det finnes flere typer nettverk, for eksempel lokale nettverk i en bedrift eller et hjem (LAN –
Local Area Network) og nettverk som er spredt geografisk over flere steder (WAN – Wide
Area Network). Verdens største WAN kjenner du godt: Internett.
Internett har sine røtter tilbake til forskningsprosjektet ARPANET, som ble satt i gang etter
initiativ fra det amerikanske forsvarets Advanced Research Projects Agency (ARPA) i 1966.
ARPANET var det første WAN-nettverket som tok i bruk såkalt pakkesvitsjing. Det betyr at
informasjonen som skal sendes deles opp i små datapakker hos avsenderen, og settes sammen
igjen hos mottakeren.
Pakkene sendes hver for seg ut i nettverket, med en adresse for hvor de skal – som
konvolutter som inneholder hver sine deler av et byggesett. Underveis reiser disse via
forskjellige enheter (routere; «postkontor») som sender dem videre på de raskeste rutene mot
mottakeren der det finnes ledig kapasitet. Ulike pakker kan finne ulike veier til målet.
Det geniale med dette systemet er at det lar mange datapakker dele på de samme linjene
samtidig, til forskjell fra å måtte ha en sammenhengende og uavbrutt tilkobling mellom
sender og mottaker, som på gamle telefonlinjer (såkalt linjesvitsjing). Pakkesvitsjing var et
gjennombrudd i nettverksteknologien og grunnlaget for dagens TCP/IP-system (som vi snart
kommer tilbake til).
De første datamaskinene som ble koblet på ARPANET i 1969 befant seg på ulike
amerikanske universiteter, og allerede i 1973 knyttet Norge seg til nettet, ifølge SNL.
Internett og verdensveven
Når vi snakker om internett i dagligtalen, mener vi som oftest alt det vi kan finne gjennom en
nettleser. Med andre ord det verdensomspennende nettverket med hypertekstdokumenter –
altså nettsider – kjent som verdensveven (World Wide Web).
Mens internett altså har røtter tilbake til 60-tallet, ble verdensveven på sin side lansert i 1991.
Den var utviklet av Tim Berners-Lee ved den europeiske forskningsorganisasjonen CERN.
Her benyttes såkalt hypertekst, med linker som lar oss navigere mellom websider, og vi har
for eksempel domenenavn (som datareisen.no), som gjør at det er lettere å finne websider og
andre ressurser.
Verdensveven er altså ikke det samme som internett, men er en av internetts tjenester – ved
siden av for eksempel e-post og filoverføring. Strømmetjenester benytter seg av filoverføring
for å formidle film og musikk til oss forbrukere.
HTTP, TCP/IP og andre protokoller
Akkurat som at det må være regler i sport og spill for at det ikke bare skal bli anarki og kaos,
må også datamaskiner følge de samme spillereglene for å kunne kommunisere og utveksle
data med hverandre.
Et slikt regelsett er det som kalles en protokoll.
Nettverksprotokoller styrer overføringen av data mellom to punkter (for eksempel
datamaskiner) i et nettverk. Det å følge slike protokoller er nødvendig både for programvare
og for maskinvare på datamaskiner som skal kommunisere med hverandre, samt for
nettverksenheter som router og switch (se faktaboks).
Nettverksutstyr, klienter og tjenere
Klient-tjener-arkitektur er en måte datamaskiner kan kommunisere seg imellom på nettverk
og internett. Man har da en tjener – også kalt server – som kan tilby tjenester som lagring og
prosesseringskapasitet. Og man har en klient som bruker ressursene til tjeneren. Et eksempel
på dette er at en server kan tilby nettsider, og at en klientdatamaskin kan få tilgang til
nettsidene gjennom å laste dem ned. Dette skjer typisk gjennom at en bruker ber om tilgang
til disse nettsidene via en nettleser.
For at datamaskiner skal kunne kommunisere data over et nettverk, kreves det ulikt
nettverksutstyr. En svitsj lar maskiner kommunisere seg imellom på et nettverk. Mens en
ruter er bindeleddet mellom ulike nettverk, for eksempel mellom lokale nettverk og WAN
(som internett).
Et lokalt nettverk kan altså være koblet sammen trådløst eller via en svitsj, og er igjen koblet
til internett ved hjelp av en ruter. Over nettet kan en koble seg til ulike servere, for eksempel
servere knyttet til domenenavn som datareisen.no eller google.com.
Det er HTTP-protokollen (Hypertext Transfer Protocol) som gjør det mulig for en
klientdatamaskin å laste ned en nettside fra en server, slik at nettsiden kan vises i en nettleser
som Chrome eller Firefox.
Slik fungerer HTTP-protokollen
HTTP-protokollen har flere metoder, inkludert GET-metoden som forespør en ressurs (for
eksempel et HTML-dokument – altså en nettside) fra en server. Det er denne metoden som
gjør at websiden blir oversendt (lastet ned) til klientdatamaskinen og kan vises i nettleseren.
En annen HTTP-metode er POST-metoden. POST-metoden sender data til en server med
hensikt at serveren skal oppdatere en ressurs (for eksempel en nettside). Det er POST-
metoden som brukes når vi legger ut (poster) et nytt innlegg på sosiale medier.
En datamaskin koblet til et lokalnettverk via kabel eller trådløst kan altså sende en forespørsel
som formidles over nettverket, og gjennom ruteren, slik at den tilslutt når en server på
internett. Serveren kan da sende nettsiden og tilleggsinformasjon som en respons. Alt dette
skjer i henhold til HTTP-protokollen.
Vi kan se på et mer praktisk eksempel.
Klientmaskinen sender her en forespørsel til en server hos google.com (i realiteten kan mange
servere svare på forespørsel til det samme domenenavnet). HTTP-protokollen definerer som
vi har sett ulike typer metoder, slik som GET og POST. Eksempelet her viser hvordan GET
fungerer.
Først sender datamaskinen, via nettleseren Chrome, en GET-forespørsel – her vist i et utdrag.
Vi ser den første linjen GET / HTTP/2, med host www.google.com i den andre linjen. Det
betyr at klienten sender en forespørsel om ressursen tilgjengelig på www.google.com/, altså
hovedsiden til Google. HTTP finnes i ulike versjoner, HTTP/2 angir at det er versjon 2 av
HTTP som skal brukes. I linjene under spesifiseres blant annet hva slags dokumenttype
klienten vil ha tilbake (fortrinnsvis text/html, altså en nettside), hvilket språk (en-US, altså
amerikansk engelsk), samt mer teknisk informasjon om blant annet nettleseren og hvordan
nettsidene bør komprimeres for å bruke mindre plass under sending.
På dette svarer serveren med HTTP/2 200 OK. 200 er statuskoden som sier at forespørselen
fra var vellykket. Serveren sender også med litt annen informasjon, for eksempel om dato og
klokkeslett, hva slags innholdstype som er brukt i svaret (text/html, altså en nettside). I tillegg
til dette inneholder svaret fra serveren også koden for selve nettsiden, som igjen vises i
nettleseren (Chrome).

Dette er da i form av et HTML-dokument som nettleseren viser oss som en vanlig nettside,
altså hovedsiden til Google.

En annen viktig protokoll er SMTP (Simple Mail Transfer Protocol) for overføring av e-post.
Historisk har FTP (File Transfer Protocol) vært mye brukt for filoverføring, men med
utviklinger i HTTP-protokollen har HTTP i stor grad overtatt når det gjelder filoverføring
også for andre filformater enn HTML (websider). For eksempel bruker strømmetjenester nå
typisk HTTP for å overføre medieinnhold (lyd og video). Strømmetjenester overfører typisk
mange mindre filer, noe HTTP er bedre egnet til enn FTP.
Sist, men ikke minst, må vi nevne TCP/IP, som står for de grunnleggende spillereglene på
internett.
Vi nevnte TCP/IP tidligere da vi snakket om pakkesvitsjing. Pakkesvitsjing er i dag en del av
TCP/IP-protokollen – som egentlig er et helt sett av protokoller for internett-kommunikasjon
(på engelsk kalles det gjerne «Internet Protocol Suite»).
Slik fungerer TCP/IP
To av de viktigste protokollene i «protocol suiten» TCP/IP er – du gjettet det – nettopp TCP
og IP.
TCP (Transmission Control Protocol) oppretter en forbindelsesorientert kobling mellom
serveren og klienten – for eksempel serveren som har en nettside og datamaskinen som vil
lese den. Den deler opp dataene som skal sendes, og sørger for at de sendes i riktig
rekkefølge, med en sendingsbekreftelse. Akkurat som at du får en kvittering og pakkesporing
på postkontoret.
Så tar IP (Internet Protocol) over. IP står for transportetappen, og er ansvarlig for å levere
pakkene til rett sted over nettverket (du har sikkert hørt om en IP-adresse?). Dette er budene
og budbilene som frakter pakkene.
I den andre enden tar TCP imot pakkene (som kan ankomme i feil rekkefølge fordi de tar
ulike ruter, med flere forskjellige budbiler) og passer på å sette informasjonen riktig sammen
igjen.
TCP og IP er blant hovedprotokollene i TCP/IP-suiten. Hovedprotokollene inkluderer også
UDP (User Datagram Protocol), som er et alternativ til TCP. UDP lar oss også sende
informasjon mellom en server og klient, og jobber også sammen med IP for å få
informasjonen (pakkene) fra A til B over internett.
Les mer om UDP
UDP deler, som TCP, opp pakkene som skal sendes, men hos UDP er det en forbindelsesløs
kobling mellom server og klient. Det betyr at UDP generelt er raskere enn TCP, men den er
også mindre pålitelig.
Siden UDP er forbindelsesløs blir det for eksempel ikke gitt en sendingsbekreftelse, det er
ingen garanti om at dataene mottas i samme rekkefølge som de ble sendt, og det finnes da
ikke mekanismer for å sette pakkene sammen igjen i riktig rekkefølge hvis de kommer frem i
feil rekkefølge.
Applikasjoner som bruker UDP må tolerere at ikke alle pakker kommer frem til målet. UDP
er brukt mye til for eksempel av strømmetjenester, hvor applikasjonen kan tolerere noe
pakketap.
Ser vi litt større på det inkluderer TCP/IP også andre protokoller enn TCP, IP og UDP. Dette
gjelder alt fra «lavnivå» protokoller, altså protokoller som er nærmere den fysiske
maskinvaren, som gir regler for hvordan data må formateres som bits for å flyte mellom
datamaskiner i nettverk, til «høynivå» protokoller, det vil si protokoller som gjør at dataene i
tilslutt kan vises i applikasjonen til en bruker, f.eks. en nettleser eller en e-post leser.
HTTP-protokollen, som er en av byggesteinene til verdensveven, er faktisk en av høynivå
protokollene i TCP/IP suiten, og det er også blant annet SMTP. HTTP og SMTP bruker
typisk TCP og IP protokollene for å opprette forbindelse og overføre data mellom klient og
server. TCP og IP er igjen avhengig av ulike protokoller på et lavere nivå for å sikre den
faktiske dataflyten.

Nettskyen
Vi har sagt at alt og alle sammenkoblet over nettet i dag. Men det er ikke sånn at vi typisk
kobler oss opp mot andre maskiner én til én. Faktisk har vi i mindre og mindre grad arbeidet,
filene og programmene våre på våre egne maskiner i det hele tatt.
Det finnes et sted utenfor maskinene – i «nettskyen».
Hva er egentlig skyen? Det som menes med det, er enkelt og greit datasentre, typisk med
store samlinger med servere, som tilbyr lagring og prosessering over internett.
I stedet for å være avhengig av våre egne datamaskiner og lokale nettverk for alle mulige
oppgaver, kobler vi oss i større og større grad til slike eksterne servere for å lagre filer og
kjøre programmer og tjenester for oss. Skyen lar deg kort sagt flytte prosessering og lagring
fra bedriftens egen infrastruktur over til maskiner på internett.
Det er flere fordeler med dette. Ikke bare slipper bedriften å drifte sin egen infrastruktur. Å
jobbe i skyen er også mye mer fleksibelt og skalerbart med tanke på lagring og
prosesseringskraft. Skal du for eksempel skalere opp eller ned, kan du bare endre hvor mye
lagringsplass og prosesseringskapasitet du betaler for – i stedet for å bygge opp eller ned din
fysiske maskinpark med IT utstyr.
Noen eksempler på plattformer og tjenester som assosieres med nettskyen inkluderer Amazon
Web Services, Microsoft Azure, Microsoft 365 (inkluderer blant annet Microsoft Teams og
OneDrive), iCloud og Google Drive.
Her hvor vi snakker om data, er nettskyen viktig fordi det er nettopp i skyen at veldig mye av
dataene finnes. Data er blitt en så viktig ressurs nettopp fordi den ikke er innelåst i alle
mulige lokale nettverk og maskiner – men er tilgjengelig hvor som helst og når som helst, via
nettskyen.
Dette kjennetegner skyen
The U.S. National Institute of Standards and Technology (NIST) har formulert følgende
egenskaper ved nettskyen:

 Selvbetjent tilgang: Man kan få tilgang til skyen enten automatisk eller ved behov.
 Bred nettverkstilgang: Skyen kan nås gjennom internett fra mange ulike
datamaskiner, inkludert PC og smarttelefon.
 Lokalitetsuavhengig ressursdeling: Ressurser kan gjøres tilgjengelig etter behov, og
brukerne trenger ikke å forholde seg til deres faktiske plassering.
 Fleksibilitet: Man kan få tilgang til ressurser i skyen etter behov. For eksempel
dersom et firma vokser kan de fortløpende få tilgang til mer lagring og
prosesseringskraft. Skyen er derfor fleksibel.
 Målte tjenester: Man kan få muligheter til å betale basert på faktisk forbruk knyttet
til datalagring og prosessering, heller enn det man estimerer at man vil trenge

Tre nivåer i nettskyen


Det er vanlig å dele inn nettskyen i tre «nivåer» – etter hvor mye av driften og
funksjonaliteten du må stå for selv.
Programvare som en tjeneste
Det øverste nivået er de fleste av oss er kjent med – sannsynligvis bruker du det hver eneste
dag – nemlig programvare som en tjeneste (Software as a Service, SaaS). Dette er ferdige
applikasjoner som du får tilgang på over nettskyen. Typisk bruker du disse gjennom
nettleseren, uten å måtte installere noe på din egen maskin. Dette kan du gjøre fordi lagring
og prosesseringen som nevnt skjer i skyen. For eksempel når du bruker Google Docs,
Dropbox eller Microsoft Teams fra nettleseren, da benytter du deg av Programvare som en
tjeneste løsninger.
Plattform som en tjeneste
Det mellomste nivået kalles plattform som en tjeneste (Platform as a Service, PaaS). Hva det
er for noe, ligger i ordet: Du får her tilgang til for eksempel databaser, og et grunnlag til å
sette opp eller tilpasse dine egne applikasjoner og tjenester – men uten samme grad av tilgang
på eller ansvar for drift og infrastruktur som i det laveste nivået.
Infrastruktur som en tjeneste
Det laveste, mest grunnleggende nivået er å få tilgang på og kontroll over ting som lagring,
prosessering og nettverk. Dette kalles infrastruktur som en tjeneste (Infrastructure as a
Service, IaaS). IaaS gir stor fleksibilitet til å bygge sine egne plattformer og tjenester i skyen.
Du kan få tilgang til virtuelle servere og kanskje også mulighet til å konfigurere ulikt
nettverksutstyr (slik som brannmur og IP adresser) – men dette krever også en mer
spesialiserte tekniske ferdigheter enn å jobbe på de høyere nivåene.

Oppsummering

I denne seksjonen har vi sett litt på internetts historie og oppbygging.


For at datamaskiner skal kunne kommunisere og utveksle data, må de følge det samme
regelsettet – det som kalles protokoller. I denne sammenhengen – når vi snakker om internett
– er HTTP, HTML og TCP/IP blant de viktigste (og mest kjente).
De siste årene har nettskyen blitt en stadig viktigere del av måten vi bruker internett. Skyen
lar deg flytte prosessering og lagring fra lokal infrastruktur over til maskiner på internett. Vi
brukere allerede svært mye skybasert programvare og tjenester – og fremover vil vi bare se
mer og mer av det.

… og hvilke teknologier er avhengig av


data?
Puh! Nå har du blitt kjent med en del av teknologien og infrastrukturen som er nødvendig for
den digitale transformasjonen.

Når alt dette er på plass og vi dermed har mulighet til å samle og dele data i stor skala, åpner
det i neste omgang for mer innovasjon og flere nye muligheter.
Blant de viktigste teknologiene og trendene som avhenger av data, er kunstig intelligente
systemer, tingenes internett og digitale tvillinger. Ingen av disse er strengt tatt distinkte
teknologier i seg selv, men snarere kategorier som kombinerer flere digitale teknologier og
teknikker for ulike bruksområder.
Hva er forskjellene på kunstig intelligens på film og i virkeligheten? Hva er egentlig en
maskinlæringsalgoritme? Hva kan en gjøre med tingenes internett og digitale tvillinger?
Klikk deg videre for å få svar.

Kunstig intelligente systemer


Kunstig intelligens (forkortes KI eller AI, fra Artificial Intelligence) er noe alle har hørt om,
men som likevel kan være vanskelig å plassere eller definere. (Hva er intelligens, for den saks
skyld?)
Tankene går her fort til filmer som The Terminator, Blade Runner og Star Wars, der en AI er
en robot eller et datasystem med menneskelignende intelligens – som kan tenke og handle på
egenhånd, og som er en match og vel så det for våre egne tross alt begrensede mentale evner.
Samtidig er det åpenbart at det å ta i bruk AI i virkeligheten ikke er ensbetydende med å leie
inn C3PO eller å slippe løs Skynet. Så hva er egentlig kunstig intelligens – reelt sett?
Systemer som oppnår et mål basert på data
Kunstig intelligens er enkelt og greit en samlebetegnelse. Akkurat som at epler og pærer
begge er frukt, kan to forskjellige dataprogrammer begge være regnet som kunstig intelligens
selv om de gjør vidt forskjellige ting og baserer seg på ulike underliggende teknikker.
En vanlig forståelse av kunstig intelligens er datasystemer eller programmer som kan motta
og behandle data fra ulike kilder og – med noen grad av selvstendighet – utføre handlinger
som maksimerer sjansene for å oppnå et gitt mål.
Norges nasjonale strategi for kunstig intelligens har følgende definisjon: «Kunstig intelligente
systemer utfører handlinger, fysisk eller digitalt, basert på tolkning og behandling av
strukturerte eller ustrukturerte data, i den hensikt å oppnå et gitt mål. Enkelte KI-systemer
kan også tilpasse seg gjennom å analysere og ta hensyn til hvordan tidligere handlinger har
påvirket omgivelsene».
Når du hører om kunstig intelligens i sammenheng med teknologi og data, er det svært ofte
maskinlæring det mer spesifikt dreier seg om. Maskinlæring er en av flere underkategorier av
kunstig intelligens, og handler om systemer som kan lære fra data. Det vil si at systemene tar
imot data og bruker matematiske/statistiske metoder for å lage en maskinlæringsalgoritme
(modell). En slik maskinlæringsalgoritme kan ta imot andre/nye data som den bruker for å
gjenkjenne mønstre og utføre oppgaver.
Selve maskinlæringsalgoritmene kan også oppdateres (trenes) ved hjelp av flere og ferskere
data, som betyr at de potensielt kan tilpasse seg for å løse oppgavene sine på stadig bedre
måter.
Alien eller Mamma Mia?
Et typisk eksempel på maskinlæring er anbefalingene du får hos ulike strømmetjenester. Her
vil algoritmene foreslå innhold basert på hva du liker å se eller høre.
Si at du elsker science fiction, men avskyr flåsete romantiske komedier. Når du setter på The
Terminator én kveld, og Blade Runner den neste, vil en «intelligent» algoritme gjenkjenne et
mønster, og i neste omgang foreslå at du setter på Alien eller The Matrix – i stedet for å
tapetsere forsiden din med Mamma Mia og My Big Fat Greek Wedding.
Målet algoritmen er satt til å utføre i dette eksempelet, er å gi best mulige forslag til innhold
tilpasset hver enkelt brukers preferanser, vaner og smak. Jo bedre algoritmen er laget, og jo
mer data den har å jobbe med basert på din og andre brukeres vaner og handlingsmønstre,
dess bedre kan algoritmen bli på å gi deg forslag du faktisk liker.
Det overordnede målet er å maksimere sjansene for å holde deg klistret til skjermen – og i
neste omgang fortsette å betale abonnementet ditt.
Kunstig intelligente systemer er altså programmer som skal løse bestemte oppgaver, slik som
å navigere en selvkjørende bil i trafikken, foreslå beste kjørerute i rushtrafikken, samle og
gjennomgå dokumentasjon til en lånesøknad, å automatisk fylle ut en innkommende faktura
eller å filtrere ut søppelpost (spam). Hvert program lages for å være best mulig på sin ting,
men er såklart ikke «intelligente» i form av at de kan «tenke» – og plutselig bestemme seg for
å gjøre noe helt annet.
Den typen AI som ligner menneskelig intelligens – altså Hollywood-versjonen av AI – er
riktignok en visjon også i virkeligheten. Dette kalles kunstig generell intelligens (eller
Artificial General Intelligence, AGI). Men det er en visjon som i skrivende stund er langt ifra
oppnåelig.
Maskinlæringsalgoritmer
Alle dataprogrammer er basert på algoritmer. En maskinlæringsalgoritme (modell) kan
imidlertid oppdateres regelmessig (trenes) basert på stadig flere og ferskere data, slik at den
ikke gang på gang vil gi det samme utfallet i en gitt situasjon, slik som en vanlig algoritme
gjør. I stedet vil den da kunne endre og tilpasse seg etter omstendighetene, for mest mulig
effektivt å oppnå målet sitt.
Når vi trener opp en slik algoritme bruker vi det vi kaller treningsdata. Programmet som
trener algoritmen fôres da med et datasett, gjerne store mengder data fra ulike kilder.
Mengden og kvaliteten på dataene påvirker hvor god den trente algoritmen blir på den
oppgaven den skal utføre.
Deretter brukes testdata – data som algoritmen ikke har sett før – for å se hvor god den har
blitt med tanke på oppgaven den skal utføre. Når vi tester algoritmen med et helt nytt datasett,
kan vi med andre ord finne ut om den har lært det den skal og fungerer som ønsket. Etter at
algoritmen så settes til reell bruk mot (andre) reelle data vil den kunne fortsette å regelmessig
lære og utvikle seg videre, gjennom nye runder med trening og testing, før den igjen brukes
mot andre (reelle) data med hensyn på å utføre en oppgave.
Det finnes mange ulike typer maskinlæringsalgoritmer, men det er vanlig å gruppere dem
etter tre kategorier av maskinlæring:

 Veiledet læring: Trening av algoritmen blir gjort basert på data som kobles til en
konkret representasjon. Programmet som trener maskinlæringsalgoritmen blir gitt et
datasett (treningssett) som både inneholder dataene (input) og informasjon om hva
hver enkelt data representerer (output), og algoritmen skal da lære seg en regel som
bestemmer hvordan nye input (reelle data) blir koblet til mulige output. For eksempel
trenes maskinlæringsalgoritmen opp ved hjelp av massevis av bilder av elefanter og
giraffer, hvor den blir fortalt hvilke bilder som er av elefanter og hvilke bilder som er
av giraffer, for å lære å forstå forskjellen på dem.
 Ikke-veiledet læring: Algoritmen ser etter strukturer og mønstre i dataene på
egenhånd. I motsetning til veiledet læring blir det under trening av en ikke-veiledet
læring algoritme ikke gitt informasjon om hva som menes med dataene (output).
Forhåpentligvis vil algoritmen likevel  gjenkjenne grå dyr med snabel og rare gule dyr
med lang hals som ulike dyr, og gruppere dem hver for seg.
 Forsterket læring: Algoritmen blir ikke instruert i hvordan den skal løse oppgaven,
men får belønning og straff for gode og dårlige resultater. Et typisk eksempel er en
maskinlæringsalgoritme som kun får oppgitt et mål – å vinne i sjakk – men som ikke
blir fortalt hvordan den skal spille. Dette målet prøver den da å oppnå gjennom
prøving og feiling.

Siden kunstig intelligente systemer i mindre grad enn andre programmer har fått sine vilkår
definert eksplisitt av mennesker, betyr det også at de kan løse problemer på andre måter – og
løse andre problemer – enn hva vi mennesker er i stand til på egenhånd. Dette åpner opp for
mange spennende muligheter.
Algoritmene er derimot prisgitt de dataene de har å jobbe med. Nok data – og god nok data –
er derfor en forutsetning for å lykkes med kunstig intelligens.
Data blir det stadig mer av og de kommer fra flere ulike kilder, og det er blant annet som et
resultat av tingenes internett, som er det neste vi skal se på.

Tingenes internett
Stadig flere ting blir gjort «smarte» – altså utstyrt med sensorer og koblet til internett, slik at
de kan registrere og reagere på informasjon i sine omgivelser. Dette gjelder ikke bare
elektronikk som høyttalere og panelovner, men også veldig mye forskjellig «ute i verden».
Ved utgangen av 2022 forventes det at antallet enheter som er koblet til internett vil nærme
seg 30 milliarder. Alle disse tingene både genererer og bruker data på en eller annen måte.
Pallene som frakter dagligvarene dine til butikken og til og med åkrene til norske bønder er
bare to eksempler på ting som nå kobles på nettet – og altså blir del av tingenes internett
(også kjent som Internet of Things eller IoT).
Hva er tingenes internett?
Veldig enkelt forklart er tingenes internett altså et nettverk av fysiske ting og sensorer som er
koblet til internett. Disse tingene kan være nærmest hva som helst, for eksempel «smarte»
kaffemaskiner, strømadaptere, PC-er, mobiler, klokker, biler, trafikklys, vindmøller,
basestasjoner eller for den saks skyld brikker folk har sydd inn i kroppen. Tingene er
identifiserbare, har sensorer og kalles gjerne IoT-enheter.
Sensorene sender fra seg data via et nettverk, som regel internett. Når dataene er bearbeidet,
kan enhetene potensielt få den prosesserte informasjonen tilbake. Enhetene kan sende
informasjon til hverandre, men også utveksle informasjon med alt annet som er koblet til det
samme nettverket. Mennesker kan få tilgang til dataene for eksempel gjennom at de lagres i
datasett. Dataene kan være informasjon om forbruk, handlinger, kjennetegn, atferd, tilstand
og annet.
Hva brukes tingenes internett til?
Enhetene som kobles opp mot internett er ikke nødvendigvis så spennende alene. Men i
kombinasjon med andre teknologier kan dataene utnyttes til nye og spennende tjenester som
utgjør en forskjell. Et enkelt eksempel er at en kan installere bevegelses- og
temperatursensorer i næringsbygg for å regulere inneklimaet og sørge for at belysning og
oppvarming ikke står på unødvendig.
Verdien ligger ikke minst i at enhetene samlet sett kan generere store datasett som i neste
omgang kan analyseres og for eksempel kan fôres inn i maskinlæringsalgoritmer (modeller),
slik vi nettopp lærte om.
Innsiktene vi kan få gjennom å analysere slike data kan igjen gjøre at næringslivet og det
offentlige (og vi som privatpersoner) kan ta bedre beslutninger, effektivisere prosesser og
løse oppgaver på et sikrere faktagrunnlag.
Tingenes internett, i kombinasjon med stordata, maskinlæring og andre teknologier, legger
grunnlaget for eksempel for smarte byer, smartere transportløsninger, smartere bygg, også
videre.
Her er det et åpenbart tankekors: når «alt» rundt oss er koblet til internett og genererer og
samler inn data, blir det et spørsmål om hvordan dataene behandles. Kan vi være helt sikre på
at alle aktørene som har tilgang til dataene våre opptrer moralsk og behandler dataene etisk?
Neppe. Med stadig flere IoT-enheter i omløp, blir det også enda viktigere at vi skaffer oss så
god oversikt som mulig over hvilke data vi gir fra oss, hvor de havner – og hva vi kan gjøre
for å begrense det vi gir fra oss.
Når flere ting er koblet på nettet, er det også flere innganger for cyberkriminelle som kan
bruke det som en inngangsbillett inn på et nettverk eller for å ta kontroll over enhetene til
såkalte DDoS-angrep – for å nevne noe.
Derfor er også sikkerhet veldig viktig i denne sammenhengen. Det vil vi straks se nærmere
på, i neste seksjon. Men først skal vi se på én teknologi til som er avhengig av data, nemlig
digitale tvillinger.

Digitale tvillinger
Konseptet digitale tvillinger har vi allerede møtt på, da vi snakket om din digitale skygge i
første kapittel.
Som vi var inne på der, er digitale tvillinger digitale modeller av noe som finnes i
virkeligheten – det være seg fysiske objekter, steder, systemer eller mennesker. En annen
måte å se på det er at det er en simulering av det som skjer i et system, en prosess eller en
gjenstand.
Det er greit å poengtere at det her ikke er snakk om en bestemt teknologi, men snarere en
måte å anvende teknologi. Den digitale tvillingen kan være basert på beregningsmodeller,
maskinlæringsalgoritmer, sensordata og andre data.
Se på det som at det er en måte å samle all data du har om en prosess eller en gjenstand, slik
at du kan bruke disse til for eksempel å overvåke hva som skjer – og å forutsi hva som vil
komme til å skje.
Hvordan fungerer digitale tvillinger?
Den grunnleggende ideen bak digitale tvillinger er som følger:

 Du har en (tenkt eller reell) gjenstand eller prosess som du er interessert i å observere,
optimalisere, gjøre tester på, forutsi atferden til eller lignende
 Du lager en form for virtuell, digital representasjon av denne
 Ofte vil du knytte den virkelige gjenstanden eller prosessen sammen med den digitale
tvillingen i form av at data samles inn fra gjenstanden/prosessen (for eksempel via
sensorer) eller utveksles og går begge veier (IoT-enheter)

Ofte kan tvillingen altså ta i mot data fra det aktuelle objektet, prosessen eller systemet. Det
vil utgjøre et grunnlag for den digitale tvillingen slik at tester, simuleringer og
tilstandsovervåking langt på vei kan gjøres på den digitale tvillingen i stedet for den virkelige
tingen, med oppdaterte data.
I industrien brukes dette til å optimalisere produksjon og effektivisere drift, for eksempel
kjøre tester uten å avbryte driften, eller simulere mulige utfall for å ta bedre valg og
optimalisere prosesser. Med andre ord både spare penger – og redusere belastningen på klima
og miljø.
Digitale modeller av fysiske ting er på ingen måte noe nytt. Men det at en digital tvilling
utnytter data fra den fysiske verden til analyse – ofte ved hjelp av maskinlæring – gjør at
tvillingen hele tiden lærer av de virkelige objektene, gjerne i sanntid.
Hva brukes digitale tvillinger til?
Kraftbransjen er blant dem som bruker digitale tvillinger flittig. For eksempel mater Statnett
digitale tvillinger med sanntidsdata om strømforbruket i Norge for å sikre at de får levert
strøm. Nettselskapene trenger også gode modeller for å regulerer et marked som kan være
svært uforutsigbart, slik at de kan ta bedre beslutninger.
Teknologien kan også brukes i utviklingen av fysiske gjenstander: Ved å bruke en digital
tvilling i arbeidet med prototyping, kan du kjøre tester virtuelt – og unngå utfordringer og
kostnader knyttet til fysiske prototyper. Bilprodusenter bruker for eksempel sensordata fra
biler ute på veien for å utvikle alt fra bedre selvkjøringsteknologi til batterisparing og bedre
veigrep.
Det er ikke bare store virksomheter som vil kunne dra nytte av å bruke digitale tvillinger. Se
for deg at du selv kan spare strøm ved å kjøre simuleringer for forbruket i boligen din. Da kan
du se hvordan rutiner og planer påvirker strømbruken, og legge til variabler som for eksempel
utendørstemperatur for å ta mer kostbesparende valg.
Teknologien brukes også av forskere, for eksempel innen klima og miljø. Her kan en lage
digitale tvillinger av naturlige økosystemer, av havet eller av den saks skyld hele verden, for
eksempel for å overvåke og simulere ulike scenarier rundt for eksempel ekstremvær,
lysforurensning og global oppvarming.
For å oppsummere kan vi si at digitale tvillinger er en god måte å sørge for at vi virkelig drar
nytte av blant annet simuleringer, modellering, beregning, tingenes internett og
datastrømming (som du vil lære mer om i senere kapitler). Det er også et godt verktøy å ta i
bruk sammen med kunstig intelligens.

Oppsummering

Kunstig intelligente systemer, tingenes internett og digitale tvillinger er blant de viktigste


teknologiene og trendene som er avhengig av data. Strengt tatt er dette ikke distinkte
teknologier, men kategorier som kombinerer flere digitale teknologier og teknikker for ulike
bruksområder.
Når vi snakker om kunstig intelligens, handler det som oftest om maskinlæringsalgoritmer.
Dette er modeller utviklet fra treningsdata som skal løse bestemte oppgaver, og som gjennom
videre trening med flere og ferskere data potensielt vil løse oppgavene bedre og mer effektivt.
Tingenes internett betegner et nettverk av fysiske ting og sensorer som er koblet til internett.
Disse kan generere store datasett som kan analyseres, og for eksempel fôres inn i
maskinlæringsalgoritmer.
Til slutt så vi på digitale tvillinger – modeller av gjenstander eller prosesser som vi kan bruke
til blant annet simuleringer, overvåking og beregning, i et digitalt miljø.

Sikkerhet
Med all denne teknologien – ny så vel som gammel – er det gitt at det følger med betydelige
risikoer.

Mange av oss har en venn eller kollega som har tofaktorsautentisering på alle kontoer, som
tar seg tiden til å skru av nettsiders mulighet til å samle inn cookies og nekter plent å bruke
ukrypterte meldingstjenester. Eller kanskje nettopp du er den som andre rundt deg oppfatter
som litt vel paranoid når det kommer til digital sikkerhet?
Disse tingene er ikke paranoia. Selv om du ikke har en hemmelig elsker eller sitter på
statshemmeligheter, ville du neppe vært komfortabel med å gi fra deg passordet til e-posten
din, eller å gå rundt med en mikrofon som lar andre høre alt du sier og gjør. Da bør du heller
ikke ta for lett på din digitale sikkerhet.
Vi har allerede snakket om de mange ulike måtene vi genererer og gir fra oss data, samt faren
for at andre – kanskje med egoistiske eller umoralske hensikter – kan utnytte det. I denne
seksjonen skal vi se nærmere på hva datasikkerhet dreier seg om.
Ettersom hverdagen vår hele tiden blir mer digital, er det vel så viktig å stadig øke
bevisstheten rundt farene som ligger iboende i teknologiene vi benytter oss av.
Vi skal blant annet se nærmere på definisjonsforskjellene mellom cybersikkerhet,
informasjonssikkerhet og IKT-sikkerhet, noe som er nyttig å ha i bakhodet når du tar ulike
sikkerhetstiltak.
Videre skal vi lære litt mer om ondsinnet programvare, også kjent som skadevare og
malware. Og vi vil også se på sikkerhet fra et brukerperspektiv: Både som privatperson og
som ansatt i en organisasjon er det viktig med tiltak for å sikre seg mot datainnbrudd og
misbruk av egne kontoer.

Hva innebærer digital sikkerhet?


Når du tenker på cyberangrep, tenker du kanskje på angrep som rammer store organisasjoner
og virksomheter, fra Stortinget til Hydro. Som ansatt i en bedrift, liten eller stor, er det også
viktig å være bevisst på personvern og datasikkerhet – som henger tett sammen.
Men tro ikke at du som privatperson ikke er attraktiv for cyberkriminelle. Utviklingen de
siste årene viser at ID-tyveri, digital svindel og andre typer for sikkerhetsbrudd i stadig
økende grad rammer privatpersoner.
Personvern har vi allerede hørt mye om. Det kan defineres som «retten til et privatliv og
retten til å bestemme over egne personopplysninger», ifølge Datatilsynet. Det å sikre privatliv
når vi har data i ulike databaser, for eksempel for offentlige tjenester, handler jo blant annet
om at data må sikres – at de ikke skal kunne komme på avveie eller at uvedkommende har
tilgang på dem.
Cybersikkerhet, informasjonssikkerhet og IKT-sikkerhet
Her er det altså mye å tenke på, så la oss ta et skritt tilbake. Vi kan skille mellom begrepene
cybersikkerhet, informasjonssikkerhet og IKT-sikkerhet. Alle disse er knyttet til data, og
derfor til datasikkerhet. Begrepene har en del overlapp, men også ulikheter.
Cybersikkerhet (eller kybersikkerhet, som noen skriver på norsk) betyr sikkerhet mot
uønskede hendelser over et nettverk, da først og fremst internett. Begrepet «cyber» knytter
seg altså til internett – ikke dataene som utveksles, men tjenestene, systemene, menneskene
og infrastrukturen som muliggjør internett. Et cyberangrep kan for eksempel sette utstyr ut av
spill, uten at det direkte er relatert til et ønske eller en plan om å få tilgang til eller å stjele
data. Et slikt angrep vil likevel kunne ha ringvirkninger for dataene våre, for eksempel ved at
vi nektes tilgang til dem.
Beskyttelsen av faktiske data faller inn under begrepet informasjonssikkerhet. Her er det altså
snakk om å beskytte informasjonen, som kan være både digitale og analoge data, altså både
data som lagres og overføres med og data som lagres og overføres uten bruk av IKT. For
dette kurset er det som vi har vært inne på dataene som lagres og overføres med IKT som er
de mest relevante. I sammenheng med informasjonssikkerhet kan vi tillate oss å bruke
informasjon og data tilnærmet synonymt, siden informasjon kan sies å være det samme som
data som tillegges en mening eller betydning. Informasjonssikkerhet dreier seg ofte om
rutiner og prosesser mer enn det handler om konkrete verktøy – altså, for å si det enkelt,
hvem som tildeles en nøkkel fremfor hvordan låsemekanismen fungerer.
I skjæringspunktet mellom cybersikkerhet og informasjonssikkerhet finner vi IKT-sikkerhet.
IKT står for informasjons- og kommunikasjonsteknologi – og omfatter kort sagt alt som har
med datamaskiner og nettverk å gjøre. IKT-sikkerhet vil dermed si beskyttelse av de ulike
teknologiske systemene (IKT-systemene) som lagrer, prosesserer og overfører digitale data.
Endringer på grunn av digitalisering
Mer og mer informasjon blir lagret på internett, i nettskyen. Det gjelder både organisasjoner
og privatpersoner sine data. Dette er noe som igjen gir et endret digitalt trusselbilde.
Nettverksteknologier som 5G og Narrowband IoT (NB-IoT) har også gjort det enda enklere
enn før å koble sammen alle tenkelige enheter over nettet, alt fra smartklokker til sensorer
som kobles på strømmaster eller settes ute i en åker. Ikke minst vil smarte byer – som på et
vis kan tenkes på som byer med digitale tvillinger – i økende grad bli en realitet. «Alt» i
bybildet blir påkoblet og det blir utvekslet og analysert store mengder data. Alle disse tingene
gjør oss også sårbare på nye måter, der for eksempel anonyme aktører kan utøve skade mot
kritisk infrastruktur, både hos stat og virksomheter.
Enda et moment her er det at digitaliseringen – av årsaker som vi snakket mye om i første
kapittel – har gjort oss stadig mer avhengig av kommersielle aktører, som da får økt
innflytelse i stort og smått.
Dette er ting som bør tas, og blir tatt, på alvor – alt dette inngår i PSTs nasjonale
sikkerhetsvurderinger.
Sikkerhet i organisasjoner
Når det gjelder sikkerhet i organisasjoner har ansvaret tradisjonelt vært hos IT-avdelingen.
Men når det oppstår skade som følge av sikkerhetshendelser, det vil si et sikkerhetsrelatert
avvik som ikke bare kan oppstå grunnet dataangrep, men også grunnet teknisk feil eller feil
bruk av et system, ligger det juridiske ansvaret hos ledelsen, og eventuelt styret i et
aksjeselskap.
For ledelsen handler det om å vurdere trusselbildet og risikoen for å bli rammet, samt å
estimere kostnaden som kan følge av et sikkerhetsbrudd. For IT-avdelingen handler det om å
gjøre mer tekniske tiltak for å forsøke å forhindre sikkerhetshendelser. Gjennom
sikkerhetstiltak skal organisasjoner sørge for kontinuitet og forsøke å minimere skaden som
potensielt følger av sikkerhetshendelser.
Det er kanskje fælt å si, men også sant, at den største sikkerhetsrisikoen for en bedrift er deres
egne ansatte. Det er derfor veldig viktig å jobbe med de ansattes bevissthet og holdninger.
For å si det enkelt: Det er veldig mye vanskeligere å hacke seg inn i et godt sikret datasystem,
enn å få noen til å gi deg nøkkelen (påloggingsinformasjon).
Informasjonssikkerhet
Vi husker fra tidligere at informasjonssikkerhet handler om beskyttelse av informasjon og
dermed også av elementer som er essensielle for lagring, prosessering, presentasjon og
overføring av informasjon.
Det er viktig for en organisasjon å ivareta og sikre konfidensialitet, integritet og
tilgjengelighet for dataene sine. Samlet er disse sikkerhetstemaene kjent som KIT-triaden
(engelsk: CIA triad).
Konfidensialitet handler om å holde data utilgjengelig for uvedkommende. Dette kan gjelde
både data som er lagret på en datamaskin (for eksempel i en database) og data som er under
overføring (for eksempel via internett). Kryptering er et tiltak for å sikre konfidensialitet.
Integritet handler om å holde dataene korrekte, altså å sikre at de ikke endrer seg utilsiktet
eller på grunn av en trusselaktør. Her kan man, i tillegg til å gjøre tiltak for å ivareta
sikkerhet, blant annet sjekke dataene mot andre registre og systemer. Det er ulike grunner til
at data kan endre seg utilsiktet, for eksempel feil på lagringsmediet eller at en bruker gjør
endringer uten å mene det.
Tilgjengelighet handler om at man må få tilgang til data når man trenger dem.
Tjenestenektangrep, også kjent som DDoS-angrep (Distributed Denial of Service) er en type
dataangrep som kan gjøre dataene midlertidig utilgjengelig fra internett. Det dreier seg ofte
om at mange samkjørte datamaskiner forsøker å overbelaste et system som tilbyr data, slik at
det ikke lenger har nok ressurser – som prosesserings- eller overføringskapasitet – til å
håndtere alle forespørslene. Resultatet er at mange brukere ikke får logget inn eller sett
innholdet.
Merk at brudd på IKT-sikkerhet og cybersikkerhet også vil kunne gå ut over konfidensialitet,
integritet og tilgjengelighet.
IKT-sikkerhet
IKT-sikkerhet omfatter, slik vi har sett tidligere, beskyttelse av de teknologibaserte
systemene som lagrer, prosesserer og overfører data.
Også her er KIT-triaden relevante temaer. Vi kan også nevne ytterligere fire tema som
spesielt er relevante for IKT-sikkerhet: autentisering, autorisering, auditering og forpliktelse.
Autentisering, i denne sammenheng, handler om at du skal kunne identifisere hvem du
kommuniserer med.
Autorisering vil si å gi riktige tilgangsrettigheter til en person for ulike ressurser i et system.
Det kan f.eks. dreie seg om filer og databaser, som igjen inneholder data. Det er ledelsen i en
organisasjon som bestemmer tilgangene, og som regel IT-avdelingen som iverksetter dem
teknisk. I praksis vil autorisering være avhengig av autentisering, altså at systemet i første
omgang vet hvem brukeren er.
Auditering (fra engelsk «audit»; å revidere) handler om kontinuerlig sporing av brukerens
handlinger på systemet, for eksempel gjennom loggfiler. Eksempelvis kan det være å se om
det har vært forsøk på dataangrep eller for å identifisere misbruk av et system.
Forpliktelse (også kjent som ikke-nekting; non-repudiation) handler om å unngå at en annen
part kan trekke seg fra ansvaret for en digital handling. Det kan for eksempel være relevant i
forbindelse med netthandel eller bruk av nettbank.
Det er også verdt å ta med at KIT-triaden er eksplisitt tatt med i GDPR. Det samme er
nødvendigheten av tekniske og organisatoriske tiltak knyttet til personopplysninger. Det kan
være lurt å huske på at ansvar knyttet til datasikkerhet også er forankret i lovverk – det er
ikke bare noe som er «lurt å gjøre».
Grunnprinsipper for IKT-sikkerhet
Det kan være vanskelig for mange bedrifter og virksomheter å vite hvor de skal starte med
IKT-sikkerhet. Derfor har Nasjonal sikkerhetsmyndighet fastslått noen grunnprinsipper for
IKT-sikkerhet for å gi noe å rette seg etter. Ved å følge disse kan bedrifter, selskaper og
organisasjoner sikre systemer mot skade, misbruk og uautorisert tilgang.
Vi skal ikke gå i dybden på disse her, men overordnet handler det om:

 Å identifisere strukturer for styring, IKT-systemer (inkludert enheter og programvare)


og brukere. Forstår du tjenestene og leveransene til bedriften, har du bedre oversikt
over de teknologiske ressursene som må sikres. Dette er gjør det mulig å effektivt ta i
bruk de andre prinsippene.
 Beskyttelse og opprettholdelse av sikre IKT-systemer. Det er kanskje opplagt: Sikring
av IKT-systemer skal begrense skade fra dataangrep – også over tid. Disse
prinsippene tar for seg blant annet sikkerhet i anskaffelse, planlegging, bygging og
konfigurering for IKT-systemene.
 Oppdaging av sikkerhetstrusler og sårbarheter. Disse prinsippene handler blant annet
om å etablere sikkerhetsovervåkning og sikkerhetstesting, analyse av overvåkingsdata
og å fjerne kjente sårbarheter og trusler.
 Planer for å håndtere og gjenopprette systemer etter en sikkerhetshendelse.
Prinsippene i denne kategorien handler om å få på plass aktiviteter for å håndtere
sikkerhetshendelser, samt aktiviteter relatert til arbeidet med å gjenopprette
normaltilstand og lære av sikkerhetshåndteringen dersom en sikkerhetshendelse skulle
oppstå.

Hvordan blir vi angrepet?


Vi har gått gjennom hva digital sikkerhet innebærer. Men hvordan blir bedrifter og
virksomheter, så vel som privatpersoner, egentlig angrepet?
De mest vanlige cyberangrepene som rammer norske virksomheter er virus og ondsinnet
programvare (også kjent som skadevare og malware), og phishing eller sosial manipulasjon. I
tillegg er kartleggingsaktivitet (der aktører jakter sårbarheter og samler informasjon for å
målrette angrep) og digital utpressing på fremmarsj, skriver Nasjonal sikkerhetsmyndighets i
rapporten Risiko 2022.
Ifølge den siste Mørketallsundersøkelsen fra Næringslivets sikkerhetsråd, kostet en alvorlig
sikkerhetshendelse i snitt 85.000 for en bedrift i 2020.
Årsaken til sikkerhetshendelsene kan være mange og sammensatte, men norske virksomheter
oppgir selv at det ofte skyldes uflaks eller tilfeldigheter, menneskelig feil, manglende
sikkerhetsfokus blant de ansatte – og at gjeldende prosesser ikke blir fulgt. Som vi ser er
mennesker en fellesnevner med tanke på disse årsakene.
Til tross for at norske virksomheter, og nordmenn generelt, stadig blir mer bevisste digitale
trusler, er det, ifølge NSM, fortsatt slik at det generelle IKT-sikkerhetsnivået både i det
private og offentlige er for lavt. Det utnytter trusselaktørene til mål som opportunistisk
vinning, spre desinformasjon, overvåke og skade infrastruktur.
La oss se nærmere på ulike cyberangrep-metoder.
Ondsinnet programvare (skadevare/malware)
Ifølge Store norske leksikon er skadevare en samlebetegnelse på programkode som uten
brukerens tillatelse utfører handlinger med brukerens systemer eller informasjon. Det finnes
mange forskjellige typer skadevare. Dataormer, trojanere og virus er blant de meste kjente.
Det å spre skadevare kan brukes til å utøve ulik kriminalitet på nett. For eksempel
datainnbrudd, spionasje, og økonomisk vinningskriminalitet knyttet til løsepengevirus (se
faktaboks).
Spredning av skadevare skjer ofte gjennom masseutsendelse eller personalisert e-post, det vil
si såkalt phishing eller spear-phishing, eller gjennom websider som har vært utsatt for
dataangrep.
Eksempel: Løsepengevirus
I de siste årene har det vært en del høyt profilerte sikkerhetshendelser som har rammet ulike
aktører og ulik digital infrastruktur. Ikke minst angrep som løsepengevirus.
Løsepengevirus (også kjent som ransomware) er en type virus som gjør at ressurser som filer
og mapper på en datamaskin blir låst. De som står bak virusene krever løsepenger for å åpne
opp disse ressursene igjen. Ofte er det snakk om at ressursene blir kryptert og eieren må
betale for å kunne dekryptere dem.
Hydro ble for eksempel rammet av et slikt angrep i 2019. Selv om produksjonen stort sett
kunne gå som normalt var de avhengig av manuelle prosedyrer og manuell drift under
angrepet. Det er også krevende kartlegge og fjerne disse virusene. Hydro anslo selv at
angrepet kostet dem 800 millioner norske kroner.
Colonial Pipeline-angrepet i USA i 2021 var enda mer dramatisk. Her gjorde løsepengevirus
at flyt av diesel og bensin i en viktig rørledning i USA stoppet helt opp. Det var mulig
ettersom driften er svært digitalisert. Dette er blitt beskrevet som et av historiens mest
betydelige angrep på nasjonal infrastruktur.
Et tredje eksempel er et angrep mot svenske Coop, også i 2021. Coop brukte da, i likhet med
mange andre, programvaretjenester fra en tredjepart, Kaseya. Det var Kaseya som ble
angrepet og avkrevd flere hundre millioner løsepenger. For Coop betydde dette at
betalingssystemene deres ble låst og at butikkene deres måtte stenge i flere dager til Kaseya
fikk håndtert angrepet.
Virus og trojanere
To andre vanlige angrepstyper du kanskje har hørt om er virus og trojanere.
Enkelt forklart er et virus programkode som blir lagt inn i en eksisterende programfil – også
kalt en vert. Navnet kommer naturligvis fra biologien, og digitale virus har mye til felles med
de vi kjenner fra virkeligheten.
Viruset kopierer seg inn i andre filer på datamaskinen når programfilen kjøres, og sprer seg
videre til andre maskiner når de infiserte programfilene deles. Som regel spres virus gjennom
e-poster, filnedlasting, sosiale medier og minnepinner, og det finnes også virus som selv
sender ut e-poster med infiserte filer og dermed bidrar til at filene blir delt videre.
En trojaner (eller trojansk hest), og er et program som skjuler seg i et legitimt program, og
dermed blir installert uten at brukeren vet om det. Som regel følger det med programmet ved
nedlasting og installasjon, for eksempel gjennom fildelingsklienter og nettlesertillegg.
Kriminelle kan gå inn på datamaskinen gjennom dette programmet og gjøre uønskede
handlinger, som å stjele informasjon og overføre penger. Her sier vi at det skapes en bakdør
på datamaskinen. Via en slik bakdør kan de cyberkriminelle potensielt melde datamaskinen
inn i bot-nettverk, altså et nettverk av virusinfiserte maskiner, som igjen kan brukes til å
sende ut spam, tjenestenektangrep og andre typer dataangrep – uten at eieren av
datamaskinen vet om det.
Eksempel: Dataormer og fjerntilgang
Noe mange har hørt om er det som kalles en dataorm. Det er altså en type virus – forskjellen
er at en dataorm ikke er avhengig av en vert for å spre seg. Kort forklart er dataormer
programvare som tar seg inn i et system ved å utnytte spesifikke sikkerhetssvakheter. Deretter
leter ormen etter tilkoblede maskiner og systemer. Hvis den finner en ny svakhet formerer
den seg og infiserer det nye systemet.
Dataormen som fikk navnet Stuxnet gjorde i 2010 at noen fikk tilgang til styringssystemer
ved et atomanlegg i Iran. Det ble da gjort stor skade på atomsentrifuger. Det har aldri blitt
offisielt bekreftet, men det er en bred oppfatning om at det sannsynligvis var USA og Israel
som stod bak.
Det siste eksempelet omhandler fjerntilgang. Det betyr at man kan logge seg på systemene
uten å være der fysisk. I en hendelse i USA i 2019 skal en tidligere ansatt angivelig ha brukt
fjerntilgang til å få tilgang til et vannforsyningssystem. Han skal gjennom fjerntilgangen
angivelig ha tuklet med prosessene vannsystemet bruker for å rense og desinfisere
drikkevannet. Her er det enkelt å se for seg at tredjeparter kan ta fysisk skade som følge av
angrepet.
Med eksempler som dette og Colonial Pipeline-hackingen er det ikke vanskelig å se for seg
mulige farer i smarte byer og digitale samfunn der det meste styres sentralt.
Phishing og sosial manipulering
Du har helt sikkert sett det selv: Du mottar en e-post eller melding som later til å være fra en
mer eller mindre seriøs aktør, som ber deg klikke på en lenke – enten for å løse ut en premie,
dra nytte av et eksklusivt tilbud eller for å motta en forsendelse. Klikker du på lenken må du
oppgi personlige opplysninger eller skrive inn betalingsinformasjon.
Dette er phishing. Hensikten er å loppe deg for sensitiv informasjon eller å spre skadevare.
Trusselaktørene som benytter seg av phishing henvender seg ikke bare til deg som
enkeltperson – i stedet baserer de seg på masseutsendelser av meldinger og satser på at noen
biter på.
De lurer deg til selv å gi fra deg data de kan bruke til vinning eller annen kriminalitet, for
eksempel identitetstyveri.
I så måte benyttes sosial manipulasjon i phishing og mange andre former for svindel og
cyberkriminalitet. Mer generelt betyr sosial manipulering å «benytte psykologiske
virkemidler for å gjøre angrep mot brukere av IT-systemer», ifølge Store norske leksikon.
Ved å spille på følelser som frykt, grådighet og nysgjerrighet – gjerne i kombinasjon med
korte tidsfrister – prøver svindlerne å få deg til å gi fra deg kontoinformasjon, passord,
personnummer og andre sensitive opplysninger. De utgir seg gjerne for å være en aktør du
kjenner til og stoler på, og ofte kan e-postene og meldingene virke veldig troverdige.
Det er enkelt å tenke at du ikke vil klikke på lenker i en e-post som sier du har vunnet en ny
iPhone som du må løs inn i løpet av 24 timer. Men når e-posten ser ut til å være fra sjefen
eller banken din, kan det være verre å skille svindel fra god fisk.
Nettopp henvendelser som tilsynelatende kommer fra sjefen din, eller andre i ledelsen der du
jobber, er en stadig mer utbredt form for angrep gjennom sosial manipulasjon. Dette kalles
direktørsvindel.
Et slikt angrep kan være svært forseggjort og utspekulert: Svindlerne kan ha studert hvordan
sjefen vanligvis ordlegger seg – og kanskje til og med «stjålet» stemmen deres, som gjengis i
en telefonsamtale ved hjelp av såkalt deepfake-teknologi. Svindlerne vil da typisk komme
med en henvendelse som haster veldig, og som ikke rekker å gå gjennom de normale
kanalene, for eksempel å hasteoverføre en større sum penger til en «kunde» … som selvsagt i
realiteten er svindlernes bankkonto.

Slik sikrer vi oss


Sikkerhet og personvern henger sammen, og her er informasjonssikkerhet spesielt viktig.
Husk de tre komponentene i KIT-triaden – konfidensialitet, integritet og tilgjengelighet – som
alle er viktige å ivareta både i forretningssammenheng og som privatpersoner.
Vi har nevnt at Nasjonal sikkerhetsmyndighet beskriver IKT-sikkerheten i norske
virksomheter som lav – men at bevisstheten rundt viktigheten av robust infrastruktur stadig
blir bedre.
Menneskelige feil og tilkortkommenhet ofte er en inngang som brukes av cyberkriminelle.
Derfor er det svært viktig at hver og en av oss vet hvilke grep vi kan ta for å sikre oss. Selv
om datasikkerhet kan virke svært komplisert og uoversiktlig, er det nemlig mange relativt
enkle forholdsregler vi kan ta for å begrense mengden data vi gir fra oss og for å beskytte
dataene våre bedre.
Kryptering
Kryptering vil enkelt sagt si å stokke om data til det ugjenkjennelige. Bare de som har den
hemmelige nøkkelen kan sette dem sammen igjen i riktig rekkefølge. Selv om noen andre
skulle få tak i filene, vil de ikke kunne lese eller endre dem – for det vil fremstå fullstendig
usammenhengende og meningsløst.
Kryptering gjøres vanligvis ved bruk av en kjent krypteringsalgoritme og en hemmelig
krypteringsnøkkel – data låses slik at de ikke kan leses av dem som ikke har nøkkelen.
Gjennom kryptering og å ikke dele nøkkelen med uvedkommende kan du opprettholde
konfidensialitet og integritet for informasjonen.
I noen tilfeller, hvis du blir utsatt for et løsepengevirus for eksempel, brukes kryptering mot
deg. Selv om dataene fortsatt ligger på maskinen din, er de blitt uleselige og ubrukelige for
deg fordi noen utenforstående har kryptert dem, og du mangler nøkkelen. Angriperne vil
kreve løsepenger for å låse dem opp igjen.
Derfor lønner det seg å ha backup av filene flere steder, som på en ekstern harddisk utenfor
angriperens rekkevidde.
To former for kryptering: Symmetrisk og asymmetrisk
Data obfuscation
Et begrep som kanskje ikke er like utbredt, men som likevel er greit å kunne, er data
obfuscation (obfuscation kan oversettes som tilsløring). Det viser til å erstatte sensitiv
informasjon med data som fremstår som ekte, men som i realiteten er ubrukelig for
uautoriserte. Dette står i kontrast til kryptering, som er en metode for å gjøre data fullstendig
uleselige.
Det går også an å maskere informasjonen med data av en lignende struktur. Når data
maskeres endres verdiene, for eksempel ved å bytte tall med bokstaver eller erstatte ord.
Man kan også erstatte data med meningsløse verdier og kreve at autoriserte brukere benytter
seg av en tilknyttet «token» for at de skal gi mening. Dette kalles data tokenization.
Hensikten med data obfuscation er å gjøre det mulig å dele personlig og sensitiv informasjon
uten at dataene kan misbrukes av andre. Slik kan en virksomhet opprettholde prosessene sine
uten å utsette seg for risiko, for eksempel.
God passord-hygiene
Du har garantert hørt det uhyre mange ganger tidligere, men det er en grunn til det. Jevnt over
er mange fortsatt for slappe når det gjelder passord, noe som kan utgjøre en betydelig
sikkerhetsrisiko hvis de dårlige vanene tas med til arbeidsplassen. Med dårlig passord-
hygiene går man seg selv til et lettere offer for cyberkriminelle.
Forholdsreglene for god passord-hygiene er enkle:

 Ikke bruk samme passord på flere nettsider


 Ikke bruk passord som andre kan gjette seg frem til
 Ikke del passord med noen
 Ikke lagre passord i nettleseren
 Bruk tofaktorautentisering der det er mulig

I tillegg til å ha unike, sterke passord er tofaktorautentisering (eller multifaktorautentisering)


et av de aller viktigste passord-grepene du kan ta. Dette alene vil stoppe de aller fleste forsøk
på å få tilgang på kontoene dine.
Dette gir nemlig et ekstra sikkerhetsnivå for innlogging, fordi du i tillegg til passordet må
oppgi en engangskode. Denne genereres gjerne av en ekstern app og er bare tilgjengelig i et
begrenset tidsrom. Noen ganger brukes ikke en slik tidsbegrenset kode, men for eksempel at
du må bekrefte at det er deg via en annen app. Innlogging med BankID er også en form for
multifaktorautentisering.
Grunnen til at du ikke bør bruke «Husk passord»-funksjonaliteten mange nettsider tilbyr, er at
passordene ikke nødvendigvis vil være tilstrekkelig sikret. Andre som bruker maskinen vil
potensielt kunne se de lagrede passordene. Og er du uheldig å få et virus eller annen
skadevare på datamaskinen, er det en mulighet for at programvaren vil få tilgang til
passordene.
I stedet kan det være lurt å bruke en passord-manager for å holde styr på all
innloggingsinformasjonen din. En passord-manager er en tjeneste som kan generere og lagre
sterke passord på en trygg måte, der alt du må huske er et enkelt meget sterkt masterpassord
for å få tilgang til hvelvet ditt.
Slike tjenester kan generere sterke, unike passord for hvert eneste nettsted, og flere av dem
tilbyr flere sikkerhetsfunksjoner – som varsler om datainnbrudd på steder der du har en
konto, varsler om gjenbrukte passord, og potensielt også støtte til håndtering av to-
faktorkoder.
Husk at når du gjenbruker passord, og det blir gjort tilgjengelig et sted – for eksempel ved at
en nettside blir hacket og brukernavn og passord gjøres tilgjengelig på en online
markedsplass – kan de som får tilgang til passordet bruke det veldig mange andre steder også.
Sikkerhetstiltak-huskeliste
Her er noen viktige tiltak du kan ta for å sikre seg mot datainnbrudd og misbruk av egne
kontoer. Det er gjerne IT-avdelingen som tar seg av mye av dette i virksomheten din, og
sørger for at disse tiltakene blir opprettholdt, men det er uansett relevant å kunne som ansatt
og privatperson.

Beskytt deg mot misbruk av svakheter i operativsystem og programvare på datamaskinen din


Hold operativsystemet og programmene oppdatert. Skru på automatiske oppdateringer slik at
du ikke glemmer det.
Avinstaller de programmene du ikke bruker lenger.
Ta i bruk brannmur og et antivirusprogram.
Se opp for e-poster
Se opp for e-poster som virker mistenkelige – og vær kritisk til hvilke lenker du trykker på.
Unngå å bruke åpne trådløse nettverk
Aller helst bør du unngå å bruke åpne – usikre – trådløse nett. Reiser du mye i
jobbsammenheng, vil mobilnettet typisk være et sikrere alternativ.
Det kan også være lurt å bruke VPN (engelsk: Virtual Private Network) – løsninger som
krypterer datatrafikken din. VPN-krypteringen kommer da i tillegg til annen kryptering som
har vært nevnt før, f.eks. i forbindelse med HTTPS. VPN gir et ekstra lag med beskyttelse, og
kan være spesielt aktuelt når man for eksempel bruker et åpent nettverk hvor man ikke har
kontroll med hvilke andre enheter og brukere som også er på nettverket. En viktig
forutsetning for trygg bruk av VPN er at man vet at man kan stole på VPN tilbyderen, det kan
for eksempel handle om VPN-tjeneste som tilbys av din virksomhet.
Pass på at nettsidene du besøker bruker HTTPS. Dette er en kommunikasjonsprotokoll som
bruker HTTP (som vi allerede har snakket om) i kombinasjon med en krypteringsprotokoll
for å hindre at uvedkommende får tilgang på dataene som utveksles. I nettleseren kan vi
typisk se om HTTPS er brukt ved å sjekke om det er en hengelås mot venstre i adressefeltet.
Unngå å jobbe med sensitiv informasjon på en datamaskin som ikke er din egen
Hvis du har måttet låne PC, bruker datamaskinene på et bibliotek eller lignende, er det viktig
at du logger ut av alle tjenester eller nettsider og sletter internettlogg, cookies og midlertidige
filer.
Pass på hvilken informasjon andre kan se hvis de kikker over skulderen din – såkalt
«skuldersurfing».
Sikre elektronisk utstyr med passord eller PIN
På mobilen bør du ha to-faktorautentisering aktivert.
Det kan også være aktuelt å kryptere data, for eksempel ved at harddisken krypteres.
Ikke glem den fysiske sikkerheten
Dette gjelder for eksempel å ikke låne vekk adgangskortet til arbeidsplassen, og å låse
skjermen slik at data ikke skal kunne komme på avveie når du er borte fra datamaskinen. Det
finnes eksempler på at kriminelle har fått tilgang til lokaler gjennom sosial manipulering.
Husk å ta sikkerhetskopier
Det vil være viktig om du eller arbeidsgiveren din blir utsatt for en sikkerhetshendelse, men
også om datamaskinen blir ødelagt eller komme på avveie.
Oppsummering

Når det gjelder digital sikkerhet er det tre viktige definisjoner å kjenne til: cybersikkerhet,
informasjonssikkerhet og IKT-sikkerhet.
Som vi har sett handler cybersikkerhet om å beskytte tjenester, systemer, mennesker og
infrastruktur knyttet til internett. Nå vi snakker om å beskytte dataene som utveksles over
internett, faller det under informasjonssikkerhet. I skjæringspunktet mellom disse, finner vi
IKT-sikkerhet – det vil altså si å sikre teknologibaserte systemer som lagrer, prosesserer og
overfører data.
Dette er viktig å kjenne til ettersom det digitale trusselbildet er stort og uoversiktlig. Vi må
derfor ha oversikt over hvordan vi kan bli angrepet – og hvordan vi sikrer oss mot truslene.

Slik samler vi inn data


Det finnes mange ulike metoder for å samle inn data. I utgangspunktet kan du observere,
notere og laste ned data fra ulike kilder og manuelt punche inn relevant informasjon i et
regneark. Dette er en grei fremgangsmåte om du for eksempel skal lage en enkel rapport.
I større datadrevne prosjekter, og for å virkelig utnytte dataens iboende potensiale, skal du
imidlertid ha ekstremt god tid og en knallhard tro på egen evne med tall – for ikke å snakke
om egen tålmodighet – for å jobbe på denne måten.
Som oftest tar vi derfor i bruk ulike teknologier, og gjerne kombinasjoner av disse for å
automatisere innhentingen av informasjonen vi trenger for å løse vårt problem. Vi kan ta i
bruk programvare for å samle og sortere digitale spor. Og vi kan bruke sensorer for å
registrere data fra den fysiske verdenen.
Samtidig kan vi plukke opp og «låne» data fra ulike kilder inn i våre egne systemer og
programmer ved å plugge oss på kildene via et API (som vi straks skal forklare hva er).
La oss ta en nærmere titt på disse metodene og datakildene:
Digitale spor
Som vi allerede har snakket om mange ganger i kurset, er bruken av digitale enheter i seg
selv en kilde til data – i form av for eksempel loggfiler og andre former for analysedata,
diagnostiske data og funksjonsdata som registreres av enhetene og datasystemene vi
interagerer med.
Når du scroller på en nettside, fyller inn et skjema, pauser en TV-serie eller tæpper
bankkortet blir interaksjonen registrert og lagret. Vi etterlater oss også digitale spor som blir
hentet fra sensorene i pulsklokker, informasjon fra treningsapper eller til og med kalenderen
vår. Det er disse sporene som skaper din digitale skygge, som vi snakket om i kapittel 1.
For eksempel på en nettside og mange mobilapper vil deler av den underliggende koden, som
typisk er skjult for brukeren, bestå av såkalte HTML-tagger. Mange av disse taggene lar oss
angi struktur og betydning for innholdet på nettsiden, men det finnes også tagger som gjør det
mulig å kjøre kode fra programmeringsspråket JavaScript. Slike tagger, i sistnevnte
betydning, kan sammen med JavaScript-koden la oss angi instruksjoner for hvilke data som
skal registreres og hva som skal gjøres med dem. Det kan da dreie seg om instruksjoner for å
sende data til et tredjeparts analyseverktøy, eller plassere en informasjonskapsel (cookie) på
brukerens datamaskin.
Verktøy som Google Analytics og Meta Business Manager (Facebook) gir deg for eksempel
en slik unik JavaScript-kodesnutt, omsluttet av en HTML-tag, som du kan legge inn på
nettsiden din for å samle inn og overføre data om nettsidens besøkende og deres handlinger
på nettsiden (f.eks. sideåpning og klikk). Slik bruk av HTML-tagger/JavaScript-kodesnutter –
spesifikt for å samle inn og sende data til eksterne analyseverktøy – er også kjent som page
tagging.
Det er mulig å samle svært mye data på denne måten – men det er også begrensninger for hva
slags digitale spor du har lov til å samle inn. Dette skal vi snakke mer om senere i kapittelet.

Eksempel:

Google Analytics
Google Analytics (GA) er et kraftig analyseverktøy som kan gi deg innsikt i hva som skjer på
nettsiden din og hvordan den blir brukt. Du kan se hvordan brukere oppfører seg på nettsiden,
hvor de er, hvilke nettsider de kommer fra, hva annet de har sett på, og hvor lenge de blir
værende.
Verktøyet kan for eksempel brukes for å finne ut om noen som handlet i nettbutikken din fant
produktet via søk, ble henvist fra sosiale medier, skrev inn adressen eller klikket på en
annonse.
For å forstå hvordan Google Analytics samler inn data, kan vi sette det i sammenheng med
dataenes livssyklus fra kapittel 1:

 Aktivitet og datainnsamling: Når du kobler Google Analytics til din nettside,


genererer verktøyet tagger som legges inn i nettsidens kode, og som deretter fanger
opp aktivitet på siden og samler inn data. Slik aktivitet kan være et kjøp, et
lenkeklikk, scrolldybde (hvor langt ned på en side du scroller) eller utfylling av et
skjema.
 Lagring: Dataene lagres og behandles på Google sine servere. Aktiviteten
anonymiseres (men kan under visse omstendigheter likevel være identifiserbar, noe
som gjør at lovligheten av å bruke GA i skrivende stund er oppe til vurdering hos
Datatilsynet).
 Analyse, visualisering, rapportering: GA vil automatisk sette opp en rekke
rapporter og visualiseringer du kan utforske. Disse kan både presentere innsikt i
sanntid og vise mønstre eller utvikling over tid. Du kan også lage egendefinerte
rapporter og hendelser/automatiseringer.

Handling, tiltak: Bare det å se på Google Analytics sine rapporter er ofte tilstrekkelig for å
gi deg datadreven beslutningsstøtte. Du kan også ta i bruk Google Analytics sine API-er for å
koble dataene opp mot dine egne systemer, og kanskje sammenstille de med interne data.
API-er
Hvordan vet Google Maps når neste bussavgang er? De har ikke lagret alle rutetidene på
serveren i sin. I stedet henter de oppdatert informasjon direkte fra kollektivselskapenes egne
datasystemer.
En spesiell type forbindelse mellom ulike datasystemer kalles et API – eller Application
Programming Interface, som er det engelske begrepet bak forkortelsen. Det oversettes til
programmeringsgrensesnitt. Et API er ikke et datasystem i seg selv, det er hverken en
database eller en server. Tenk heller på det som en bro der data kan bevege seg fra et
datasystem til et annet etter bestemte regler.
Nærmere bestemt kan vi her i kontekst av datautveksling definere et API som et sett med
regler som definerer hvordan et datasystem kan utveksle informasjon med et annet. I denne
konteksten er det en server som inneholder reglene for API-et og sørger for at det er
tilgjengelig, og en klient som faktisk bruker API-et. Det kan dreie seg om enten
enveiskommunikasjon av data fra server til klient, eller toveiskommunikasjon hvor klienten
også kan sende data til serveren.
Litt enkelt kan vi si at et API lar deg plugge andres data inn i ditt eget system, hvor du så kan
gjøre nytte av dem. Eller for å la deg hente ut og samle data fra flere av dine egne datakilder.
Data delt gjennom ulike API kan utnyttes samlet i program som tilbyr ny funksjonalitet – en
såkalt «mash up».
API-er er ofte selve motoren bak nettsteder og applikasjoner. Når du for eksempel søker etter
en flyreise på Finn.no eller i Finn-appen, er det API-er som henter data om flyavganger fra
mange forskjellige flyselskaper, i stedet for at Finn lagrer all informasjonen hos seg selv.
Akkurat som at Google Maps ikke lagrer all verdens rutetabeller.
Bruk av API-er ligger ofte også bak det som skjer når du trykker på en knapp i en nettside
eller app – for eksempel for å lagre en ny kontakt, eller for å hente fram listen med
kontaktene dine i en meldingsapp.

Fakta:

REST API
API-er på verdensveven følger som regel et rammeverk kalt Representational State Transfer,
eller REST, som legger en del begrensinger på programvarearkitekturen – slik at det blir
enklere å forutse hvordan API-et vil oppføre seg, og få ulike systemer til å fungere sammen.
REST er basert på HTTP-protokollen, med dens etablerte regler om forespørsel/respons, med
mer – slik at en klient kan forespørre data (heller enn websider) fra en tjener. Assosierte
filformat for returnerte data er gjerne JSON og XML.
Sensorer
Mens et API lar deg hente data fra andre digitale kilder, bruker vi sensorer for å samle data
ute i den fysiske verden.
Ordet har samme opphav som «sanser», og det er nettopp dét en sensor er: noe som lar
elektronikk «sanse» og registrere sine fysiske omgivelser.
Sensorer fungerer ofte i samspill med teknologi som lar oss lagre og/eller lese av dataene som
registreres. Et eksempel er det klassiske termometeret. Her er sensorteknologien kvikksølvet
som reagerer på varmen, mens teknologien som lar oss lese data er glasset og nummertavla
rundt.
I dag har vi digital sensorteknologi som lar oss måle alt fra avstand til trykk, fukt, bevegelser
og lys. I samspill med annen teknologi, for eksempel maskinlæring, muliggjør slike sensorer
alt fra panteautomater til datasyn (datasystemer som kan se og forstå omgivelsene sine ved
hjelp av maskinlæring), eller luftrensere som automatisk reagerer på, fører statistikk over og
forbedrer luftkvaliteten i et rom.
Som vi har snakket om tidligere er det en rekke sensorer for eksempel i mobiltelefonen din,
og det er helt nødvendig for IoT-enheter, smarte hus og smarte byer.
Her vil sensorene typisk samle inn data som behandles av en datamaskin – enten lokalt eller i
nettskyen – der de går gjennom dataenes livssyklus, fra lagring til steg som
behandling/prosessering, analyse, visualisering og/eller rapportering. Ofte vil de aktuelle
enhetene med sensorer få nye instruksjoner eller iverksette en handling når sensordataene er
behandlet. Dette kan være basert på programvare installert på selve enheten eller på
kommunikasjon sendt fra datamaskiner over nettverk (lokalt eller over internett).

Kategorier av data
Nå vet du en del om hvordan du samler inn data. Men hva slags data ser vi etter, og hvilken
form og fasong kan de ha? Det må vi også vite for å forstå hvor vi skal lete og hvordan vi får
tilgang på dataene og gjør dem brukbare.
Her vil vi derfor forklare noen viktige begreper og kategorier av data, før vi går videre til å se
på konkrete datakilder i neste emne.

Fakta:

Slik kategoriserer vi data


Da du lærte om isfjellmodellen i kapittel 1, ble du kjent med begrepene innholdsdata,
analysedata, diagnostiske data og funksjonsdata. Dette er en nyttig måte å forstå data på fra et
praktisk, mer enn et teknisk perspektiv.
Fra et teknisk perspektiv kan andre inndelinger være mer hensiktsmessige. Én av disse er å
skille mellom strukturerte og ustrukturerte data (samt semistrukturerte data). Disse vil vi
forklare i detalj nedenfor.
Vi kan også kategorisere data etter hvorvidt de er historiske eller «live», og hvorvidt de er
«rå» eller bearbeidet. La oss legge til disse begrepene i vokabularet også, før vi går videre:

 Sanntidsdata er «live», og viser hva som skjer akkurat nå. Historiske data er registrert
på et tidspunkt i fortiden.
 Rådata er ubehandlet data, som er registrert og samlet inn for eksempel av en sensor,
men ikke gjort noe med. Prosesserte data er bearbeidet, for eksempel gjort om til et
format som tillater visualisering og sammenligning med annen data.

Vi kan dessuten sortere data etter hvilken tilgang vi har på dem: Om de er interne eller
eksterne, åpne eller proprietære. Dette siste vil vi se på i neste emne.
Strukturerte og ustrukturerte data
Strukturerte data
Strukturerte data er organisert og definert etter bestemte regler. Dette er data som egner seg
for analyse og passer godt inn i satte modeller og tabeller – såkalt tabulert informasjon. For
eksempel tabeller med navn, datoer, adresser, personnummer også videre.
Kort fortalt: Strukturerte data er enklere og mer forutsigbare for maskiner å forholde seg til,
gitt at de vet hvilke regler som gjelder for struktureringen av dataene. Dette er gjerne
kvantitative data som beskriver mengde, antall eller verdier og som kan måles og skaleres
– og som en kan sortere og sammenligne med data i andre datasett som følger de samme
spillereglene. Kan dine data plasseres inn i et regneark? Da er det sannsynligvis strukturerte
data.
Ustrukturerte data
Ustrukturerte data er da det rotete og uoversiktlige motstykket til strukturerte data. Det kan
nemlig være omtrent hva som helst som ikke uten videre passer inn i et regneark. Og det er
ganske mye!
Eksempler på ustrukturerte data kan være tekst, bilder, lyd og video. Men også abstraktheter
som psykologiske trekk hos et menneske, forelskelse og filosofiske problemer. I dag er
omtrent 80 prosent av verdens data ustrukturert – en andel som stadig vokser. Dette er typisk
kvalitative data som ikke uten videre kan telles og måles.
Som regel må ustrukturerte data bearbeides og struktureres til matematiske størrelser for å gi
mening. Det er derfor vi sier at en data scientist bruker mesteparten av tiden sin på å
strukturere data.
Men ettersom maskinlæring og kunstig intelligens har blitt mer sofistikert, har vi også funnet
nye måter å utnytte ustrukturerte data på: Ansiktsgjenkjenning, talegjenkjenning og
selvkjørende biler er resultater av hvordan maskiner selv finner mønstre og mening i store
mengder av tilsynelatende usammenhengende informasjon.
Semistrukturerte data
Innenfor teknologi er det vanlig å også snakke om semistrukturerte data. Det er, som du
kanskje forstår, en slags mellomting mellom de to andre kategoriene. Semistrukturerte data
passer ikke nødvendigvis helt inn i en predefinert modell, men innehar noen egenskaper eller
fellestrekk som gjør dem enklere å analysere.
Eksempler på dette kan være struktur og innhold i e-poster og nettsider. Data i filformatene
JSON og XML er gjerne semistrukturerte.
Er musikk strukturert eller ustrukturert?
I møte med strukturerte og ustrukturerte data er det mulig å tråkke i salaten. Det er fordi
datagrunnlaget kan overlappe litt på tvers av definisjonene. Men egentlig henger dette veldig
på greip. La oss ta et eksempel fra musikkens verden:
Si at et musikkalbum består av tolv låter. Dette er harde tall og strukturerte data. Samler du
data fra topplistene for mest strømmede album i Norge og kombinerer dette med data om
alder, kjønn og demografi kan du kartlegge samfunnsgrupper med bredest kommersiell
appell. Nyttig innsikt for et plateselskap, dette!
Musikken i seg selv derimot, selve lydfilene, er et eksempel på ustrukturerte data. Med
kunstig intelligens kan man lære maskiner å identifisere hva som kjennetegner et refreng,
sammenligne de mest spilte låtene i verden og kalkulere den optimale lengden for en hit.
Nyttig innsikt for et plateselskap, dette også!

Interne og eksterne data


Så var vi endelig fremme ved hvor vi faktisk finner dataene. Det korte svaret er selvsagt
overalt.
Mer hensiktsmessig er det kanskje da å snakke om hva slags tilgang og eierskap du har til
ulike data, samt rent praktisk hvordan du kan gå frem for å tilgjengeliggjøre dem og ta dem i
bruk. For å starte med det siste først, må vi aller først bli kjent med begrepet «datasiloer».
Datasiloer
Den gode nyheten er at alle virksomheter har massevis av data. Den dårlige nyheten er at de
mest sannsynligvis er spredt for alle vinder.
Kanskje finnes noe du trenger i et e-postvedlegg, mens andre data har sitt hjem i ulike
skyløsninger eller en lagerhall full av papirkvitteringer som ingen har rukket å digitisere
ennå. Eller de er fordelt på ulike applikasjoner, på lokale servere, i nettskyen, i e-postvedlegg,
på skrivebordet ditt og hos leverandører.
Når data er separert på denne måten sier vi at de ligger i «siloer». Så lenge dataene ligger i
siloer, er det veldig vanskelig å ta dem i bruk eller sammenligne dem på kryss og tvers. Vi må
altså løfte dem ut av siloene for å skape mening og verdi av dem.
For eksempel vil en bedrift som driver med utleie av elsykler kunne dra nytte av å
sammenligne sine egne data (for eksempel hvem som leier sykler, til hvilke tidspunkt, med
hvor lang varighet, til hvilke priser) med data om vær, trafikk, kollektivtrafikk, arbeidstider,
sport- og kulturbegivenheter, hvor og hvordan folk beveger seg, og så videre. Da øker vi også
mulighetene for hva vi kan få til med data betraktelig.
Da må de først samle og tilgjengeliggjøre alle de relevante dataene på ett og samme sted, i et
format og en struktur som gjør at dataene kan brukes sammen. Når det er snakk om data av
samme type, men fra ulike datakilder (siloer), vil dette også muliggjøre at slike data kan
sammenlignes og sorteres.
Å tilgjengeliggjøre data kan i visse tilfeller være så enkelt som å kartlegge hvor de finnes, og
sørge for at de som trenger dem har riktige innloggingsdetaljer, og så videre. Men prosessen
med å løfte dataene ut av siloene er også viktig. Det kan bety å rett og slett laste ned data fra
de ulike kildene og samle dem på samme sted manuelt, for eksempel i et Excel-ark. Dette kan
være greit hvis man leter etter en konkret innsikt, og skal lage for eksempel en rapport.
Når vi snakker om å jobbe datadrevet, vil imidlertid ikke en slik manuell jobb være
hensiktsmessig. I stedet vil dere sette opp en form for automatisering, for eksempel ved å
utnytte API-er, for å samle alle relevante data på ett sted. Hva slags sted dette kan være – som
databaser og dataplattformer – vil du lære mer om i neste kapittel. Der vil du også se at
dataene veldig ofte må bearbeides og ryddes opp i før de er sammenlignbare og brukbare.
Med det i mente, la oss nå se på hvor du kan få tak i data og hvilken tilgang du har på dem.
Hvilken tilgang har vi på dataene?
For en bedrift eller organisasjon vil det finnes relevante data både i og utenfor virksomheten
– altså interne og eksterne data. Denne distinksjonen er viktig fordi det handler om eierskapet
til dataene, noe som påvirker både tilgangen og bruksområdene.
En nyttig måte å sortere datakildene våre på, er etter hvilket nivå av tilgang vi har. Er du
bevisst på dette, er det også enklere å vite hva du kan gjøre med dataene og hvordan de kan
bearbeides i senere faser.

Fakta:

Interne og eksterne data

 Interne data: Data dere selv har samlet inn og/eller kontrollerer, for eksempel om
regnskap, kunder, logistikk, drift, utstyr, etc. Husk at selv om dette er deres interne
data, kan det være lover og reguleringer som legger føringer for hvordan de kan
brukes, for eksempel med tanke på personvern.
 Interne data innsamlet/delt med/av kunder, partnere, leverandører, e.l.: Data
dere helt eller delvis kontrollerer og har tilgang på, men som også andre har eierskap
til eller tilgang på. Dere kan ikke nødvendigvis endre eller bruke dataene fritt. Det kan
være for eksempel tekniske begrensninger i programvare og datasystemer som andre
drifter som gjør det vanskelig å få ut data til nye formål, begrensninger i avtaler med
underleverandører, og så videre.
 Eksterne, åpne/offentlige data: Data fra eksterne kilder som er åpent tilgjengelig.
Åpne data kan lastes ned eller for eksempel integreres direkte i deres egne systemer
gjennom API-er. Et typisk eksempel er data fra Brønnøysundregistrene eller
Kartverket, som lar hvem som helst benytte seg av ting som enhetsregisteret eller
høydedata og dybdedata. Også organisasjoner som Verdens helseorganisasjon (WHO)
og UNICEF deler store mengder data som fritt kan brukes. Det finnes også noen
offentlige datasett som ikke uten videre ligger åpent tilgjengelig, men hvor man kan
søke om tilgang, for eksempel enkelte opplysninger fra Folkeregisteret eller
Skatteetaten.
 Eksterne, proprietære/private data: Data fra eksterne kilder som dere ikke uten
videre har tilgang på eller lov til å bruke. Disse kan likevel være tilgjengelige på
forespørsel, mot betaling eller under andre forutsetninger. Dataene kan komme fra
profesjonelle tilbydere som samler og selger data. Eller, de kan komme fra
leverandører og andre i verdikjeden til en virksomhet.

Interne data
Hva er interne data i praksis? Og hvor kan vi finne dem? Alle virksomheter har interne data,
men volumet, kvaliteten og tilgjengeligheten varierer enormt.
Her er noen av (men langt fra alle) kategoriene:

 Kunder: Navn, adresser, e-post, demografi, sted, organisasjonsnummer,


kundeserviceinteraksjoner, historikk, potensielle kunder
 Nettside: Brukeradferd, henvisninger, frafall før kjøp, søkemotoroptimalisering
 Sosiale medier: Målgrupper, publikum, annonser, resultater, engasjement, pengebruk
 Forsyningskjeder: Leverandørdata, pris, beholdning, logistikk, transport,
bestillinger, potensielle leverandører
 Marked / bransje: Konkurrenter, priser, trender, søketrender, undersøkelser, relaterte
produkter og tjenester, forretningsmodeller
 Drift: Sensorer, kontrollsystemer, utstyrsdata, vedlikeholdsdata
 Regnskap og transaksjoner: Kjøp, salg, faste utgifter, faste inntekter, andre utgifter
og inntekt

Dette er på langt nær en utfyllende liste, men det er kanskje eksempler her du kan kjenne
igjen i virksomheten hvor du holder til eller hos andre?

Eksempel:

Blikkenslagerverkstedet
La oss ta utgangspunkt i en bedrift. Blikkenslagerverkstedet Blikkbåsen ønsker å tjene bedre
på et av de viktigste produktene sine, nemlig pipebeslag.
På verkstedet til Blikkbåsen finner vi blikkplater i stål, kobber og sink, samt en knekkebenk
som blikkenslagerne bruker for å bøye platene så de passer rundt en pipe. Med andre ord:
Ingrediensene og prosessen.
Inne på verkstedet finner vi mye data om både kostnader og effektivitet. Hvor mye av en
blikkplate går med i svinn? Hvor mange ganger aktiveres knekkebenken før et fullstendig
pipebeslag er laget? Bruker forskjellige blikkenslagere forskjellige teknikker? Hvilken krever
i så fall minst materialer og knekking?
Ingenting av prosessen er skrevet ned – det er bare praksis og rutine innarbeidet hos de
ansatte. Dataene er altså her, men uten innsamling og bearbeiding kan vi ikke bruke dem.
Altså er det en datasilo.
I dette tilfellet kan vi dykke ned i siloen ved å observere arbeidet og stille spørsmål, for så å
føre de interne dataene inn i et format som gjør dem brukbare sammen med de andre dataene
våre, og slik hente det ut av siloen. Vi kan også montere en sensor på knekkebenken for å
måle antall knekk den bruker før vedlikehold er nødvendig.
Beveger vi oss så videre til salgsavdelingen kan vi finne data om pipebeslagets videre liv
etter produksjon. Hvordan blir nettsiden til verkstedet brukt av potensielle kunder som ser
etter pipebeslag? Hvilke metalltyper selger best for pipebeslag?
Her finner vi også klager bedriften har mottatt fra kunder som har kjøpt pipebeslag av dem –
gjerne produksjonsfeil og lignende, noe som gjerne fører til merarbeid og ekstra kostnader.
Hos daglig leder finnes data om leverandører, priser og marginer for ulike materialer. Her kan
vi også se hvor ofte det må bestilles vedlikehold av knekkebenken.
Nå begynner vi å få et godt bilde av de mest nærliggende variablene knyttet til pipebeslaget.
Ved å sammenstille disse dataene kan vi for eksempel finne ut hvilke teknikker som bruker
minst materialer og gir minst slitasje på knekkebenken, opp mot hvilke teknikker som gir
størst feilprosent og hva de respektive kostnadene er.
Vi kan også se hvilke typer metall som er mest populært og planlegge innkjøp deretter.
Markedsavdelingen kan analysere hvor på nettsiden kunder faller av og gjøre forbedringer
som gjør at de fullfører kundereisen mot et kjøp.
Men selv om vi blir skikkelig gode på å bruke interne data til nyskapning og forbedring kan
det være enda mer å hente på å vende blikket utover – med eksterne data.
Eksterne data
Eksterne data er data vi ikke eier og kontrollerer selv, men som vi enten finner åpent
tilgjengelig eller får tilgang på via samarbeidspartnere og leverandører. Eller som vi kjøper av
tredjeparter.
Her tenker vi ikke først og fremst på persondata. Det er nemlig store muligheter i å anvende
åpne og offentlig tilgjengelige data om ting som trafikk, vær, hav og næring – og ikke minst
data om produksjon, logistikk, vedlikehold og prosess hos andre virksomheter vi kan drive
datautveksling med.
Tenk bare på hvor mange spesialiserte bedrifter som er i sving når et skip med alle sine
komponenter skal bygges eller hvor mange aktører som er involvert i norsk fiskeri og
eksport.
Her er det mange som jobber mot samme mål og dermed kan dra nytte av samarbeid og
datautveksling – enten det er å redusere utslipp eller å bygge smarte og bærekraftige byer og
lokalsamfunn.

Eksempel:

Fiskher
Et reelt eksempel på hva som er mulig med eksterne data er den populære appen Fiskher, som
viser fritidsfiskere over hele Skandinavia veien til over 70.000 fiskeområder.
Denne appen ville vært vanskelig å lage uten åpne data fra Kartverket og Geonorge som er
fritt tilgjengelig for alle å bruke.
Ved å kombinere satellittbilder, kartdata, værdata og en rekke andre datasett med
maskinlæring ble det mulig å peke ut tusenvis av habitater for fisk.
Fiskere kan også registrere fangsten sin, noe som betyr at Fiskher produserer egne data som
kan bli til nytte for andre igjen. For eksempel gir det institusjoner som
Havforskningsinstituttet og Universitetet i Tromsø bedre oversikt over fritidsfisket i landet.
Data som er eksterne uten å ligge åpent tilgjengelig kalles, som vi har sett, proprietære data. I
mange tilfeller kan slik data kjøpes fra profesjonelle tilbydere. I 2022 er data en betydelig del
av verdensøkonomien, og flere leverandører av proprietære data er multinasjonale selskaper
med tusenvis av ansatte.
Her er noen eksempler på proprietære data:

 Opphavsrettsbeskyttet data: Åndsverk som musikk, film, foto, romaner, lærebøker


– men også patenterte varemerker og teknologier.
 Markedsundersøkelser: Profesjonelle markedsanalysebyråer kan på bestilling levere
data og innsikt om spesifikke temaer eller problemstillinger.
 Data som muliggjør digitale annonseplattformer: Sosiale medier som Facebook,
Snapchat og TikTok – men også nettaviser som VG og Dagbladet – eier data som
genereres på deres plattformer. Strenge personvernregler hindrer disse fra å dele eller
selge detaljerte personopplysninger. Sammenstilt bruker- og atferdsdata kan likevel
brukes til å lage skreddersydde annonser mot spesifikke målgrupper.
Hvis du er en leder eller ansatt i en virksomhet – eller for den saks skyld har et eget prosjekt –
stopp gjerne opp og tenk på hvilke eksterne data du kunne dratt nytte av, og hvilke data du
sitter på som andre kunne dratt nytte av.
Men husk: Selv om du eier data selv eller har kjøpt tilgang, er det som sagt ikke nødvendigvis
slik at de dermed kan brukes helt fritt. Du må fortsatt forholde deg til lover som GDPR.
Hvordan vi faktisk har lov til å bruke dataene vil vi snakke om i neste seksjon.

Oppsummering

I denne seksjonen har vi undersøkt nærmere hvor vi kan finne data, og hvordan vi samler
dem. Vi har sett at data finnes overalt, men at det ikke er noe særlig poeng i å prøve å samle
dem på måfå.
Derfor har vi tatt en nærmere titt på noen vanlige metoder for innhenting og samling av data,
som API-er, bruk av HTML-tagger og JavaScript for å samle digitale spor fra websider, og
sensorer.
Før du bruker disse metodene og verktøyene, bør du derimot vite hva slags data du bør lete
etter og hvor du bør lete – slik at du enklere kan navigere og holde stø kurs ute på det
gigantiske og uoversiktlige havet av data som finnes.
Derfor har vi også undersøkt måter å kategorisere data på, og sett hvordan vi kan skille
mellom strukturerte, ustrukturerte og semistrukturerte data og et par helt konkrete eksempler
på hva interne og eksterne data er.
Det skorter med andre ord ikke på kilder til data. Men du har kanskje allerede forstått at det
ikke er totalt fritt frem å bruke all data til akkurat hva du vil. Det finnes regler for hvordan
personopplysninger og sensitive data skal håndteres.
I neste seksjon skal vi gå igjennom hvilke data data du har lov til å samle inn, og også bli litt
bedre kjent med det etterhvert så notoriske regelverket GDPR.

Hvilke data har jeg lov til å samle inn?


Det er mye du kan oppnå hvis du får tak i noen spennende data, og har kunnskap og
kompetanse til å strukturere og behandle dem på en fornuftig måte. Effektivisering og
automatisering, ny innsikt, helt nye produkter og tjenester. Mulighetene er endeløse!

Det er bare én ting du ikke må glemme: Du må vite at dette er data du faktisk har lov til å
bruke, og at du behandler opplysningene på en lovlig måte.
Det er én ting å ta i bruk data om værforholdene i fjellet, hvor mange dere pleier å måtte ha
på jobb i jula, trykket i rørene på fabrikken, eller hvilken vei pilene peker i regnskapet. Dette
er data dere sannsynligvis har eierskap til, eller som er offentlige og kan brukes fritt.
Men det finnes selvsagt også data du ikke uten videre har lov til å samle inn eller behandle.
Det gjelder ikke minst når dataene kan knyttes til enkeltpersoner – og det gjelder oftere enn
du kanskje tror. Da er dette personopplysninger, og brått er vi inne i territoriet til den berømte
personvernforordningen (GDPR).
Så hva er egentlig GDPR? Hva har du lov til å gjøre? Hvilke rettigheter har de som vi vil
samle data om? Og hvordan navigere lovverket på en måte som kan styrke prosjektet deres, i
stedet for å spenne bein på det?
I denne seksjonen vil du bli bedre kjent med hva som er lov, hva som er lurt, og hva som er
greit når det gjelder datainnsamling og personvern.

GDPR
Personvernforordningen kan nok ved første øyekast oppleves som et ork. Flere regler!
Vanskelige lovtekster! Mye greier! Men faktisk er det mange gode grunner til å være glad for
GDPR.
Én ting er rettighetene våre som enkeltpersoner. Ikke bare er disse styrket, de er like overalt.
De samme reglene gjelder enten vi er – eller etterlater digitale fotspor – i Norge, Sverige,
Portugal, Ungarn, Polen, Tsjekkia eller hvor som helst ellers i EU/EØS.
På mange måter gjør loven det også enklere for bedrifter. Den tydeliggjør hva som er greit og
ikke. Et viktig formål for lovverket er faktisk å åpne for fri flyt av personopplysninger
innenfor EU og EØS. Ønsket om åpne grenser og et åpent marked gjelder her akkurat som på
andre områder.
Dessuten kan loven gi en konkurransefordel til europeiske virksomheter, ettersom forbrukere
kan stole på at disse ivaretar personvernet deres. Overtredelser kan i verste fall bli straffet
med store bøter – på opptil 20 millioner euro, eller fire prosent av global omsetning.
Hva regnes som en personopplysning?
Åpenbare eksempler på personopplysninger er ting som navn, personnummer, adresse og
telefonnummer. Det samme med lokasjon og ulike sporingsteknologier og identifikatorer som
gjør det mulig å følge aktiviteten din på nettet.
Men som vi allerede har sett, favner begrepet enda bredere. Det gjelder all informasjon som
er spesifikk for personens fysiske, fysiologiske, genetiske, psykiske, økonomiske, kulturelle
eller sosiale identitet – inklusive helseopplysninger, fingeravtrykk, IP-adresser, sosiale
medier-profiler, DNA, og så videre.
Noen ganger kan vi ha opplysninger der det ikke egentlig er tydelig hvem det gjelder. Dette
kan likevel være personopplysninger, fordi det kan knyttes til en person når informasjonen
kombineres med andre datasett – som et puslespill som faller på plass.
GDPR: Hvem er hvem og hva er hva
Det er en del ord og uttrykk du garantert vil møte på i forbindelse med
personvernforordningen. La oss gå kjapt gjennom noen av de viktigste før vi går videre, sånn
at vi har det samme ordforrådet.
Behandlingsansvarlig og databehandler
En behandlingsansvarlig er den virksomheten som bestemmer over behandlingen av
personopplysninger og har hovedansvaret for å følge GDPR. De bestemmer formålet med
behandlingen og hvilke midler som skal brukes.
Det til forskjell fra en databehandler, som behandler personopplysninger på vegne av den
behandlingsansvarlige – for eksempel en IT-leverandør. Mellom disse skal man ha en
databehandleravtale.
Databehandleren kan ses på som en slags underleverandør, og de har ofte egne
underleverandører under seg igjen – som også er databehandlere. Det er viktig å huske på at
som behandlingsansvarlig, har du ansvar for alt som skjer nedover i denne kjeden.
Databehandleravtale
En databehandleravtale sikrer at databehandleren ikke kan gjøre som de vil med
personopplysningene de får tilgang på, men behandler dem etter den behandlingsansvarliges
føringer.
Databehandleravtalen skal spesifisere behandlingen, den behandlingsansvarliges plikter og
rettigheter, og databehandlerens forpliktelser. Datatilsynet har en standardavtale som en kan
ta utgangspunkt i.
Datatilsynet og Personvernnemnda
Tilsynsmyndighet for personvernforordningen. De skal sørge for at loven overholdes i Norge,
og kan ilegge bøter. Hvis en vil klage på et vedtak fra Datatilsynet, skal man klage til
Personvernnemnda, som er andre instans.
De registrerte
GDPR har et uttrykk som heter «de registrerte» – som viser til dem opplysningene kan
knyttes til. Tenk på det som en mer formell måte å si «dem det gjelder».
Personvernombud
Et personvernombud er enkelt sagt virksomhetens personvernekspert. Alle
behandlingsansvarlige kan ha et personvernombud, mens for enkelte er det påbudt – for
eksempel dersom en behandler personopplysninger i stor skala.
Når og hvor gjelder GDPR?
Bryter du loven hvis du deler en kollega sitt telefonnummer med andre på jobben? Eller hvis
du skriver noen sitt navn på en bursdagspresang? Selvfølgelig ikke. Men hvis
personvernforordningen da ikke gjelder i alle sammenhenger, hvor går egentlig grensen?
Her lar lovverket seg vanskelig oppsummere på et par setninger, men vi kan gi noen
tommelfingerregler for når og hvor GDPR slår inn – og ikke.
Når gjelder GDPR?
GDPR gjelder typisk i tilfeller der en eller flere av disse er sant:

 Behandlingen er helt eller delvis automatisert (typisk behandling som gjøres av


datamaskiner eller inngår i digitale systemer)
 Personopplysningene er strukturerte, de inngår i et register
 Behandlingen er tilknyttet kommersiell virksomhet

Du skal være mest obs på GDPR om du jobber med digitale data hvor behandlingen er helt
eller delvis automatisert. Men merk at det også kan omfatte manuell behandling, ettersom
loven omfatter opplysninger i registre. GDPR gjelder med andre ord ikke bare digitale data –
selv om det jo er nokså sjelden at vi har slike registre på papir nå for tiden.
Et unntak for disse reglene er dersom behandlingen er knyttet til rent personlige eller
familiemessige aktiviteter. Du er altså fortsatt i din fulle rett til å skrive ned hvem du ønsker å
invitere til bursdagsfesten din – med fullt navn og telefonnummer – uten å være bekymret for
at Datatilsynet kommer på døra.
Tilfeller som etterforskning, straffeforfølgelse og nasjonal sikkerhet kan også gi unntak for
GDPR.
Personvernforordningen ble som nevnt innført i EU/EØS i 2018. Alle behandlingsansvarlige
som er etablert i EU/EØS er pålagt å følge lovverket. Men hva om du for eksempel bruker
nettsider og tjenester fra selskaper og servere i Tyrkia, Russland, USA eller Kina?
GDPR skal beskytte rettighetene dine også da. Hvis selskaper fra andre deler av verden vil
tilby varer og tjenester innenfor EU/EØS – eller de ønsker å spore, monitorere eller målrette
budskap mot europeiske borgere – da må de også rette seg etter personvernforordningen.

Behandlingsgrunnlag
GDPR gir seks forskjellige grunner – kalt behandlingsgrunnlag – til at det kan være lov å
behandle personopplysninger. Grunnlaget kan være for eksempel samtykke, eller at
behandlingen er nødvendig for å oppfylle en avtale eller en rettslig plikt.
En behandling i GDPR-sammenheng viser til alt du gjør med personopplysninger: samle dem
inn, lagre dem, dele dem, se på dem, bruke dem, analysere dem, sammenstille dem, endre
dem, slette dem – alt sammen.
Det kan være lett å tenke at du ikke har behandlet opplysningene – du har jo bare samlet dem
inn! Men dette er også en behandling. Det samme er sletting og destruering. Alt dette krever
dermed en forankring i et av de seks behandlingsgrunnlagene for å være lovlig.
De seks grunnlagene
Det første behandlingsgrunnlaget er samtykke. Men før du velger samtykke som grunnlag,
bør du undersøke om behandlingen kan (eller må) gjøres på et annet grunnlag.
Utover samtykke er det fem andre grunnlag. Nærmere bestemt at behandlingen kan være
nødvendig for …

 å inngå eller oppfylle en avtale (forsikring, salg, tjenester)


 en rettslig forpliktelse (NAV, arbeidsgiver)
 å verne den registrertes liv og helse (medisinsk behandling)
 å utføre en oppgave i allmennhetens interesse eller utøvelse av offentlig myndighet
(skoler og universitet)
 en berettiget interesse hos behandlingsansvarlig eller en tredjepart, som veier tyngre
enn den registrertes personvern (f.eks. Legelisten, hvor en kan sjekke hva andre sier
om ulike fastleger og fysioterapeuter)

All behandling av personopplysninger må ha et definert formål, og hvert formål skal knyttes


til et av disse seks behandlingsgrunnlagene. Husker du også på personvernprinsippene – som
dataminimering og formålsbegrensning, som du vil lære mer om i neste emne – er du på god
vei til å forstå og følge GDPR.
Dette formålet – og hvilket behandlingsgrunnlag du baserer det på – bør du skrive ned og
dokumentere før dere begynner å behandle personopplysninger. Dette er viktig både for deres
egen del, og med tanke på mulig tilsyn hvis det skulle oppstå en sak.
Hva er et gyldig samtykke?
Samtykke høres kanskje enkelt og greit ut, men i praksis er dette langt ifra det enkleste
behandlingsgrunnlaget, og bør velges når ingen av de andre alternativene er mulige. Det
stilles nemlig viktige krav for at et samtykke skal være gyldig. Derfor er samtykke som
grunnlag ofte både misforstått og misbrukt.
Et samtykke må være:

 Frivillig – det må være et reelt valg, uten tvang, og uten avhengighetsforhold (f.eks.
mellom ansatt og arbeidsgiver)
 Spesifikt – det må være et separat samtykke for hvert enkelt formål, du kan ikke be
om «ja til alt»
 Informert – det skal være forståelig og utvetydig hva en samtykker til
 Aktivt – boksen kan ikke være ferdig krysset av, samtykket må bli gitt gjennom en
aktiv handling
 Like lett å trekke tilbake som det blir gitt – når som helst og uten begrunnelse

Du skal alltid informere om hvem som er behandlingsansvarlig og deres kontaktopplysninger.


Du skal fortelle formålet, hvilke personopplysninger du ber om, og hvem som eventuelt vil
motta dem. Og du skal både informere om og legge til rette for at samtykket kan trekkes
tilbake når som helst – uten at man må gi noen grunn til det.
Hvis du bruker automatiserte individuelle avgjørelser, for eksempel behandling ved hjelp av
kunstig intelligens, må du også informere om dette. I tillegg skal du informere om hvorvidt
opplysningene vil overføres utenfor EU/EØS  – og hvordan de i tilfelle skal sikres.
Det er vanlig å samle denne informasjonen i en personvernerklæring. Datatilsynet har maler
for disse som du kan ta utgangspunkt i.

Personvernprinsippene og sensitive
opplysninger
Når du behandler personopplysninger er det noen grunnprinsipper som alltid må tas hensyn
til. Av og til må disse veies opp mot hverandre. Hva er viktigst i den konkrete situasjonen?
La oss gå kjapt gjennom disse personvernprinsippene.
Personvernprinsippene
Lovlighet
Behandlingen må være i samsvar med loven, det vil si Grunnloven, GDPR og andre relevante
lover, og man må ha et behandlingsgrunnlag.
Rettferdighet
Behandlingen må være forutsigbar og forventet; den kan ikke være urimelig eller utgjøre
vesentlig risiko for den registrerte. Du kan forvente at medisinske opplysninger fra legen blir
delt med et sykehus, men du skal ikke oppleve at de finner veien til kommersielle aktører
som sender deg reklame for medikamenter.
Åpenhet
Vi skal alltid informeres om hvilke personopplysninger som behandles, hvorfor, av hvem,
hvor lenge, hvem som får tilgang og på hvilket behandlingsgrunnlag.
Formålsbegrensing
Formålet for en behandling må være klart definert før behandlingen begynner. Du kan ikke
bare samle inn personopplysninger og se an hva du vil bruke dem til. Når du først definerer et
formål vet du hvilke personopplysninger du trenger for å oppnå dette formålet.
Dataminimering
Dataminimering betyr at vi ikke har lov å behandle flere opplysninger enn det som er
nødvendig for å oppnå formålet.
Riktighet
Riktighet vil rett og slett si at personopplysninger må være korrekte. Om nødvendig må de
holdes oppdaterte, og hvis det finnes feil må de rettes.
Lagringsbegrensning
Det er ikke lov å lagre opplysningene lengre enn det er nødvendig for å oppnå formålet. Det
kan riktignok finnes unntak. For eksempel hvis du kjøper et par sko på nettet, må bedriften
som selger skoene innhente for eksempel din adresse og mobilnummer for å sende deg
varene. Så snart innkjøpet er gjennomført kan man tenke seg at nå er formålet oppnådd og at
de skal slette personopplysningene. Men det er fortsatt en mulighet for at du vil klage eller
ønsker å returnere varene. Det vil si at butikken må oppbevare opplysningene til klagefristen
og returretten er utløpt.
Integritet og konfidensialitet
Det siste prinsippet er at den behandlingsansvarlige må sørge for tilstrekkelig
informasjonssikkerhet. Det betyr at du må ta nødvendige grep for å minimere risikoen for
uriktige endringer, tap av eller urettmessig tilgang til personopplysninger.
Sensitive opplysninger
Det er aldri fritt frem for å behandle personopplysninger, men noen personopplysninger har et
særskilt vern. Det gjelder følgende kategorier:

1. opplysninger om rasemessig eller etnisk opprinnelse


2. opplysninger om politisk oppfatning
3. opplysninger om religion
4. opplysninger om filosofisk overbevisning
5. opplysninger om fagforeningsmedlemskap
6. genetiske opplysninger
7. biometriske opplysninger (når behandlingsformålet er å entydig identifisere noen)
8. helseopplysninger
9. opplysninger om seksuelle forhold
10. opplysninger om seksuell legning

Dette er det vi uformelt kaller sensitive opplysninger. I loven kalles det «særlige kategorier
av personopplysninger». Som hovedregel skal ikke slike opplysninger behandles i det hele
tatt. Det finnes imidlertid flere unntak – som når du har et eksplisitt og gyldig samtykke, eller
det følger av lov at det er viktig at de behandles.
Det finnes også andre unntak – alt fra at den registrerte selv har offentliggjort opplysningene,
til at behandlingen kan være i allmennhetens interesse, for eksempel politiske synspunkt i
forbindelse med valg.
Hvis virksomheten din er i en situasjon der dere trenger å behandle sensitive opplysninger, er
det viktig å sette seg spesielt inn i regelverket og undersøke om det finnes et unntak dere kan
bruke som gjør behandlingen lovlig.
Ta informasjonssikkerhet på alvor!
Husk at sikkerhet – og spesielt informasjonssikkerhet – også er svært viktig i GDPR-
sammenheng.
Hvis personopplysninger (og i verste fall sensitive opplysninger) kommer på avveie – grunnet
for eksempel datainnbrudd, manglende kryptering eller sviktende rutiner – vil ikke dette kun
berøre de registrerte, men også behandlingsansvarlig, som i verste fall risikerer store bøter.

Hva som lov – og hva som er greit


I tillegg til å følge lover og regler, kan og bør du foreta etiske vurderinger rundt de
teknologiske løsningene dere vurderer å ta i bruk. Det kan være en forskjell mellom hva som
er lov og hva som er etisk.
En konkret måte å vurdere en teknologisk løsning etisk, er å stille tre spørsmål:
1. Hva slags teknologi brukes og hvordan brukes den? Dette spørsmålet krever ikke at du er
en ekspert på teknologi, men at du stiller spørsmål til løsningen. Hvordan samles data inn,
når, og så videre. Dette er det du lærer generelt i kurset.
2. Hvilke konsekvenser kan bruken ha? Dette spørsmålet handler om å identifisere hvilke
verdier som står på spill, for eksempel overvåking mot privatliv, som igjen handler om å
vurdere trygghet og frihet. For å få tak i hvilke verdier som du må velge mellom kan du se på
mulige konsekvenser. Hva kan løsningen gjøre for enkeltindivider og for samfunnet? Hva
kan effekten være over tid? Husk også å vurdere miljømessige konsekvenser. Her er det
viktig å identifisere både positive og negative effekter.
3. Vil jeg bruke denne løsningen, og eventuelt hvordan? Det er først når du har vurdert
spørsmål 1 og 2 at du egentlig kan vurdere om løsningen virker etisk forsvarlig.
Alle disse tre spørsmålene kan du stille til deg selv, men de er også godt egnet for diskusjon.
Det kan være diskusjoner med kolleger eller sjefen, og selvfølgelig med brukere av
løsningen.
Det er en fordel at samtalene er med noen som har annen kunnskap og erfaring enn deg.
Digital teknologi er kompleks, og virkningene er vanskelige å få oversikt over. Vi kan ikke
spå, men jo flere vinkler som er vurdert, og jo flere perspektiver som er diskutert, desto større
er sjansen for å treffe gode og velbegrunnede avgjørelser.
Opgaver
Klarte du å holde tunga rett i munnen gjennom denne seksjonen? Hvordan var dette med
bits og bytes igjen – hva stemmer ikke?

En byte kan kun ha to tilstander – av eller på


En byte er kombinasjonen av åtte bits
En bit kan kun ha to tilstander – 0 eller 1
En byte kan representere 256 ulike verdier – 2^8

Kommentar: Åtte bits utgjør en byte og en byte kan representere 256 ulike verdier.
Hva er hensikten med programmeringsspråk?

Å gi mennesker et felles språk når de snakker med hverandre om datamaskiner.


Å gi logiske instrukser som både er forståelige for datamaskiner og mennesker.
Å gjøre det mulig for folk fra forskjellige land å programmere.

Kommentar: Ulike programmeringsspråk skal være forståelige for mennesker og kan


oversettes til maskinkode for å også forstås av maskiner.
Hva er SSD et eksempel på?

Det er en type RAM


Primærminne
Sekundærminne

Kommentar: En Solid State Drive lagrer data etter prosessering, slik som en harddisk. I
motsetning til primærminne holder disse i utgangspunktet på dataene selv om
datamaskinen slås av.
I isfjellmodellen deles data i 3 kategorier: rådata, analytiske data, og funksjonelle data.
Hvilket påstand er ikke sant om metadata?

Metadata gir informasjon om tolking av data 


Dato, kameratype og kameralinse type er metadata for et bilde
Metadata er tilleggsdata
Metadata er ikke data i seg selv
Et annet uttrykk for digital tvilling er [ord1]. digital skygge
I helsevesenet er en digital [ord1] et eksempel på en digitale tvilling. Pasient
Personvern [ord1]  er en grunnleggende rettighet for alle at våre private sfærer skal
respekteres og vernes om.
Hvilken påstand er feil? 

GDPR gir deg:

Rett til å få dine data utlevert


Rett til begrensning mot bruk av uriktige opplysninger om deg
Rett til å bli skjermet for spesifikt innhold og spesifikke nyheter
Rett til informasjon om bruk av dine data
Rett til å protestere mot direkte markedsføring
Rett til innsyn i dine data
Hva er ikke riktig angående kunstig intelligente systemer?

De kan kun utføre handlinger i fysiske (ikke-digitale) omgivelser 


De tar i mot og behandler data
De utfører handlinger med hensikt å oppnå et gitt mål
Maskinlæring er en underkategori av kunstig intelligens.

Sant
Usant
En maskinlæringsalgoritme som lærer seg å vinne et spill gjennom prøving og feiling,
utifra belønning og straff, vil kunne kategoriseres som en Forsterket læring algoritme.
Hvilke av svaralternativene under er riktig angående Internet of Things (IoT)-enheter?

De er avhengig av maskinlæring for å fungere


De er fysiske ting 
De er koblet til et nettverk
Selv om de er koblet til Internett kan de ikke potensielt misbrukes av cyberkriminelle
De har sensorer
Når det kommer til sikkerhet i en organisasjon/bedrift, er ansatte den største
sikkerhetsrisikoen.
Begrepet informasjonssikkerhet gjelder både analoge og digitale data, altså både data som
lagres og overføres uten bruk av IKT og data som lagres og overføres med bruk av IKT.
Direktørsvindel er et angrep som gjør bruk av "sosial manipulasjon", gjennom en
henvendelse (f.eks. via epost) fra noen som utgir seg for å være mottaker av henvendelsen
sin sjef/andre i mottaker sitt firma sin ledelse.
I hvilken av disse angreps-metodene benyttes det ofte kryptering av data (filer og mapper)
for å gjøre dem utilgjengelig for deres rettmessige eier?

Løsepengevirus
Fjerntilgang 
Spear-phishing
Trojaner
Dataorm
Hvilke av handlingene under utgjør en behandling i GDPR-sammenheng?

Lagring av personopplysninger
Innsamling av personopplysninger
Deling av personopplysninger
Sletting av personopplysninger
Analyse av personopplysninger
Hva er riktig om en databehandleravtale?
En databehandleravtale sikrer at databehandleren ikke kan gjøre som de vil med
personopplysningene de får tilgang på
En databehandleravtale sikrer en databehandler tilgang til all persondata de ønsker
En databehandleravtale angir vilkår og betingelser man må godta om man ønsker tilgang til
et databehandlingsprogram

Kommentar: En databehandler er noen som behandler data på vegne av en


behandlingsansvarlig. Mellom disse skal det være en databehandleravtale. Dette er en måte
å sikre at personopplysninger behandles i samsvar med regelverket.
Hvilket av disse svaralternativene er ikke en del av de seks grunnlagene som GDPR legger
til grunn for behandling av data?
En rettslig forpliktelse (f.eks. NAV, arbeidsgiver)
Samtykke (godkjennelse fra bruker)
Kommersielle interesser (nettbutikker, og private bedrifter)

Kommentar: At nettbutikker og private bedrifter kan tjene penger på brukerdata, er ikke et


behandlingsgrunnlag under GDPR. Tvert i mot behøver kommersielle virksomheter
samtykke for å benytte seg av brukerdata, gitt at behandlingen ikke faller inn under andre
mulige behandlingsgrunnlag som «å inngå eller oppfylle en avtale».
Hvilken av disse påstandene om GDPR stemmer ikke?
GDPR er et sett med regler om personvern som er felles for hele EU/EØS
GDPR gjelder i tilfeller når behandlingen av data er tilknyttet kommersiell virksomhet
GDPR er et utvalg av representanter fra hele EU/EØS, som sammen utvikler lover og
regler for hvordan vi skal behandle personopplysninger og sensitiv data

Kommentar: Det er riktig at denne påstanden er feil. GDPR er selve lovverket som ivaretar
personopplysninger, og står for General Data Protection Regulation, eller
personvernforordningen på norsk.
Hva er HTML-tagger?
En HTML-tag er et slags bildeelement, og en enhet som brukes innen digital bildelagring
HTML-tagger er informasjonskapsler på brukerens datamaskin
HTML-tagger angir typisk struktur og betydning for innholdet på en nettside, men det
finnes også HTML-tagger som kan brukes sammen med JavaScript, for eksempel for å
angi instruksjoner om å sende data til et eksternt verktøy eller for å plassere en
informasjonskapsel (cookie) på brukerens datamaskin

Kommentar: Nevnte bruk av HTML-tagger/JavaScript-kodesnutter spesifikt for å samle


inn og sende data til eksterne analyseverktøy‚ er også kjent som «page tagging». Merk at
denne typen innsamling og overføring av brukerinformasjon strengt reguleres av GDPR –
det er dermed ikke gitt at du kan bruke all slik data som du vil.
Hva er et API?
Et rammeverk som legger begrensninger på programvarearkitekturen slik at det blir enklere
å forutse hvordan et programmeringsgrensesnitt oppfører seg
En bro som gjør at ulike dataprogrammer og systemer kan snakke med hverandre
En HTML-tag som omslutter en JavaScript-kodesnutt som hjelper oss med å samle inn og
overføre data om utvalgte nettsiders besøkende og deres handlinger til et eksternt verktøy

Kommentar: En page tag er en kodesnutt, omsluttet av en HTML-tag, som hjelper oss med
å samle inn og overføre data om utvalgte nettsiders besøkende og deres handlinger på
nettsidene til et eksternt verktøy. Det er slik for eksempel Google Analytics samler sine
data.
Hva er ikke riktig om kunstig intelligens?
AI som ligner menneskelig intelligens kan snart realiseres.
Maskinlæring er problemspesifikt, og løser – enn så lenge – helt spesifikke oppgaver.
Når noen snakker om kunstig intelligens handler det som regel mer spesifikt om
maskinlæring.

Kommentar: Påstanden er riktig om kunstig intelligens, som gjerne er basert på


maskinlæring – enkelt sagt systemer som gjenkjenner mønstre og utfører oppgaver basert
på data.
Hva er feil om data science?

En data scientist er en ekspert på å dykke ned i data og grave frem innsikter vi kan handle
ut ifra
Data science er i ferd med å erstattes av maskinlæring og kunstig intelligente systemer
Data science er en tverrfaglig disiplin som kombinerer blant annet programmering,
statistikk, dataanalyse og forretningsinnsikt

Kommentar: Det har helt rett i at dette er feil! Tvert imot er data science utslagsgivende for
å drive kunnskapen om og utnyttelsen av maskinlæring og kunstig intelligens videre.
Hvilken av disse definisjonene passer best for data literacy?

Å kunne bruke data til å bygge algoritmer og modeller for å hente ut innsikt
Å ha evnen til å lese, forstå, analysere og tenke kritisk om data
Å ha et grunnleggende konsept om hva data er og gjør

Kommentar: Dette er strengt tatt ikke feil, men heller ikke helt presist. Dette kalles heller å
være databevisst, og er gjerne det første steget innen data literacy. Data literacy defineres
derimot som evnen til å lese, forstå, analysere og tenke kritisk om data. Du behøver altså
en litt større totalpakke for å være «data literate».
Hva er riktig om offentlige data? Marker det mest presise svaralternativet:

Offentlige data betyr åpne profiler eller offentlige oppdateringer på sosiale medier
Offentlige data er data som er beskyttet av staten gjennom Datatilsynet, og som ikke kan
brukes til å utvikle kommersielle tjenester eller selges til eksterne aktører
Offentlig data er i hovedsak gratis og tilgjengelig for alle, og kan brukes til å utvikle nye
produkter og tjenester

Kommentar: Eksempler på slike offentlige data er kartdata, værdata og data om trafikk og


samferdsel.
Hvilket av disse utsagnene er du enig i? Marker det du mener er riktig:

Data skaper en masse muligheter, men samtidig flere utfordringer


Jo mer data vi har om et problem, dess vanskeligere blir det å løse
For å nyttiggjøre oss av data trenger vi en data scientist

Kommentar: Det er et stort paradoks at jo bedre vi blir til å sortere våre liv og vårt samfunn
og jo flere problemer vi løser opp i gjennom data – dess mer kompleksitet innfører vi, og vi
skaper samtidig flere lag av nye utfordringer som må løses.
Hvilket av disse eksemplene handler om analysedata og diagnostiske data?

Lydfiler og e-poster
Metadata og loggfiler
Protokoller

Kommentar: Når du for eksempel ser på Netflix lagres det loggfiler med informasjon om
atferd og tilstand. Denne tilleggsinformasjonen kan brukes til både analyser og
diagnostiske formål.
Hva er en digital tvilling?

En digital representasjon av et system eller en prosess som finnes i virkeligheten.


En hacke-metode som går ut på å utgi seg for å være en kredibel avsender for å stjele
sensitiv informasjon – også kalt phishing.
En digital avatar. En representasjon av deg selv i sosiale medier og ellers på internett.

Kommentar: digitale tvillinger kan være mye mer enn digitale avatarer. En digital tvilling
er en digital representasjon av et system eller en prosess som finnes i virkeligheten.
Hvilket av disse svaralternativene er ikke en rettighet du har i henhold til GDPR?

Rett til informasjon om hva dine data brukes til, hvordan de brukes og hvem som mottar
disse dataene
Å kunne motsette deg direkte markedsføring og i visse tilfeller protestere mot annen
behandling av data ved for eksempel interesseavveiing
Rett til å bli skjermet for spesifikt innhold og spesifikke nyheter

Kommentar: GDPR gir deg rett til å protestere.


Det finnes mange definisjoner av data, men hva stemmer definitivt ikke?

Ordet data kommer fra latin og betyr «det som er gitt»


Data er det samme som informasjon og kunnskap
Observasjoner, bilder og lyd er eksempler på data

Kommentar: Data kan gi informasjon og lede til kunnskap, men det er ikke det samme.
Hva mener vi med datafisering?

Vi konverterer analoge data til digitale data


Vi beskytter dataene våre og personvernet
Vi skaper representasjoner av virkeligheten i et dataformat, som blir gjort tilgjengelig for
analyseprosesser

Kommentar: Datafisering er den strukturelle oversettelsen av hverdagslige aktiviteter og


interaksjoner til data, for eksempel gjennom treningsapper og smarthus. I neste omgang
kan vi spore, overvåke og optimalisere hva enn det er snakk om. Og det kan i praksis være
hva som helst.
Hvorfor ble appen Smittestopp i første omgang stanset?

Appen ivaretok ikke personvern på en god nok måte


Appen oppga feil informasjon
Appen fungerte dårligere på Android-enheter enn Apple-enheter

Kommentar: Datatilsynet stoppet appen fordi innsamlingen og behandlingen av data ikke


var godt nok begrunnet. De mente formålet kunne vært oppnådd på en måte som var
mindre inngripende. Dette var et brudd på prinsippet om dataminimering, som du kan lese
mer om i kapittel 3.
Hvor finner vi data? Velg det svaralternativet du mener er mest presist.

Vi finner data på internett og i digitale ressurser som nettsider, apper og sosiale medier
Vi finner data der mennesker har interagert med teknologi
Vi finner data rundt omkring oss overalt, i alle aspekter av samfunnet

Kommentar: Det er riktig at data oppstår når mennesker interagerer med teknologi, men det
kan også oppstå uten at vi mennesker har vært en del av ligningen.
Hvilken av disse påstandene om metadata er usann?

Metadata er data om data


Metadata skal beskytte personvernet ditt
Metadata gir oss informasjon om hvordan data skal tolkes

Kommentar: Det er helt riktig at dette er feil! Metadata er «data om data», altså data som
sier noe om annen data. Dette er informasjon som forteller oss hvordan data skal tolkes.
Det er ikke der for å beskytte personvernet ditt.
Hvilket av disse eksemplene er ikke et steg fra dataenes livssyklus?

Datagenerering
Datainnsamling
Analyse

Kommentar: Du har rett i at datagenerering ikke er et eget steg fra dataens livssyklus. Vi
sier at data oppstår eller genereres i datasyklusens første del, altså i en situasjon / aktivitet.
Data er: Gull, Skapt, Verdi, Oksygen
Data kan være både analog og digitalt: True
Alle data er samlet inn i en kontekst: True
Data livssyklusen har 6 steg:

Situasjon/Aktivitet
Data innsamling
Data lagring og prosessering
Analyse
Rapportering og/eller
Tiltak/Beslutning
Å generere og samle inn data om meg selv kan gi meg oversikt, innsikt og statistikk om
min tilværelse og er en trend som heter Quantified self
Algoritmer bruker data til å forme digitale tjenester.
Den strukturelle oversettelsen av hverdagslige aktiviteter og interaksjoner til data heter:
Datifisering / Dataification
Datifisering er udelt positivt! : False
Tverrdisiplinært fagområdet som kombinerer statistikk, programmering, dataanalyse,
algoritmer og forretningsinnsikt heter [ord1].

Kommentar: Data science


Data blir stadig viktigere i livene våre.  

Sant
 En av de største satsninger fra Regjeringer er å styrke tilgang til [ord1].

offentlig data
Bedrifter og næringsliv må betale for tilgang til offentlige data. 

  
Usant
Driftsdata er data om salg, innkjøp, lager, finans, kunder, ordre, transport,
vedlikeholdsinformasjon og utstyrsdata. 

Usant
For å se hvordan man kan bruke data til å forbedre og effektivisere en prosess, en
organisasjon, en digitale verktøy osv trengs en kombinasjon av teknologikunnskap og
[ord1].

domenekunnskap
Datamengder som er store, mangeartede eller komplekse kalles [ord1].

stordata
Hvilke uttalelser er usant? 

Det kombinerte karbonavtrykket fra bruk av data en mindre enn det avtrykket fra
flyindustrien
Data øker kvaliteten på produkter og tjenester
Data bruk gir det en praktisk nyttefunksjon og skaper et mindre komplekst samfunn 
Data øker utnyttelsen av tid og kompetanse
Data gjør at du kan jobbe mer målrettet med kommunikasjon, markedsføring,
kunderelasjoner og salg
Data utvikler helt nye produkter og tjenester
Å ha evnen til å lese, forstå, analysere og tenke kritisk om data og dens bruk er noe vi
kaller for [ord1]. (engelsk uttrykk)

data literacy
Det er viktig for alle til å ha handlefrihet innen det digitaliserte og datafiserte samfunnet og
det får man ved å øke sine [ord1]. (engelsk uttrykk)

data literacy
[ord1] er et ansvarsområde for en enkelt person på en arbeidsplass som forvalter bedriftens
eller virksomhetens data.

Dataforvaltning
Hvilket av disse utsagnene er du enig i?

For å nyttiggjøre oss av data trenger vi en data scientist


Data skaper en masse muligheter, men samtidig flere utfordringer
Jo mer data vi har om et problem, dess vanskeligere blir det å løse
Når det gjelder datautveksling kan vi tenke på et API som en bro der data kan bevege seg
fra et system til et annet etter bestemte regler.
Hva er riktig om rådata?

De er bearbeidet, for eksempel gjort om til et format som tillater visualisering og


sammenligning med annen data
De er registrert og samlet inn, for eksempel av en sensor, men ikke gjort noe med
De er ubehandlet
Når data er spredt og isolert i ulike datakilder som ikke kommuniserer med hverandre, sier
vi gjerne at dataene befinner seg i hver sin separate ...

Databank
Databrønn
Datasilo
For personopplysninger som omfattes av GDPR må all behandling av personopplysninger
ha et definert formål, og formålet skal knyttes til et av seks mulige behandlingsgrunnlag.

Sant 
Usant
Hva har vi lært om nettet? Hvilken av disse påstandene stemmer?

Internett kalles også verdensveven på norsk


Protokoller kan forstås som regelsett i et nettverk
Internett er kjent som verdens største LAN (Local Area Network)

Kommentar: Det her helt nødvendig for programvare, maskinvare og nettverksenheter å


følge protokoller for at de skal kunne utveksle data.
Hva gjør HTTP-protokollen?
Den gjør det mulig for en datamaskin å laste ned en nettside, slik at den kan vises i en
nettleser.
Den gjør det mulig å sende e-post.
Den gjør det mulig å utvikle nettsider.

Kommentar: HTTP sørger for at en datamaskin kan sende en forespørsel som gjerne
formidles over et lokalt nettverk, og gjennom ruteren, slik at den til slutt når en server på
internett. Serveren kan da sende nettsiden og tilleggsinformasjon som en respons.
Hva kalles det øverste nivået i nettskyen?
Infrastruktur som en tjeneste
Plattform som en tjeneste
Programvare som en tjeneste

Kommentar: Software as a Service (SaaS) er det øverste nivået, ja. Det omfatter ferdige
applikasjoner du kan bruke over skyen, gjerne i en nettleser (f. eks. Google Docs).
Hva er ikke en vanlig måte å trene en maskinglæringsalgoritme?
Veiledet læring
Ikke-veiledet læring
Ikke-forsterket læring

Kommentar: Ikke-forsterket læring er bare oppspinn – men forsterket læring derimot er en


treningsform basert på prøving og feiling. Det innebærer at algoritmen ikke instrueres i
hvordan en oppgave skal løses, men heller får belønning og straff for god og dårlige
resultater.
Hva er den grunnleggende ideen bak digitale tvillinger?
Å sørge for naturtro kopier av oss i metaverset slik at vi kan interagere tilnærmet slik vi
gjør i virkeligheten.
Å bruke en digital representasjon av en gjenstand eller prosess (reell eller tenkt) til
observasjon, optimalisering, uttesting og å forutsi atferd
At digitale systemer skal overta tid- og ressurskrevende oppgaver som i dag utføres av
mennesker.

Kommentar: Ved å kjøre tester og simuleringer på de digitale tvillingene, er det mulig å for
eksempel gjøre risikovurderinger, forutsi atferd, se konsekvensene av planlagte endringer
og prøve ut nye ideer.
Informasjonssikkerhet handler om …
Beskyttelse av data.
Sikkerhet mot uønskede hendelser over et nettverk.
Beskyttelse av de teknologibaserte systemer som lagrer, prosesserer og overfører data.
Kommentar: Dette beskriver IKT-sikkerhet som finnes i skjæringspunktet mellom
cybersikkerhet og informasjonssikkerhet.
Hva er forskjellen på et datavirus og en dataorm?
Det er ingen forskjell, men to navn for samme type skadevare.
En dataorm trenger en vert for å spre seg, mens et virus gjør det på egenhånd.
Et virus trenger en vert for å spre seg, mens en dataorm gjør det på egenhånd.

Kommentar: Virus kopierer seg inn i andre filer og sprer seg altså fra vert til vert. En
dataorm utnytter systemsvakheter og kopierer seg selv i systemet. Deretter jakter etter nye
maskiner og systemer den kan infisere.
Hva er BankID er et eksempel på?
Symmetrisk kryptering
Asymmetrisk kryptering
En VPN-løsning

Kommentar: Symmetrisk kryptering egner seg best når data skal distribueres til et fåtalls
brukere fordi samme nøkkel benyttes til å låse ned og opp data. Med asymmetrisk
kryptering har hver bruker sin egen private nøkkel – slik som med BankID.
E-poster fra tilsynelatende seriøse aktører som vil få deg til å klikke på lenker og oppgi
sensitiv informasjon, kalles hva?
Phishing
Data obfuscation
Løsepengevirus

Kommentar: Phishing er en metode som baserer seg på masseutsendelser av e-post og


korte tidsfrister for å stjele betalingsinformajon eller andre opplysninger.
Hva kan vi bruke en sensor til? Marker den mest presise beskrivelsen
Å samle data ute i den fysiske verden
Å gjøre analog data digital
Å kvalitetssikre, fjerne eller sensurere data

Kommentar: Ordet «sensor» har samme opphav som «sanser», og det er nettopp dét en
sensor er: elektronikkens sanser. I dag har vi digitale sensorteknologi som lar oss måle alt
fra avstand til trykk, fukt, bevegelser og lys.

Hva er interne data?


Data som en virksomhet eller privatperson helt eller delvis selv eier eller kontrollerer.
Tilleggsdata som gir informasjon om tolkning av data.
Data som av en virksomhet eller privatperson har prosessert, bearbeidet og strukturert for
internt bruk.

Kommentar: Enhver virksomhet sitter på store mengder interne data, som kan brukes til å
ta datadrevne beslutninger. Selv om det er dine egne data, kan det være andre forhold –
som GDPR – som gjør at de likevel ikke kan brukes helt fritt.
Hva mener vi når vi sier ustrukturerte data?
Data som ikke enda er analysert
Data som ikke er ordnet og definert etter bestemte regler
Data som spredd og isolert i ulike datakilder som ikke kommuniserer med hverandre

Kommentar: Slik data være vanskelige å analysere (for eksempel måle og sammenligne).

You might also like