Komme i gang med data

Fullført

Et datasett er en samling data som er organisert i rader og kolonner, ofte kalt en tabell. Rader kalles også poster og kolonner som felt. Datapunkter utgjør feltene i et datasett som vanligvis består av ulike typer data:

  • Temporale data – Temporale data holdes mot en hendelse, for eksempel når en ordre ble plassert, eller en pakke ble sendt. Datoer har en naturlig rekkefølge, og vi vet at 24.12.2021 kommer før 25.12.2021, og etter 23.12.2021. På grunn av denne naturlige rekkefølgen er det enkelt å måle verdier over tid.

  • Strengdata – en tekstverdi kalles også tegn- eller strengdata, og klassifiseres ofte som kategoriske data. Dette er fordi den beskriver kategorier av poster i datasettet. Navnet på en ansatt vil for eksempel bli lagret som strengdata.

  • Numeriske data – numeriske data eller tall, kan klassifiseres som kontinuerlige eller diskrete. Kontinuerlige data er noe vi måler på en skala, og diskrete data er verdier som telles i stedet for målt. Avhengig av verdiene i en numerisk kolonne, kan denne typen brukes som en kategori.

Det er viktig at du forstår dataene i datasettet før du analyserer dem. Deretter kan du velge de riktige analytiske funksjonene som skal brukes på datatypene du arbeider med.

I denne videoen ser du et eksempel på et datasett og hvordan de ulike typene dato-, streng- og numeriske felt kombineres til rader og kolonner. Du vil lære hvordan analyse kan gjøres på et datasett for å forstå mønstre i dataene: