Sortere og filtrere data
Vi analyserer data for å svare på et forretningsspørsmål eller finne en historie i dataene. Sortering og filtrering av data hjelper oss med å nå dette målet. Hvor mange salg ble for eksempel gjort i New York-butikken på mandag? Eller hvor mange pakker ble sendt fra lageret på fredag?
Filtrering utelater rader fra resultatsettet som ikke svarer på spørsmålet vi stiller. Hvis vi filtrerer ut alle butikker unntatt New York, kan vi deretter analysere resultatene fra et mindre datasett og telle hvor mange salg som ble gjort. Vi kan filtrere etter en hvilken som helst kolonne i et datasett, uavhengig av datatypen i kolonnen.
Ved å sortere datasettet kan vi finne den høyeste eller laveste verdien i en kolonne. Sortering kan utføres på alle datatyper, men utføres ofte på en dato- eller talltype for å svare på et spørsmål, for eksempel det høyeste antallet salg. Strengdata kan sorteres alfabetisk i stigende eller synkende rekkefølge.
Ytterpunkter er verdier som er uvanlig høye eller lave sammenlignet med de andre verdiene i datasettet. Når en ytterkant er inkludert i en mengdefunksjon, for eksempel et gjennomsnitt, kan det skape villedende resultater.
I denne videoen ser du hvordan et datasett kan filtreres for å svare på et spørsmål, og hvordan kolonner kan sorteres for å oppdage de høyeste og laveste verdiene innenfor et område: