Aggregera data

Slutförd

Mängdfunktioner används för att returnera ett sammanfattningsvärde från datamängden och är en grundläggande komponent i dataanalysen. Dessa funktioner hjälper oss att besvara specifika frågor om vår verksamhet, till exempel hur många kunder som besökte Tokyo-butiken i tisdags eller den genomsnittliga kostnaden för varje onlinekund i december.

Följande funktioner används ofta i dataanalys:

  • Count – en bra startpunkt innan du börjar mer djupgående analys är att använda funktionen count för att returnera antalet poster i datamängden. Funktionen count kan tillämpas på alla datauppsättningar, oavsett vilken typ av data den innehåller, eftersom beräkningen görs på antalet rader.

  • Antal distinkta – Ett distinkt antal kan tillämpas för att returnera antalet unika värden i en kolumn och är användbart för kategoriska data.

  • Summa – en vanlig funktion som sammanfattar de totala värdena i ett fält. Den används för att returnera värden som total försäljning eller intäkter.

  • Genomsnitt – Den genomsnittliga funktionen beräknar summan av ett fält, dividerat med antalet poster. Om du till exempel vill identifiera de genomsnittliga kundutgifterna skulle den genomsnittliga funktionen köra en summaberäkning mot alla kunders utgifter och sedan dividera den med antalet kunder i tabellen.

  • Minimum – En funktion som används för att returnera det lägsta värdet i ett fält.

  • Maximum – motsatsen till den lägsta funktionen returnerar den här funktionen det högsta värdet i ett fält.

Vilken typ av funktion som används beror på vilka data i kolumnen som aggregeras. Temperaturvärden i en kolumn fungerar inte med en sammanfattningsaggregering, men skulle vara idealiska för lägsta, högsta eller genomsnittliga värden. I en försäljningsordertabell kan den totala kolumnen sammanfattas, eller så kan du använda funktionerna minimum, maximum eller average.

I den här videon ser du hur aggregerade funktioner kan tillämpas på data för att returnera sammanfattade resultat: