Gegevens visualiseren

Voltooid

Gegevenswetenschappers visualiseren gegevens om deze beter te begrijpen. Ze kunnen de onbewerkte gegevens scannen, samenvattingsmetingen onderzoeken, zoals gemiddelden, of de gegevens in een grafiek weergeven. Grafieken zijn een krachtige manier om gegevens te visualiseren en gegevenswetenschappers gebruiken vaak grafieken om redelijk complexe patronen snel te onderscheiden.

Gegevens visueel weergeven

Grafieken worden uitgevoerd om een snelle kwalitatieve evaluatie van onze gegevens te bieden, wat nuttig kan zijn om resultaten te begrijpen, uitbijterwaarden te vinden, te onderzoeken hoe getallen worden gedistribueerd, enzovoort.

Hoewel we soms van tevoren weten wat voor soort grafiek het nuttigst is, andere keren gebruiken we grafieken op een verkennende manier. Als u de kracht van gegevensvisualisatie wilt begrijpen, moet u rekening houden met de volgende gegevens: de locatie (x,y) van een zelfrijdende auto. In de onbewerkte vorm van de gegevens is het moeilijk om echte patronen te zien. Het gemiddelde of gemiddelde geeft aan dat het pad van de auto is gecentreerd rond x=0,2 en y=0,3, en het bereik van getallen lijkt tussen -2 en 2 te liggen.

Tijd Locatie-X Locatie-Y
0 0 2
1 1.682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1.313973 1.507805
12 0.00001 0.00001
13 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

Als we nu Location-X in de loop van de tijd uitzetten, kunnen we zien dat er enkele ontbrekende waarden tussen 7 en 12 voorkomen.

Graph of Location-X coordinates plotted against time.

Als we X ten opzichte van Y grafieken, eindigen we met een kaart van waar de auto is gereden. Het is direct duidelijk dat de auto in een cirkel rijdt en op een bepaald moment naar het midden van die cirkel reed.

Graph of Location-X and Location-Y coordinates plotted.

Grafieken zijn niet beperkt tot 2D-spreidingsdiagrammen zoals hierboven. Ze kunnen worden gebruikt om andere aspecten van uw gegevens te verkennen; Bijvoorbeeld verhoudingen (cirkeldiagrammen en gestapelde staafdiagrammen) en hoe de gegevens worden verdeeld (histogrammen en box-and-whisker-plots). Wanneer we onbewerkte gegevens of resultaten willen begrijpen, kunnen we vaak experimenteren met verschillende typen grafieken totdat we een grafiek tegenkomen waarin de gegevens visueel intuïtief worden uitgelegd.