Visualiser data

Fuldført

Datateknikere visualiserer data for at forstå dem bedre. De kan scanne rådata, undersøge oversigtsmålinger, f.eks. gennemsnit, eller grafere dataene. Grafer er et effektivt middel til at visualisere data, og dataforskere bruger ofte grafer til hurtigt at skelne moderat komplekse mønstre.

Repræsenterer data visuelt

Grafering udføres for at give en hurtig kvalitativ vurdering af vores data, hvilket kan være nyttigt til at forstå resultater, finde afvigende værdier, undersøge, hvordan tal distribueres osv.

Mens vi nogle gange ved på forhånd, hvilken type graf der vil være mest nyttig, andre gange bruger vi grafer på en udforskende måde. Hvis du vil forstå styrken ved datavisualisering, skal du overveje følgende data: placeringen (x,y) af en selvkørende bil. I dataenes rå form er det svært at se nogen reelle mønstre. Middelværdien eller gennemsnittet fortæller os, at bilens sti var centreret omkring x=0,2 og y=0,3, og talintervallet ser ud til at være mellem ca. -2 og 2.

Tidspunkt Location-X Location-Y
0 0 2
1 1.682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1.313973 1.507805
12 0.00001 0.00001
13 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

Hvis vi nu afbilder Location-X over tid, kan vi se, at vi synes at have nogle manglende værdier mellem gange 7 og 12.

Graf over Location-X koordinater afbildet i forhold til tiden.

Hvis vi graf X versus Y, vi ender med et kort over, hvor bilen har kørt. Det er øjeblikkeligt indlysende, at bilen har kørt i en cirkel og på et tidspunkt kørte til midten af denne cirkel.

Graf over afbildede Location-X og Location-Y koordinater.

Grafer er ikke begrænset til 2D-punktdiagrammer som dem ovenfor. De kan bruges til at udforske andre aspekter af dine data. f.eks. proportioner (cirkeldiagrammer og stablede liggende søjlediagrammer), og hvordan dataene spredes (histogrammer og kassediagrammer). Når vi forsøger at forstå rådata eller resultater, kan vi ofte eksperimentere med forskellige typer grafer, indtil vi støder på en, der forklarer dataene visuelt intuitivt.