Vizualizace dat

Dokončeno

Datoví vědci vizualizují data, aby je lépe pochopili. Mohou kontrolovat nezpracovaná data, zkoumat souhrnné míry, jako jsou průměry nebo grafy dat. Grafy představují efektivní způsob vizualizace dat a datoví vědci často používají grafy k rychlému rozlišení středně složitých vzorů.

Vizuální znázornění dat

Grafování se provádí tak, aby poskytovalo rychlé kvalitativní hodnocení našich dat, což může být užitečné pro pochopení výsledků, zjištění odlehlejších hodnot, zkoumání způsobu distribuce čísel atd.

I když někdy předem víme, jaký druh grafu bude nejužitečnější, jindy používáme grafy průzkumným způsobem. Abyste porozuměli výkonu vizualizace dat, zvažte následující data: umístění (x,y) autojezdu. V nezpracované podobě dat je těžké vidět žádné skutečné vzory. Střední hodnota nebo průměr nám říká, že cesta auta byla vycentrována kolem x=0,2 a y=0,3 a zdá se, že rozsah čísel je mezi -2 a 2.

Čas Location-X Umístění Y
0 0 2
0 1.682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1.313973 1.507805
12 0.00001 0.00001
13 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

Pokud teď v průběhu času vykreslujeme hodnotu Location-X, vidíme, že mezi 7 a 12 chybí některé hodnoty.

Graph of Location-X coordinates plotted against time.

Pokud v grafu X versus Y vytvoříme mapu místa, kde auto jelo. Je okamžitě zřejmé, že auto jelo v kruhu a v určitém okamžiku jelo do středu tohoto kruhu.

Graph of Location-X and Location-Y coordinates plotted.

Grafy nejsou omezené na 2D bodové grafy, jako jsou grafy uvedené výše. Dají se použít k prozkoumání dalších aspektů vašich dat; Například proporce (výsečové grafy a skládané pruhové grafy) a způsob šíření dat (histogramy a krabicové grafy). Když se často snažíme porozumět nezpracovaným datům nebo výsledkům, můžeme experimentovat s různými typy grafů, dokud nenarazíme na graf, který vysvětluje data vizuálně intuitivně.