Adatok vizualizációja

Befejeződött

Az adattudósok az adatok jobb megértése érdekében vizualizálják az adatokat. Megvizsgálhatják a nyers adatokat, megvizsgálhatják az összefoglaló mértékeket, például az átlagokat, vagy grafikonon ábrázolhatják az adatokat. A gráfok hatékony eszközök az adatok vizualizációjára, és az adattudósok gyakran használnak grafikonokat a közepesen összetett minták gyors felismerésére.

Adatok vizuális megjelenítése

A gráfozással gyors minőségi értékelést végezhetünk adatainkról, ami hasznos lehet az eredmények megértéséhez, a kiugró értékek megtalálásához, a számok elosztásának vizsgálatához stb.

Bár néha előre tudjuk, hogy milyen gráfok lesznek a leg hasznosak, máskor feltáró módon használjuk a gráfokat. Az adatvizualizáció erejének megértéséhez vegye figyelembe az alábbi adatokat: egy önvezető autó helyét (x,y). Az adatok nyers formájában nehéz valódi mintákat látni. A középérték vagy az átlag azt jelzi, hogy az autó útvonala x=0,2 és y=0,3 körül volt, és úgy tűnik, hogy a számok tartománya körülbelül -2 és 2 között van.

Idő Location-X Location-Y
0 0 2
0 1,682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1.313973 1.507805
12 0.00001 0.00001
13 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

Ha az idő függvényében ábrázoljuk a Location-X értéket, láthatjuk, hogy a 7 és 12 közötti időszakban hiányzó értékek jelennek meg.

Az idő alapján ábrázolt Location-X koordináták grafikonja.

Ha X-et és Y-t ábrázolunk, a végén egy térképet készítünk, amelyen az autó vezetett. Azonnal nyilvánvaló, hogy az autó egy körben vezetett, és egy ponton a kör közepére hajtott.

Ábrázolt Location-X és Location-Y koordináták grafikonja.

A gráfok nem korlátozódnak a fentihez hasonló 2D pontdiagramokra. Ezek felhasználhatók az adatok egyéb aspektusainak feltárására; például arányok (kördiagramok és halmozott sávdiagramok) és az adatok eloszlásának módja (hisztogramok és doboz- és forgódiagramok). Gyakran előfordulhat, hogy amikor nyers adatokat vagy eredményeket próbálunk megérteni, különböző típusú gráfokkal kísérletezhetünk, amíg olyannal nem találkozunk, amely vizuálisan intuitív módon magyarázza az adatokat.