Adatok vizualizációja
Az adattudósok az adatok jobb megértése érdekében vizualizálják az adatokat. Megvizsgálhatják a nyers adatokat, megvizsgálhatják az összefoglaló mértékeket, például az átlagokat, vagy grafikonon ábrázolhatják az adatokat. A gráfok hatékony eszközök az adatok vizualizációjára, és az adattudósok gyakran használnak grafikonokat a közepesen összetett minták gyors felismerésére.
Adatok vizuális megjelenítése
A gráfozással gyors minőségi értékelést végezhetünk adatainkról, ami hasznos lehet az eredmények megértéséhez, a kiugró értékek megtalálásához, a számok elosztásának vizsgálatához stb.
Bár néha előre tudjuk, hogy milyen gráfok lesznek a leg hasznosak, máskor feltáró módon használjuk a gráfokat. Az adatvizualizáció erejének megértéséhez vegye figyelembe az alábbi adatokat: egy önvezető autó helyét (x,y). Az adatok nyers formájában nehéz valódi mintákat látni. A középérték vagy az átlag azt jelzi, hogy az autó útvonala x=0,2 és y=0,3 körül volt, és úgy tűnik, hogy a számok tartománya körülbelül -2 és 2 között van.
| Idő | Location-X | Location-Y |
|---|---|---|
| 0 | 0 | 2 |
| 0 | 1,682942 | 1.080605 |
| 2 | 1.818595 | -0.83229 |
| 3 | 0.28224 | -1.97998 |
| 4 | -1.5136 | -1.30729 |
| 5 | -1.91785 | 0.567324 |
| 6 | -0.55883 | 1.920341 |
| 7 | 1.313973 | 1.507805 |
| 12 | 0.00001 | 0.00001 |
| 13 | 0.840334 | 1.814894 |
| 14 | 1.981215 | 0.273474 |
| 15 | 1.300576 | -1.51938 |
| 16 | -0.57581 | -1.91532 |
| 17 | -1.92279 | -0.55033 |
| 18 | -1.50197 | 1.320633 |
| 19 | 0.299754 | 1.977409 |
| 20 | 1.825891 | 0.816164 |
Ha az idő függvényében ábrázoljuk a Location-X értéket, láthatjuk, hogy a 7 és 12 közötti időszakban hiányzó értékek jelennek meg.
Ha X-et és Y-t ábrázolunk, a végén egy térképet készítünk, amelyen az autó vezetett. Azonnal nyilvánvaló, hogy az autó egy körben vezetett, és egy ponton a kör közepére hajtott.
A gráfok nem korlátozódnak a fentihez hasonló 2D pontdiagramokra. Ezek felhasználhatók az adatok egyéb aspektusainak feltárására; például arányok (kördiagramok és halmozott sávdiagramok) és az adatok eloszlásának módja (hisztogramok és doboz- és forgódiagramok). Gyakran előfordulhat, hogy amikor nyers adatokat vagy eredményeket próbálunk megérteni, különböző típusú gráfokkal kísérletezhetünk, amíg olyannal nem találkozunk, amely vizuálisan intuitív módon magyarázza az adatokat.