Verileri görselleştirme
Veri bilimciler verileri daha iyi anlamak için görselleştirir. Ham verileri tarayabilir, ortalamalar gibi özet ölçüleri inceler veya verileri graf edebilir. Grafikler, verileri görselleştirmenin güçlü bir aracıdır ve veri bilimciler genellikle orta düzeyde karmaşık desenleri hızla ayırt etmek için grafları kullanır.
Verileri görsel olarak temsil etme
Graf, sonuçları anlamak, aykırı değerleri bulmak, sayıların nasıl dağıtıldığını incelemek vb. için yararlı olabilecek hızlı bir nitel veri değerlendirmesi sağlamak için yapılır.
Bazen ne tür bir grafiğin en yararlı olacağını önceden bilirken, diğer zamanlarda grafikleri keşif amacıyla kullanırız. Veri görselleştirmenin gücünü anlamak için şu verileri göz önünde bulundurun: kendi kendine çalışan bir arabanın konumu (x,y). Verilerin ham biçiminde gerçek desenleri görmek zordur. Ortalama veya ortalama, aracın yolunun x=0,2 ve y=0,3 çevresinde ortalandığını ve sayı aralığının yaklaşık -2 ile 2 arasında olduğunu gösterir.
| Saat | Konum-X | Konum-Y |
|---|---|---|
| 0 | 0 | 2 |
| 1 | 1,682942 | 1.080605 |
| 2 | 1.818595 | -0.83229 |
| 3 | 0.28224 | -1.97998 |
| 4 | -1.5136 | -1.30729 |
| 5 | -1.91785 | 0.567324 |
| 6 | -0.55883 | 1.920341 |
| 7 | 1,313973 | 1.507805 |
| 12 | 0.00001 | 0.00001 |
| 13 (on üç) | 0.840334 | 1.814894 |
| 14 | 1.981215 | 0.273474 |
| 15 | 1.300576 | -1.51938 |
| 16 | -0.57581 | -1.91532 |
| 17 | -1.92279 | -0.55033 |
| 18 | -1.50197 | 1.320633 |
| 19 | 0.299754 | 1.977409 |
| 20 | 1.825891 | 0.816164 |
Zaman içinde Location-X'i çizersek 7 ile 12 arasında bazı eksik değerlerimiz olduğunu görebiliriz.
X ve Y'nin grafiğini çizersek, arabanın nereye gittiğinin bir haritasını veririz. Arabanın bir daire içinde ve bir noktada dairenin ortasına doğru sürdüğü anında açıktır.
Grafikler, yukarıdakiler gibi 2B dağılım çizimleriyle sınırlı değildir. Verilerinizin diğer yönlerini keşfetmek için kullanılabilirler; örneğin, orantılar (pasta grafikler ve yığılmış çubuk grafikler) ve verilerin nasıl yayıldığı (histogramlar ve kutu ve çizgi çizimleri). Genellikle ham verileri veya sonuçları anlamaya çalışırken, verileri görsel olarak sezgisel bir şekilde açıklayan bir grafikle karşılaşana kadar farklı grafik türleriyle denemeler yapmalıyız.