Verileri görselleştirme

Tamamlandı

Veri bilimciler verileri daha iyi anlamak için görselleştirir. Ham verileri tarayabilir, ortalamalar gibi özet ölçüleri inceler veya verileri graf edebilir. Grafikler, verileri görselleştirmenin güçlü bir aracıdır ve veri bilimciler genellikle orta düzeyde karmaşık desenleri hızla ayırt etmek için grafları kullanır.

Verileri görsel olarak temsil etme

Graf, sonuçları anlamak, aykırı değerleri bulmak, sayıların nasıl dağıtıldığını incelemek vb. için yararlı olabilecek hızlı bir nitel veri değerlendirmesi sağlamak için yapılır.

Bazen ne tür bir grafiğin en yararlı olacağını önceden bilirken, diğer zamanlarda grafikleri keşif amacıyla kullanırız. Veri görselleştirmenin gücünü anlamak için şu verileri göz önünde bulundurun: kendi kendine çalışan bir arabanın konumu (x,y). Verilerin ham biçiminde gerçek desenleri görmek zordur. Ortalama veya ortalama, aracın yolunun x=0,2 ve y=0,3 çevresinde ortalandığını ve sayı aralığının yaklaşık -2 ile 2 arasında olduğunu gösterir.

Saat Konum-X Konum-Y
0 0 2
1 1,682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1,313973 1.507805
12 0.00001 0.00001
13 (on üç) 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

Zaman içinde Location-X'i çizersek 7 ile 12 arasında bazı eksik değerlerimiz olduğunu görebiliriz.

Zamana göre çizilmiş Location-X koordinatlarının grafiği.

X ve Y'nin grafiğini çizersek, arabanın nereye gittiğinin bir haritasını veririz. Arabanın bir daire içinde ve bir noktada dairenin ortasına doğru sürdüğü anında açıktır.

Çizilen Location-X ve Location-Y koordinatlarının grafiği.

Grafikler, yukarıdakiler gibi 2B dağılım çizimleriyle sınırlı değildir. Verilerinizin diğer yönlerini keşfetmek için kullanılabilirler; örneğin, orantılar (pasta grafikler ve yığılmış çubuk grafikler) ve verilerin nasıl yayıldığı (histogramlar ve kutu ve çizgi çizimleri). Genellikle ham verileri veya sonuçları anlamaya çalışırken, verileri görsel olarak sezgisel bir şekilde açıklayan bir grafikle karşılaşana kadar farklı grafik türleriyle denemeler yapmalıyız.