Verileri Özetleme
Bu makalede Azure Machine Learning tasarımcısının bir bileşeni açıklanmaktadır.
Giriş tablosundaki her sütunu açıklayan standart istatistiksel ölçüler kümesi oluşturmak için Verileri Özetle bileşenini kullanın.
Özet istatistikleri, tam veri kümesinin özelliklerini anlamak istediğinizde yararlıdır. Örneğin, şunları bilmeniz gerekebilir:
- Her sütunda kaç eksik değer var?
- Özellik sütununda kaç tane benzersiz değer var?
- Her sütun için ortalama ve standart sapma nedir?
Bileşen her sütun için önemli puanları hesaplar ve giriş olarak sağlanan her değişken (veri sütunu) için bir özet istatistik satırı döndürür.
Verileri Özetle'yi yapılandırma
İşlem hattınıza Verileri Özetle bileşenini ekleyin. Bu bileşeni tasarımcıdaki İstatistiksel İşlevler kategorisinde bulabilirsiniz.
Rapor oluşturmak istediğiniz veri kümesini bağlayın.
Yalnızca bazı sütunları raporlamak istiyorsanız, çalışabileceğiniz sütunların bir alt kümesini yansıtmak için Veri Kümesindeki Sütunları Seç bileşenini kullanın.
Ek parametre gerekmez. Varsayılan olarak, bileşen giriş olarak sağlanan tüm sütunları analiz eder ve sütunlardaki değerlerin türüne bağlı olarak Sonuçlar bölümünde açıklandığı gibi ilgili bir istatistik kümesi oluşturur.
İşlem hattını gönderin.
Sonuçlar
Bileşenden gelen rapor aşağıdaki istatistikleri içerebilir.
Sütun adı | Description |
---|---|
Özellik | Sütunun adı |
Count | Tüm satırların sayısı |
Benzersiz Değer Sayısı | Sütundaki benzersiz değerlerin sayısı |
Eksik Değer Sayısı | Sütundaki benzersiz değerlerin sayısı |
Min | Sütundaki en düşük değer |
Max | Sütundaki en yüksek değer |
Demek | Tüm sütun değerlerinin ortalaması |
Ortalama Sapma | Sütun değerlerinin ortalama sapması |
1. Dörttebirlik | İlk dörttebirlik değer |
Medyan | Ortanca sütun değeri |
3. Dörttebirlik | Üçüncü dörttebirlik değer |
Mod | Sütun değerleri modu |
Aralık | En büyük ve en düşük değerler arasındaki değer sayısını temsil eden tamsayı |
Örnek Varyans | Sütun için varyans; nota bakın |
Örnek Standart Sapma | Sütun için standart sapma; nota bakın |
Örnek Dengesizlik | Sütun için çarpıklık; nota bakın |
Örnek Kurtozis | Sütun için basıklık; nota bakın |
P0.5 | %0,5 yüzdebirlik |
P1 | %1 yüzdebirlik |
P5 | %5 yüzdebirlik |
P95 | %95 yüzdebirlik |
P99.5 | %99,5 yüzdebirlik |
Teknik notlar
Sayısal olmayan sütunlar için yalnızca Sayı, Benzersiz değer sayısı ve Eksik değer sayısı değerleri hesaplanır. Diğer istatistikler için null değer döndürülür.
Boole değerleri içeren sütunlar şu kurallar kullanılarak işlenir:
Min hesaplanırken mantıksal bir AND uygulanır.
Max hesaplanırken mantıksal veya uygulanır
Bileşen, Aralık hesaplaması yaparken önce sütundaki benzersiz değerlerin sayısının 2'ye eşit olup olmadığını denetler.
Kayan nokta hesaplamaları gerektiren herhangi bir istatistiği hesaplarken True değerleri 1,0, False değerleri ise 0,0 olarak kabul edilir.
Sonraki adımlar
Bkz. Azure Machine Learning'de kullanılabilen bileşenler kümesi .