Verileri Özetleme

Bu makalede Azure Machine Learning tasarımcısının bir bileşeni açıklanmaktadır.

Giriş tablosundaki her sütunu açıklayan standart istatistiksel ölçüler kümesi oluşturmak için Verileri Özetle bileşenini kullanın.

Özet istatistikleri, tam veri kümesinin özelliklerini anlamak istediğinizde yararlıdır. Örneğin, şunları bilmeniz gerekebilir:

  • Her sütunda kaç eksik değer var?
  • Özellik sütununda kaç tane benzersiz değer var?
  • Her sütun için ortalama ve standart sapma nedir?

Bileşen her sütun için önemli puanları hesaplar ve giriş olarak sağlanan her değişken (veri sütunu) için bir özet istatistik satırı döndürür.

Verileri Özetle'yi yapılandırma

  1. İşlem hattınıza Verileri Özetle bileşenini ekleyin. Bu bileşeni tasarımcıdaki İstatistiksel İşlevler kategorisinde bulabilirsiniz.

  2. Rapor oluşturmak istediğiniz veri kümesini bağlayın.

    Yalnızca bazı sütunları raporlamak istiyorsanız, çalışabileceğiniz sütunların bir alt kümesini yansıtmak için Veri Kümesindeki Sütunları Seç bileşenini kullanın.

  3. Ek parametre gerekmez. Varsayılan olarak, bileşen giriş olarak sağlanan tüm sütunları analiz eder ve sütunlardaki değerlerin türüne bağlı olarak Sonuçlar bölümünde açıklandığı gibi ilgili bir istatistik kümesi oluşturur.

  4. İşlem hattını gönderin.

Sonuçlar

Bileşenden gelen rapor aşağıdaki istatistikleri içerebilir.

Sütun adı Description
Özellik Sütunun adı
Count Tüm satırların sayısı
Benzersiz Değer Sayısı Sütundaki benzersiz değerlerin sayısı
Eksik Değer Sayısı Sütundaki benzersiz değerlerin sayısı
Min Sütundaki en düşük değer
Max Sütundaki en yüksek değer
Demek Tüm sütun değerlerinin ortalaması
Ortalama Sapma Sütun değerlerinin ortalama sapması
1. Dörttebirlik İlk dörttebirlik değer
Medyan Ortanca sütun değeri
3. Dörttebirlik Üçüncü dörttebirlik değer
Mod Sütun değerleri modu
Aralık En büyük ve en düşük değerler arasındaki değer sayısını temsil eden tamsayı
Örnek Varyans Sütun için varyans; nota bakın
Örnek Standart Sapma Sütun için standart sapma; nota bakın
Örnek Dengesizlik Sütun için çarpıklık; nota bakın
Örnek Kurtozis Sütun için basıklık; nota bakın
P0.5 %0,5 yüzdebirlik
P1 %1 yüzdebirlik
P5 %5 yüzdebirlik
P95 %95 yüzdebirlik
P99.5 %99,5 yüzdebirlik

Teknik notlar

  • Sayısal olmayan sütunlar için yalnızca Sayı, Benzersiz değer sayısı ve Eksik değer sayısı değerleri hesaplanır. Diğer istatistikler için null değer döndürülür.

  • Boole değerleri içeren sütunlar şu kurallar kullanılarak işlenir:

    • Min hesaplanırken mantıksal bir AND uygulanır.

    • Max hesaplanırken mantıksal veya uygulanır

    • Bileşen, Aralık hesaplaması yaparken önce sütundaki benzersiz değerlerin sayısının 2'ye eşit olup olmadığını denetler.

    • Kayan nokta hesaplamaları gerektiren herhangi bir istatistiği hesaplarken True değerleri 1,0, False değerleri ise 0,0 olarak kabul edilir.

Sonraki adımlar

Bkz. Azure Machine Learning'de kullanılabilen bileşenler kümesi .