Power BI'da verilerin profilini oluşturma

Tamamlandı

Verilerin profilini oluşturmak verilerdeki nüansları araştırmakla ilgilidir: Anomalileri belirlemeyi, temel veri yapılarını inceleme ve geliştirmeyi ve satır sayıları, değer dağılımları, minimum ve maksimum değerler, ortalamalar gibi veri istatistiklerini sorgulamayı içerir. Bu kavram önemlidir çünkü verilerle etkileşimin ve veri dağılımını belirlemenin karmaşık olmamasını sağlamak üzere verileri şekillendirmenize ve düzenlemenize olanak tanır. Dolayısıyla rapor öğelerini geliştirmek için ön uçta verilerle çalışma görevinizi hemen hiç çaba harcamadan yerine getirmenize yardımcı olur.

Kuruluşunuzdaki Satış ekibi için raporlar geliştirdiğinizi varsayalım.  Verilerin nasıl yapılandırıldığından ve tablolarda nasıl yer aldığından emin değilsiniz, bu nedenle görselleri geliştirmeye başlamadan önce sahne gerisinde verilerin profilini oluşturmak istiyorsunuz.  Power BI'ın, bu görevlerin kolay ve sorunsuz gerçekleştirilmesini sağlayan kendi işlevselliği vardır.

Veri yapılarını inceleme

Power Query Düzenleyicisi'nde verileri incelemeye başlamadan önce verilerin düzenlenmesinde kullanılan temel veri yapıları hakkında bilgi edinmeniz gerekir. Geçerli anlam modelini Power BI Desktop model sekmesinin altında görüntüleyebilirsiniz.

Model sekmesinde, bir tablo veya sütun seçerek belirli sütun ve tablo özelliklerini düzenleyebilir ve Verileri Dönüştür düğmesini kullanarak verileri dönüştürebilirsiniz ve bu da sizi Power Query Düzenleyicisi götürür. Ayrıca, şeritte bulunan İlişkileri Yönet kullanarak farklı tablolar arasındaki ilişkileri yönetebilir, oluşturabilir, düzenleyebilir ve silebilirsiniz.

Veri anomalilerini ve veri istatistiklerini bulma

Veri kaynağına bağlantı oluşturduktan ve Veri Dönüştürme'yi seçtikten sonra Power Query Düzenleyicisi'ne getirilirsiniz ve burada, verilerinizin içinde anomaliler olup olmadığını saptayabilirsiniz.  Veri anomalileri, verilerinizin içindeki aykırı değerlerdir. Bu anomalilerin ne olduğunu belirlemek verilerinizin normal dağılımının neye benzediğini ve daha fazla araştırmanız gereken belirli veri noktaları olup olmadığını saptamanıza yardımcı olabilir. Power Query Düzenleyicisi, Sütun Dağıtımı özelliğini kullanarak veri anomalilerini belirler.

Şeritte Görünüm'ü seçin ve Veri Önizleme'nin altında birkaç seçenekten birini belirleyebilirsiniz. Veri anomalilerini ve istatistiklerini anlamak için Sütun Dağılımı, Sütun Kalitesi ve Sütun Profili seçeneklerini belirleyin.  Aşağıdaki şekilde görüntülenen istatistikler gösterilir.

Sütun kalitesi ve Sütun dağılımı , veri sütunlarının üzerindeki grafiklerde gösterilir. Sütun kalitesi geçerli, hatalı ve boş veri yüzdelerini gösterir. İdeal bir durumda verilerin yüzde 100'ünün geçerli olmasını istersiniz.

Not

Varsayılan olarak, Power Query veri kümenizin ilk 1000 satırını inceler. Bunu değiştirmek için durum çubuğunda profil oluşturma durumunu ve ardından Veri kümesinin tamamına bağlı sütun profili oluşturma'yı seçin. ]

Sütun dağılımı sütun içinde verilerin dağılımını, ayrı ve benzersiz değerlerin sayısını gösterir. Bunların her ikisi de size veri sayılarıyla ilgili ayrıntılar sağlayabilir. Benzersiz değerler, yinelenen değerler ve null değerler dahil olmak üzere bir sütundaki tüm farklı değerlerdir; benzersiz değerler ise yinelenen veya null değerleri içermez. Bu nedenle, bu tablodaki benzersiz değer sayısı toplam kaç değerin mevcut olduğunu, benzersiz ise bu değerlerden kaçının yalnızca bir kez göründüğünü bildirir.

Sütun profili , ilk 1.000 veri satırı için sütunlardaki istatistikleri daha ayrıntılı bir şekilde incelemenizi sağlar. Bu sütun, verilerinizi içeri aktarma işleminin başarılı olduğunu doğrulama açısından önemli olan satır sayısı değeri de dahil olmak üzere bazı farklı değerler sağlar. Örneğin özgün veritabanınızda 100 satır varsa, bu satır sayısını kullanarak 100 satırın gerçekten de düzgün bir şekilde içeri aktarıldığını doğrulayabilirsiniz. Buna ek olarak, bu satır sayısı Power BI'ın aykırı değer, boş satır ve dize olarak kabul ettiği satır sayısını ve sütundaki en küçük ve en büyük değeri belirten en küçük ve en büyük değeri gösterir. Bu ayrım özellikle sayısal veriler söz konusu olduğunda önemlidir, çünkü işletmenizin "maksimum" olarak tanımladığı değerin ötesinde bir maksimum değere sahipseniz sizi hemen bilgilendirir. Bu değer, bu değerlere dikkat etmenizi sağlar. Bu sayede verileri daha ayrıntılı bir şekilde incelerken çabalarınızı odaklayabilirsiniz.  Önceki resimde gösterildiği gibi verilerin bir metin sütununda yer alması durumunda, minimum değer alfabetik sıraya göre ilk değer ve maksimum değer de son değerdir.

Buna ek olarak, Değer dağıtım grafiği size belirli bir sütundaki her bir ayrı değerin sayısını bildirir. Önceki görüntüdeki grafiğe baktığınızda, değer dağılımının SalesPerson sütununda "Anthony Gross" değerinin en fazla kez göründüğünü ve "Lily Code"un en az sayıda göründüğünü gösterdiğine dikkat edin. Bu bilgiler aykırı değerleri belirlediği için özellikle önemlidir.  Sütunda bir değer diğer değerlerden çok daha fazla görünüyorsa, Değer dağılımı özelliği bunun nedenine bulmak için araştırmanıza başlayabileceğiniz noktayı belirlemenizi sağlar.

Sayısal sütunda , Sütun İstatistikleri sütundaki ortalama değer, sütundaki değerlerin standart sapması ve sütundaki çift ve tek değerlerin sayısıyla birlikte kaç sıfır ve null değer olduğunu da içerir. Bu istatistikler size sütundaki verilerin dağılımıyla ilgili bir fikir verir. Bunlar, sütundaki verileri özetledikleri ve aykırı değerleri saptamak için başlangıç noktası işlevi gördükleri için önemlidir.

Örneğin, fatura verilerine bakarken Değer dağıtım grafiğinde SalesPerson sütunundaki birkaç satış temsilcisinin verilerde aynı sayıda gösterildiğini fark edeceksiniz. Ayrıca , Kar sütununda ve diğer birkaç tabloda da aynı durumun oluştuğuna dikkat edin. Araştırmanız sırasında kullandığınız verilerin hatalı veriler olduğunu ve yenilenmeleri gerektiğini keşfediyor ve yenileme işlemini hemen tamamlıyorsunuz. Bu grafiği görüntülemeden bu hatayı bu kadar çabuk göremezdiniz. İşte bu nedenle değer dağılımı çok önemlidir.

Power Query Düzenleyicisi'de düzenlemelerinizi tamamladıktan ve görsel oluşturmaya hazır olduktan sonra, Power Query Düzenleyicisi şeritte Giriş'e dönün. Uygula & Kapat'ı seçin; bu işlem sizi Power BI Desktop döndürür ve tüm sütun düzenlemeleri/dönüştürmeleri de uygulanır.

Artık Power BI'da veri yükleme, sütunlardaki verilerin türü ve biçimi hakkında netlik kazanmak ve daha fazla düzenleme yapmak, veri anomalilerini bulmak ve Power Query Düzenleyicisi veri istatistiklerini görüntülemek için sütun özelliklerini sorgulamayı içeren, Power BI'da profil oluşturma verilerini oluşturan öğeleri belirlediniz. Bu bilgiyle, verilerinizle verimli ve etkili bir şekilde çalışma becerisini de araç kutunuza ekleyebilirsiniz.