Veri akışlarını kullanarak boyutsal model oluşturmaya yönelik en iyi yöntemler

Tavsiye

Power BI Veri Akışı 1. Nesil artık eski bir durumdadır ve yeni özellik yatırımı almaz. Fabric erişimi olan Premium müşteriler için önerilen yol Dataflow Gen2 olup performans, ölçek, güvenilirlik, işlevsellik ve yerleşik yapay zeka geliştirmeleri sunar. Pro/PPU müşterileri, bu senaryolar için 2. Nesil kılavuzu geliştikçe 1. Nesil'i kullanmaya devam edebilir. Yükseltme kılavuzu için bkz. Dataflow 1. Nesil'den Dataflow 2. Nesil'e yükseltme.

Boyutsal model tasarlamak, veri akışıyla gerçekleştirebileceğiniz en yaygın görevlerden biridir. Bu makalede, veri akışı kullanarak boyutsal model oluşturmaya yönelik en iyi uygulamalardan bazıları vurgulanır.

Ara katman veri akışları

Veri tümleştirme sistemindeki önemli noktalardan biri, kaynak işletim sisteminden okuma sayısını azaltmaktır. Geleneksel veri tümleştirme mimarisinde bu azaltma, hazırlama veritabanı olarak adlandırılan yeni bir veritabanı oluşturularak gerçekleştirilir. Hazırlama veritabanının amacı, veri kaynağından veriyi olduğu gibi alıp düzenli bir zamanlamayla hazırlama veritabanına yüklemektir.

Veri tümleştirmesinin geri kalanı daha sonra geçici veritabanını kaynak olarak kullanarak, ekstra dönüşüm uygulayıp boyutsal model yapısına aktarılır.

Veri akışlarını kullanarak aynı yaklaşımı izlemenizi öneririz. Yalnızca kaynak sistemden (ve yalnızca ihtiyacınız olan tablolar için) veri as-is yüklemekten sorumlu bir veri akışları kümesi oluşturun. Sonuç daha sonra veri akışının depolama yapısında (Azure Data Lake Storage veya Dataverse) depolanır. Bu değişiklik, kaynak sistemden okuma işleminin en düşük düzeyde olmasını sağlar.

Ardından, verilerini hazırlanmış veri akışlarından kaynaklayan başka veri akışları oluşturabilirsiniz. Bu yaklaşımın avantajları şunlardır:

  • Kaynak sistemdeki okuma işlemlerinin sayısını azaltma ve sonuç olarak kaynak sistemdeki yükü azaltma.
  • Şirket içi veri kaynağı kullanılıyorsa veri ağ geçitlerindeki yükü azaltma.
  • Kaynak sistem verilerinin değişmesi durumunda mutabakat amacıyla verilerin ara kopyasına sahip olma.
  • Dönüştürme veri akışlarını kaynaklardan bağımsız hale getirme.

Veri akışlarını hazırlarken akışı gösteren diyagram.

Hazırlama veri akışlarını ve hazırlama depolama alanını vurgulayan diyagram. Diyagramda, hazırlık veri akışı tarafından veri kaynağından erişilen veriler ve tabloların Kadavralar veya Azure Data Lake Storage'da depolandığı gösterilmektedir. Tablolar daha sonra diğer veri akışlarıyla birlikte dönüştürülerek sorgu olarak gönderilir.

Veri akışlarını dönüştürme

Dönüştürme veri akışlarınızı hazırlama veri akışlarından ayırdığınızda, dönüştürme kaynaktan bağımsızdır. Bu ayrım, kaynak sistemi yeni bir sisteme geçiriyorsanız yardımcı olur. Bu durumda yapmanız gereken tek şey hazırlama veri akışlarını değiştirmektir. Dönüştürme veri akışları, yalnızca hazırlama veri akışlarından kaynaklandığından sorunsuz çalışır.

Bu ayırma, kaynak sistem bağlantısının yavaş olması durumunda da yardımcı olur. Dönüştürme veri akışının kaynak sistemden yavaş bir bağlantı üzerinden gelen kayıtları almak için uzun süre beklemesi gerekmez. Hazırlama veri akışı bu bölümü zaten yapmıştır ve veriler dönüştürme katmanı için hazırdır.

Dönüşümlerin vurgulandığı ve verilerin veri ambarı'na gönderildiği durumlar dışında, önceki görüntüye benzer diyagram.

Katmanlı Mimari

Katmanlı mimari, eylemleri ayrı katmanlar halinde gerçekleştirdiğiniz bir mimaridir. Hazırlama ve dönüştürme veri akışları, çok katmanlı bir veri akışı mimarisinin iki katmanı olabilir. Katmanlar halinde eylem yapmaya çalışmak, gereken en düşük bakımı sağlar. Bir şeyi değiştirmek istediğinizde, yalnızca bulunduğu katmanda değiştirmeniz yeterlidir. Diğer katmanların tümü sorunsuz çalışmaya devam etmelidir.

Aşağıdaki görüntüde, tablolarının Power BI anlam modellerinde kullanıldığı veri akışları için çok katmanlı bir mimari gösterilmektedir.

Hazırlama veri akışlarının ve dönüştürme veri akışlarının ayrı katmanlarda yer aldığı çok katmanlı bir mimariyi gösteren diyagram.

Hesaplanan tabloyu mümkün olduğunca kullanma

Bir veri akışının sonucunu başka bir veri akışında kullandığınızda, hesaplanan tablo kavramını kullanırsınız; bu da "zaten işlenmiş ve depolanmış" bir tablodan veri alma anlamına gelir. Aynı şey bir veri akışı içinde de gerçekleşebilir. Başka bir tablodan bir tabloya başvururken hesaplanmış tabloyu kullanabilirsiniz. Bu yöntem, yaygın dönüştürmeler olarak adlandırılan birden çok tabloda yapılması gereken bir dizi dönüştürmeniz olduğunda yararlıdır.

Yaygın dönüştürmeleri işlemek için kullanılan bir veri kaynağından alınan hesaplanan tabloyu gösteren diyagram.

Önceki görüntüde hesaplanan tablo verileri doğrudan kaynaktan alır. Ancak, hazırlama ve dönüştürme veri akışlarının mimarisinde, hesaplanan tabloların hazırlama veri akışlarından kaynaklanma olasılığı yüksektir.

Yaygın dönüşümleri işlemek için kullanılan veri akışlarından alınan hesaplanan tabloyu gösteren diyagram.

Yıldız şeması oluşturma

En iyi boyutlu model, modelden verileri sorgulama süresini en aza indirmek için tasarlanmış boyutlara ve olgu tablolarına sahip bir yıldız şeması modelidir. Yıldız şeması modeli, veri görselleştiricisi için anlaşılmasını da kolaylaştırır.

İşletim sisteminin aynı düzenindeki verileri bir BI sistemine getirmek ideal değildir. Veri tabloları yeniden modellenmelidir. Tablolardan bazıları, açıklayıcı bilgileri tutan bir boyut tablosu biçiminde olmalıdır. Tablolardan bazıları, toplayıcı verileri tutmak için olgu tablosu biçiminde olmalıdır. Olgu tablolarının ve boyut tablolarının oluşturulacağı en iyi düzen bir yıldız şemasıdır. Daha fazla bilgi için Yıldız şemasını ve Power BI'ın önemini anlama bölümüne gidin.

Beş noktalı yıldız şeklinde boyut tabloları ile çevrili olgu tablosunu gösteren yıldız şeması diyagramı.

Boyutlar için benzersiz bir anahtar değeri kullanma

Boyut tabloları oluştururken her biri için bir anahtarınız olduğundan emin olun. Bu anahtar, boyutlar arasında çoka çok (veya başka bir deyişle "zayıf") ilişki olmamasını sağlar. Bir sütunun veya sütun birleşiminin boyutta benzersiz satırlar döndürdiğinden emin olmak için bazı dönüştürmeler uygulayarak anahtarı oluşturabilirsiniz. Ardından bu sütun birleşimi, veri akışındaki tabloda anahtar olarak işaretlenebilir.

Anahtar olarak işaretle seçeneğinin ve tablonun tarih sütunundaki anahtar simgesinin vurgulanmış olduğu Power Query dönüştürme sekmesinin ekran görüntüsü.

Büyük gerçek tabloları için kademeli yenileme yapın

Olgu tabloları her zaman boyutsal modeldeki en büyük tablolardır. Bu tablolar için aktarılan satır sayısını azaltmanızı öneririz. Çok büyük bir olgu tablonuz varsa, bu tablo için artımlı yenileme kullandığınızdan emin olun. Artımlı yenileme, Power BI anlam modelinde ve veri akışı tablolarında da yapılabilir.

Değişen verilerin yalnızca bir bölümünü yenilemek için artımlı yenilemeyi kullanabilirsiniz. Verilerin hangi bölümünün yenileneceklerini ve hangi bölümünün kalıcı olacağını belirlemek için birden çok seçenek vardır. Daha fazla bilgi için Power BI veri akışlarıyla artımlı yenileme kullanma bölümüne gidin.

Veri akışları için artımlı yenileme ayarı iletişim kutusunun ekran görüntüsü.

Boyutlar ve olgu tabloları oluşturmak için referans almak

Kaynak sistemde genellikle veri ambarında hem olgu hem de boyut tabloları oluşturmak için kullandığınız bir tablonuz vardır. Bu tablolar, hesaplanan tablolar ve ayrıca ara veri akışları için iyi adaylardır. İşlemin veri temizleme ve ek satır ve sütunları kaldırma gibi ortak bölümü bir kez yapılabilir. Bu eylemlerin çıkışından bir referans kullanarak boyut ve olgu tablolarını üretebilirsiniz. Bu yaklaşım, ortak dönüştürmeler için hesaplanan tabloyu kullanır.

Siparişler sorgusunda başvuru seçeneğinin kullanılmasıyla oluşturulan, Toplanan Siparişler adlı yeni bir sorguyu gösteren ekran görüntüsü.