Ambardaki verileri modelleme
Veri modellemesi olmadan, her consumer hangi tabloların birbiriyle ilişkili olduğunu belirlemeli, kendi toplama mantığını yazmalı ve sütun anlamlarına göre tahminde bulunmalı. Veri modelleme, yapıyı, iş mantığını ve belgeleri doğrudan ambara ekleyerek bu sorunu çözer. Microsoft Fabric ambarında verileri netlik sağlamak için hazırlar, tablolar arasındaki ilişkileri tanımlar, görünümler ve ölçütler aracılığıyla erişimi standartlaştırır ve raporlama için anlamsal modeller yayımlarsınız. Bu modelleme seçenekleri T-SQL sorguları, Power BI raporları ve yapay zeka temelli doğal dil analizi dahil olmak üzere her aşağı akış deneyimini etkiler.
Verileri kullanıma hazırlama
İlişkileri tanımlamadan veya hesaplama eklemeden önce, tüketicilerin gördüklerini temizlemeniz gerekir. Ham veri ambarı tabloları, genellikle geçici hazırlama tablolarını, vekil anahtar sütunlarını ve ETL süreçleri için olup analiz için olmayan iç işaretleyicileri içerir. Tüketiciler verilere göz atarken bu nesneler kirlilik oluşturur. Deponun tüketim için hazırlanması, yalnızca ilgili olanları yüzeye çıkarmak ve anlaşılır hale getirmek anlamına gelir.
Model görünümünde, tüketici deneyimini geliştirmek için birkaç adım atabilirsiniz.
- Geçiş tabloları, vekil anahtar sütunları ve ETL süreç öğeleri gibi iç nesneleri alan listesini dolduran öğelerden saklayın.
- Teknik veya kısaltılmış ambar sütun adlarını, işletmeye uygun adlarla değiştirmek için sütunları yeniden adlandırın. Örneğin,
CustRgnöğesiniCustomer Regionolarak yeniden adlandırın. - Tüketicilerin dış belgelere başvurmadan verilerin neyi temsil ettiğini anlaması için tablolara ve sütunlara açıklama ekleyin.
Bu adımlar sadece düzenlilikten ötesini etkiler. Power BI ve Fabric IQ veri aracılarındaki copilot, doğal dil sorularını yorumlamak ve doğru SQL veya DAX oluşturmak için tablo adlarını, sütun adlarını ve açıklamalarını kullanır. "Customer Region gibi bir açıklamaya sahip olan, "Müşterinin birincil adresinin coğrafi bölgesi" adlı sütun, açıklama olmadan olan CustRgn sütundan daha iyi doğal dil sonuçları üretir."
Temiz, iyi adlandırılmış tablolar hazır durumdayken, bu tabloların birbirine nasıl bağlanacaklarını tanımlamaya hazırsınız.
Tablolar arasındaki ilişkileri anlama
İlişki, bu tablolar arasında filtreleme, gruplandırma ve toplamayı etkinleştiren iki tablo arasındaki mantıksal bir bağlantıdır. Yıldız şemasında ilişkiler, olgu tablolarını paylaşılan anahtar sütunları aracılığıyla boyut tablolarına bağlar.
Örneğin, hem FactSales hem de DimCustomer içinde bulunan bir CustomerKey sütunu, bölge, segment veya hesap türü gibi müşteri özniteliklerine göre satış analizini sağlayan bağlantıyı kurar.
Her ilişkinin iki önemli özelliği vardır.
- Kardinalite , iki tablodaki satırların nasıl karşılık olduğunu açıklar. Yıldız şemasında, olgudan boyuta ilişkiler genellikle çoka birdir; bu da birçok olgu satırının tek bir boyut satırına eşlendiği anlamına gelir.
- Çapraz filtre yönü , filtrelerin tablolar arasında hangi yolla yayılma şeklini belirler. Boyutun olgu tablosunu filtrelediği tek yön, filtre davranışını tahmin edilebilir ve performanslı tuttuğundan çoğu yıldız şeması tasarımı için standart ayardır.
Tanımlı ilişkiler olmadan, tablolar arasında verileri birleştirmek isteyen her kullanıcı, açıkça JOIN mantığı yazması gerekmektedir. İlişkiler, bağlantıyı bir kez kodlayarak bu yinelemeyi ortadan kaldırır. Ambardan bir anlam modeli oluşturduğunuzda, bu ilişkiler Power BI, Copilot ve Fabric IQ veri aracılarının verileri nasıl yorumladığını etkiler. Örneğin veri aracıları, doğal dil sorularını SQL'e çevirirken doğru birleşimler oluşturmak için ilişkileri kullanır.
Not
Çoğu veri ambarı boyutsal modelleme kullanır. Analiz için ideal bir model olan yıldız şemasını şekillendirmek için ilişkiler oluşturulabilir. Daha fazla bilgi için Microsoft Fabric'te boyutsal modelleri tasarlama modülüne bakın.
Veri erişimini görünümler ve ölçülerle standartlaştırın
Tablolarınızın temiz ve bağlantılı olduğuna göre, bir sonraki adım tüketicilere bu verileri sorgulamak ve hesaplamak için güvenilir ve tutarlı yollar sunmaktır. Standartlaştırma olmadan, her ekip kendi birleştirme mantığını yazar, kendi filtrelerini uygular ve kendi formüllerini tanımlar ve bu da çakışan sonuçlara yol açar.
Görünümler , T-SQL tüketicileri için bu tutarlılığı sağlar. Görünüm, birleşim mantığını, filtreleri ve sütun seçimlerini, tüketicilerin tablo gibi başvurduğu yeniden kullanılabilir bir sorguda kapsüller. Örneğin olgu ve boyut tablolarını birleştiren, tamamlanan siparişlere filtre ekleyen ve yalnızca analistlerin ihtiyaç duyduğu sütunları ortaya çıkartan bir görünüm, her T-SQL consumer güvenilir bir başlangıç noktası sağlar. Görünümler, raporlar için kararlı veri kaynakları olarak da görev alır. Raporları doğrudan değişebilecek temel tablolara göre oluşturmak yerine, tutarlı bir şekil sunan görünümlere işaret edebilirsiniz.
Ölçüler DAX hesaplamaları için aynı tutarlılığı sağlar. Ölçü, toplam, ortalama, oran veya sayı gibi bir hesaplamayı tanımlayan yeniden kullanılabilir bir DAX ifadesidir. Bir tablo seçip yeni bir ölçü ekleyerek ölçüleri doğrudan ambar modeli görünümünde oluşturursunuz. Örneğin, Total Sales sütununu toplayan bir SalesAmount ölçüsü, her bir tüketicinin aynı hesaplamayı kullanmasını sağlamak için bir yöntem sunar.
Ölçü tanımı verilerle birlikte çalıştığından, bu ölçüm için tek doğru kaynak haline gelir. İşletme gelir hesaplama şeklini değiştirdiğinde, kendi formülünü içeren her raporu izlemek yerine ölçüyü tek bir yerde güncelleştirirsiniz.
Görünümler ve ölçüler birlikte tüketimin her iki tarafını da kapsar: görünümler, T-SQL tüketicilerinin verileri access ve sorgulama şeklini standartlaştırırken ölçüler, iş hesaplamalarının raporlarda ve panolarda nasıl görüneceğini standartlaştırır.
İpucu
DAX formülleri ve gelişmiş ölçü tasarımı, sonraki modüllerde ayrıntılı olarak ele alınmıştır. Görünümler ve saklı prosedürler için, verileri sorgulama ve dönüştürme ile ilgili önceki üniteye göz atın.
Power BI raporlaması için anlamsal model oluşturma
Hazırlanan tablolar, tanımlı ilişkiler, standartlaştırılmış görünümler ve ölçüler sayesinde ambar aşağı akış raporlama için hazırdır. T-SQL kullanarak doğrudan ambarı sorgulayan veya üçüncü taraf araçlar aracılığıyla bağlanan ekipler, ambar modeliyle olduğu gibi çalışabilir. Ancak etkileşimli Power BI raporları ve panoları oluşturmak istediğinizde, bir sonraki adım anlamsal model oluşturmaktır.
Fabric veri ambarından oluşturulan anlamsal modeller, Direct Lake modunu kullanır. Verileri Power BI belleğine kopyalayan geleneksel içeri aktarma modundan farklı olarak, Direct Lake verileri doğrudan OneLake Parquet dosyalarından okur. Bu, raporların zamanlanmış yenilemelere gerek kalmadan en son ambar verilerini yansıtdığı anlamına gelir. Ayrıca verilerin ayrı bir kopyasını tutmanın storage ve işleme yükünden kaçındığınız anlamına gelir.
İpucu
Anlam modeli tasarımı ve ölçeklenebilirlik desenleri, Ölçeklenebilir anlam modelleri tasarlama konusunda daha ayrıntılı bir şekilde ele alınmıştır. Bu ünite, ambardaki verileri modellemeye odaklanır.