Veri ambarlarını anlama

Tamamlandı

data warehouse, analitik sorgular ve raporlama için tasarlanmış merkezi ve yapılandırılmış bir depodur. Günlük iş işlemlerini işleyen işletimsel veritabanlarından farklı olarak, data warehouse birden çok kaynaktan gelen verileri analiz için iyileştirilmiş bir biçimde birleştirir.

Modern bir data warehouse oluşturmak genellikle şunları içerir:

  • Veri alımı - Verileri kaynak sistemlerden ambara taşıma.
  • Data storage - Verileri analiz için iyileştirilmiş bir biçimde depolama.
  • Veri işleme - Verileri analiz araçlarıyla kullanıma hazır bir biçime dönüştürme.
  • Veri analizi ve teslimi - İçgörü elde etmek ve bunları işletmeye sunmak için verileri analiz etme.

data warehouse tasarlama

Veri ambarları, çok boyutlu modelleme için iyileştirilmiş bir şemada düzenlenmiş tablolar içerir. Bu yaklaşımda olaylarla ilgili sayısal verileri farklı özniteliklere göre gruplandırırsınız. Örneğin, belirli bir tarihte veya belirli bir mağazada gerçekleşen satış siparişleri için ödenen toplam tutarı analiz edebilirsiniz.

Veri ambarı tabloları

Data warehouse tablolarını büyük miktarlardaki verilerin verimli analizini destekleyecek şekilde düzenlersiniz. Boyutsal modelleme olarak bilinen bu kuruluş, tabloları olgu tablolarına ve boyut tablolarına yapılandırmayı içerir.

Olgu tabloları , çözümlemek istediğiniz sayısal verileri içerir. Olgu tablolarının genellikle çok sayıda satırı vardır ve analiz için birincil veri kaynağıdır. Örneğin olgu tablosu, belirli bir tarihte veya belirli bir mağazada gerçekleşen satış siparişleri için ödenen toplam tutarı içerebilir.

Boyut tabloları olgu tablolarındaki veriler hakkında açıklayıcı bilgiler içerir. Boyut tablolarının genellikle birkaç satırı vardır ve olgu tablolarındaki veriler için bağlam sağlar. Örneğin, boyut tablosu satış siparişlerini veren müşteriler hakkında bilgi içerebilir.

Öznitelik sütunlarına ek olarak, boyut tablosu tablodaki her satırı benzersiz olarak tanımlayan benzersiz bir anahtar sütunu içerir. Aslında, bir boyut tablosunun iki anahtar sütun içermesi yaygın bir durumdur:

  • Vekil anahtar, boyut tablosundaki her satır için benzersiz bir tanımlayıcıdır. Bu genellikle yeni bir satır eklediğinizde veritabanı yönetim sisteminin otomatik olarak oluşturduğu bir tamsayı değeridir.
  • Alternatif anahtar genellikle işlem kaynağı sistemindeki bir varlığın ürün kodu veya müşteri kimliği gibi belirli bir örneğini tanımlayan doğal veya iş anahtarıdır.

Farklı amaçlara hizmet ettikleri için bir veri ambarında hem vekil hem de alternatif anahtarlara ihtiyaç vardır. Vekil anahtarlar veri ambarına özel olup tutarlılık ve doğruluğun korunmasına yardımcı olur. Alternatif anahtarlar kaynak sisteme özeldir ve data warehouse ile kaynak sistem arasında izlenebilirliğin korunmasına yardımcı olur.

Özel boyut tablosu türleri

Özel boyut türleri ek bağlam sağlar ve daha kapsamlı veri analizi sağlar.

Zaman boyutları , bir olayın gerçekleştiği zaman aralığı hakkında bilgi sağlar. Bu tablo, veri analistlerinin zaman aralıkları üzerinden veri toplamasına olanak tanır. Örneğin, bir zaman boyutu bir satış siparişinin yıl, üç aylık dönem, ay ve güne ait sütunları içerebilir.

Yavaş değişen boyutlar , müşterinin adresinde yapılan değişiklikler veya ürünün fiyatı gibi zaman içinde boyut özniteliklerinde yapılan değişiklikleri izler. Bunlar, zaman içinde verilerde yapılan değişiklikleri analiz etmenizi ve anlamanıza olanak sağladığından bir data warehouse önemlidir. Yavaş değişen boyutlar, verilerin güncel ve doğru kalmasını sağlar, bu da iyi iş kararları almak için önemlidir.

Veri ambarı şema tasarımları

İş uygulamalarında kullanılan çoğu işlem veritabanında, yinelenenleri azaltmak için veriler normalleştirilir . Ancak bir veri ambarında, boyut verileri, verileri sorgulamak için gereken birleştirme sayısını azaltmak amacıyla denormalize edilir.

Data warehouse genellikle, bu örnekte gösterildiği gibi olgu tablosunun doğrudan boyut tablolarıyla ilişkilendirildiği star şeması kullanır:

Yıldız şeklini oluşturan beş boyutlu FactSales tablosunu görüntüleyen yıldız şeması tasarımı diyagramı.

Olgu tablosu numaralarını farklı düzeylerde gruplandırmak için boyut özniteliklerini kullanabilirsiniz. Örneğin, bir bölgenin tamamının veya yalnızca bir müşterinin toplam satış gelirini bulabilirsiniz. Her düzeyin bilgilerini aynı boyut tablosunda depolayabilirsiniz.

İpucu

"Yıldız şeması nedir? bölümüne giderek Fabric için yıldız şeması tasarlama hakkında daha fazla bilgi edinin."

Farklı öğeler tarafından paylaşılan çok sayıda düzey veya öznitelik varsa, bunun yerine bir kar tanesi şeması kullanmak mantıklı olabilir. Bir örnek aşağıda verilmiştir:

Birden çok boyutu görüntüleyen kar tanesi şeması tasarımının diyagramı.

Bu durumda DimProduct tablosu, ürün kategorileri ve tedarikçileri için ayrı boyut tablolarına bölünür (normalleştirilir).

  • DimProduct tablosundaki her satır, DimCategory ve DimSupplier tablolarındaki ilgili satırların anahtar değerlerini içerir.

DimGeography tablosu, müşterilerin ve mağazaların nerede bulunduğuna ilişkin bilgiler içerir.

  • DimCustomer ve DimStore tablolarındaki her satır, DimGeography tablosunda karşılık gelen satır için bir anahtar değeri içerir.