Analitik veri depolarını keşfetme

Tamamlandı

İki yaygın analitik veri deposu türü vardır.

Veri ambarları

Diagram showing a data warehouse with a star schema.

Veri ambarı, verilerin işlem iş yükleri yerine veri analizi için iyileştirilmiş bir şemada depolandığı ilişkisel bir veritabanıdır. Genellikle, bir işlem deposundaki veriler, sayısal değerlerin verilerin toplanabileceği varlıkları temsil eden bir veya daha fazla boyut tablosuyla ilişkili merkezi olgu tablolarında depolandığı bir şemaya dönüştürülür. Örneğin olgu tablosu müşteri, ürün, mağaza ve zaman boyutlarına göre toplanabilen satış siparişi verileri içerebilir (örneğin, her mağaza için ürüne göre aylık toplam satış gelirini kolayca bulmanıza olanak tanır). Bu tür olgu ve boyut tablosu şemasına yıldız şeması adı verilir; ancak genellikle boyut hiyerarşilerini temsil eden boyut tablolarına ilişkin ek tablolar eklenerek bir kar tanesi şemasına genişletilir (örneğin, ürün, ürün kategorileri ile ilgili olabilir). Yapılandırılmış tablo şeması halinde düzenlenebilen işlem verilerine sahip olduğunuzda ve bunları sorgulamak için SQL kullanmak istediğinizde veri ambarı harika bir seçimdir.

Data lakehouses

Diagram showing a data lake in which files are abstracted by tables.

Veri gölü, genellikle yüksek performanslı veri erişimi için dağıtılmış bir dosya sisteminde bulunan bir dosya deposudur. Spark veya Hadoop gibi teknolojiler genellikle depolanan dosyalardaki sorguları işlemek ve raporlama ve analiz için veri döndürmek için kullanılır. Bu sistemler genellikle verilerin analiz için okunduğu noktada, depolandığında kısıtlamalar uygulamadan yarı yapılandırılmış veri dosyalarında tablosal şemalar tanımlamak için okumada şema yaklaşımı uygular. Veri gölleri, veriler depoya yazılırken şema zorlamasına gerek kalmadan analiz etmek istediğiniz yapılandırılmış, yarı yapılandırılmış ve hatta yapılandırılmamış verilerin bir karışımını desteklemek için idealdir.

Veri göllerinin ve veri ambarlarının özelliklerini bir göl veritabanında veya data lakehouse'da birleştiren karma bir yaklaşım kullanabilirsiniz. Ham veriler bir veri gölünde dosya olarak depolanır ve ilişkisel depolama katmanı temel alınan dosyaları soyutlar ve sql kullanılarak sorgulanabilen tablolar olarak kullanıma sunar. Azure Synapse Analytics'teki SQL havuzları, bir veri gölündeki (ve diğer kaynaklardaki) dosyaları temel alan dış tablolar tanımlamanızı ve SQL kullanarak sorgulamanızı sağlayan PolyBase'i içerir. Synapse Analytics, veri ambarınızın ilişkisel şemasını tanımlamak için veritabanı şablonlarını kullanabileceğiniz ve temel alınan verileri data lake storage'da depolayabileceğiniz ve veri ambarı çözümünüz için depolama ve işlem ayırabileceğiniz bir Lake Database yaklaşımını da destekler. Data lakehouse'lar Spark tabanlı sistemlerde nispeten yeni bir yaklaşımdır ve Delta Lake gibi teknolojiler aracılığıyla etkinleştirilir; bu da Spark'a ilişkisel depolama özellikleri ekler; böylece şemaları ve işlem tutarlılığını zorlayan tablolar tanımlayabilir, toplu yüklenen ve akış veri kaynaklarını destekleyebilir ve sorgulama için bir SQL API'sini sağlayabilirsiniz.