Microsoft Fabric karar kılavuzu: veri deposu seçme

Microsoft Fabric iş yükleriniz için bir veri deposu seçmenize yardımcı olması için bu başvuru kılavuzunu ve örnek senaryoları kullanın.

Veri deposu özellikleri

Veri ambarı Göl evi Power BI Datamart KQL Veritabanı (Eventhouse)
Veri hacmi Sınırsız Sınırsız En fazla 100 GB Sınırsız
Veri türü Yapılandırılmış Yapılandırılmamış,yarı yapılandırılmış,yapılandırılmış Yapılandırılmış Yapılandırılmamış, yarı yapılandırılmış, yapılandırılmış
Birincil geliştirici kişisi Veri ambarı geliştiricisi, SQL mühendisi Veri mühendisi, veri bilimcisi Vatandaş geliştirici Vatandaş Veri bilimcisi, Veri mühendisi, Veri bilimcisi, SQL mühendisi
Birincil geliştirici beceri kümesi SQL Spark(Scala, PySpark, Spark SQL, R) Kod yok, SQL Kod yok, KQL, SQL
Düzenleyen veriler Veritabanları, şemalar ve tablolar Klasörler ve dosyalar, veritabanları ve tablolar Veritabanı, tablolar, sorgular Veritabanları, şemalar ve tablolar
Okuma işlemleri T-SQL, Spark (kısayolları kullanarak tablolardan okumayı destekler, henüz görünümlere, saklı yordamlara, işlevlere vb.) erişmeyi desteklemez. Spark,T-SQL Spark,T-SQL,Power BI KQL, T-SQL, Spark, Power BI
Yazma işlemleri T-SQL Spark(Scala, PySpark, Spark SQL, R) Veri akışları, T-SQL KQL, Spark, bağlayıcı ekosistemi
Çok tablolu işlemler Yes Hayı Hayır Evet, çok tablolu alım için. Bkz. güncelleştirme ilkesi.
Birincil geliştirme arabirimi SQL betikleri Spark not defterleri,Spark iş tanımları Power BI KQL Queryset, KQL Veritabanı
Güvenlik Nesne düzeyi (tablo, görünüm, işlev, saklı yordam vb.), sütun düzeyi, satır düzeyi, DDL/DML, dinamik veri maskeleme Satır düzeyi, tablo düzeyi (T-SQL kullanırken), Spark için yok Yerleşik RLS düzenleyicisi Satır Düzeyi Güvenlik
Kısayollar aracılığıyla verilere erişme Evet (dolaylı olarak göl evinden) Yes Hayı Evet
Kısayollar için kaynak olabilir Evet (tablolar) Evet (dosyalar ve tablolar) Hayır Evet
Öğeler arasında sorgulama Evet, lakehouse ve ambar tablolarında sorgulama Evet, lakehouse ve ambar tablolarında sorgu; lakehouse'lar arasında sorgulama (Spark kullanan kısayollar dahil) Hayır Evet, kısayollarla KQL Veritabanları, lakehouse'lar ve ambarlar arasında sorgulama
Gelişmiş analiz Time Series yerel öğeleri, Tam jeo-uzamsal depolama ve sorgu özellikleri
Gelişmiş biçimlendirme desteği Serbest metin ve JSON gibi yarı yapılandırılmış veriler için tam dizin oluşturma
Alım gecikmesi Kuyruğa alınan alma, Akış alımı birkaç saniye gecikme süresine sahiptir

Not

Eventhouse, birden çok KQL veritabanı için bir çalışma alanıdır. KQL Veritabanı genel kullanıma sunulurken Eventhouse önizleme aşamasındadır. Daha fazla bilgi için bkz . Eventhouse'a genel bakış (önizleme).

Senaryolar

Doku'da veri deposu seçme konusunda yardım için bu senaryoları gözden geçirin.

1. Senaryo

Profesyonel bir geliştirici olan Susan, Microsoft Fabric'i yeni kullanmaya başladı. Verileri temizlemeye, modellemeye ve analiz etmeye başlamaya hazırdır ancak veri ambarı veya göl evi oluşturmaya karar vermeleri gerekir. Önceki tablodaki ayrıntılar gözden geçirildikten sonra, birincil karar noktaları kullanılabilir beceri kümesi ve çok tablolu işlemlere duyulan gereksinimdir.

Susan, ilişkisel veritabanı altyapılarında veri ambarları oluşturmak için uzun yıllar harcadı ve SQL söz dizimi ve işlevselliği hakkında bilgi sahibidir. Bu verilerin birincil tüketicileri daha büyük bir ekibi düşünürken SQL ve SQL analiz araçları konusunda da yeteneklidir. Susan, ekibin öncelikli olarak T-SQL ile etkileşim kurmasına ve kuruluştaki Spark kullanıcılarının verilere erişmesine izin veren bir veri ambarı kullanmaya karar verir.

2. Senaryo

Veri mühendisi rob'un dokuda birkaç terabayt veri depolaması ve modellemesi gerekir. Ekip, PySpark ve T-SQL becerilerinin bir karışımına sahiptir. T-SQL sorgularını çalıştıran ekibin çoğu tüketicidir ve bu nedenle INSERT, UPDATE veya DELETE deyimleri yazması gerekmez. Kalan geliştiriciler not defterlerinde rahatça çalışabilir ve veriler Delta'da depolandığından benzer bir SQL söz dizimi ile etkileşim kurabiliyorlar.

Rob, veri mühendisliği ekibinin verilerle ilgili çeşitli becerilerini kullanmasına olanak tanıyan bir lakehouse kullanmaya karar verirken, T-SQL'de yüksek beceriye sahip olan ekip üyelerinin de verileri kullanmasına olanak tanır.

3. Senaryo

Bir vatandaş geliştirici olan Ash, bir Power BI geliştiricisi. Excel, Power BI ve Office hakkında bilgi sahibidirler. Bir iş birimi için veri ürünü oluşturmaları gerekir. Veri ambarı veya göl evi oluşturma becerilerine sahip olmadığını biliyorlar ve bunlar ihtiyaçları ve veri hacimleri için çok fazla gibi görünüyor. Önceki tablodaki ayrıntıları gözden geçirir ve birincil karar noktalarının kendi becerileri ve self servis, kod özelliği yok ve 100 GB'ın altındaki veri hacmine olan ihtiyaçları olduğunu görürler.

Ash, Power BI ve Microsoft Office hakkında bilgi sahibi olan iş analistleriyle birlikte çalışır ve zaten bir Premium kapasite aboneliğine sahip olduklarını bilir. Büyük ekiplerini düşünürken, bu verilerin birincil tüketicilerinin kod içermeyen ve SQL analiz araçlarına aşina olan analistler olabileceğini fark ederler. Ash, ekibin kod içermeyen bir deneyim kullanarak hızlı bir şekilde yetenek oluşturmayla etkileşim kurmasını sağlayan bir Power BI veri akıllı makinesi kullanmaya karar verir. Sorgular Power BI ve T-SQL aracılığıyla yürütülebilir ve kuruluştaki Spark kullanıcılarının da verilere erişmesine olanak sağlar.

4\. Senaryo

Daisy, büyük bir küresel perakende zincirinin tedarik zinciri performans sorunlarını analiz etmek için Power BI kullanma konusunda deneyimli iş analistidir. Milyarlarca veri satırını işleyebilen ve iş kararları almak için kullanılabilecek panolar ve raporlar oluşturmak için kullanılabilen ölçeklenebilir bir veri çözümü oluşturmaları gerekir. Veriler çeşitli yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış biçimlerdeki tesislerden, tedarikçilerden, nakliyecilerden ve diğer kaynaklardan gelir.

Daisy ölçeklenebilirliği, hızlı yanıt süreleri, zaman serisi analizi, jeo-uzamsal işlevler ve Power BI'daki hızlı doğrudan sorgu modu gibi gelişmiş analiz özellikleri nedeniyle KQL Veritabanı kullanmaya karar verir. Mevcut ve önceki dönemler arasında karşılaştırma yapmak, ortaya çıkan sorunları hızla belirlemek veya kara ve deniz yolları için jeo-uzamsal analiz sağlamak için Power BI ve KQL kullanılarak sorgular yürütülebilir.