Microsoft Fabric karar kılavuzu: veri deposu seçme
Microsoft Fabric iş yükleriniz için bir veri deposu seçmenize yardımcı olması için bu başvuru kılavuzunu ve örnek senaryoları kullanın.
Veri deposu özellikleri
Veri ambarı | Göl evi | Power BI Datamart | KQL Veritabanı (Eventhouse) | |
---|---|---|---|---|
Veri hacmi | Sınırsız | Sınırsız | En fazla 100 GB | Sınırsız |
Veri türü | Yapılandırılmış | Yapılandırılmamış,yarı yapılandırılmış,yapılandırılmış | Yapılandırılmış | Yapılandırılmamış, yarı yapılandırılmış, yapılandırılmış |
Birincil geliştirici kişisi | Veri ambarı geliştiricisi, SQL mühendisi | Veri mühendisi, veri bilimcisi | Vatandaş geliştirici | Vatandaş Veri bilimcisi, Veri mühendisi, Veri bilimcisi, SQL mühendisi |
Birincil geliştirici beceri kümesi | SQL | Spark(Scala, PySpark, Spark SQL, R) | Kod yok, SQL | Kod yok, KQL, SQL |
Düzenleyen veriler | Veritabanları, şemalar ve tablolar | Klasörler ve dosyalar, veritabanları ve tablolar | Veritabanı, tablolar, sorgular | Veritabanları, şemalar ve tablolar |
Okuma işlemleri | T-SQL, Spark (kısayolları kullanarak tablolardan okumayı destekler, henüz görünümlere, saklı yordamlara, işlevlere vb.) erişmeyi desteklemez. | Spark,T-SQL | Spark,T-SQL,Power BI | KQL, T-SQL, Spark, Power BI |
Yazma işlemleri | T-SQL | Spark(Scala, PySpark, Spark SQL, R) | Veri akışları, T-SQL | KQL, Spark, bağlayıcı ekosistemi |
Çok tablolu işlemler | Yes | Hayı | Hayır | Evet, çok tablolu alım için. Bkz. güncelleştirme ilkesi. |
Birincil geliştirme arabirimi | SQL betikleri | Spark not defterleri,Spark iş tanımları | Power BI | KQL Queryset, KQL Veritabanı |
Güvenlik | Nesne düzeyi (tablo, görünüm, işlev, saklı yordam vb.), sütun düzeyi, satır düzeyi, DDL/DML, dinamik veri maskeleme | Satır düzeyi, tablo düzeyi (T-SQL kullanırken), Spark için yok | Yerleşik RLS düzenleyicisi | Satır Düzeyi Güvenlik |
Kısayollar aracılığıyla verilere erişme | Evet (dolaylı olarak göl evinden) | Yes | Hayı | Evet |
Kısayollar için kaynak olabilir | Evet (tablolar) | Evet (dosyalar ve tablolar) | Hayır | Evet |
Öğeler arasında sorgulama | Evet, lakehouse ve ambar tablolarında sorgulama | Evet, lakehouse ve ambar tablolarında sorgu; lakehouse'lar arasında sorgulama (Spark kullanan kısayollar dahil) | Hayır | Evet, kısayollarla KQL Veritabanları, lakehouse'lar ve ambarlar arasında sorgulama |
Gelişmiş analiz | Time Series yerel öğeleri, Tam jeo-uzamsal depolama ve sorgu özellikleri | |||
Gelişmiş biçimlendirme desteği | Serbest metin ve JSON gibi yarı yapılandırılmış veriler için tam dizin oluşturma | |||
Alım gecikmesi | Kuyruğa alınan alma, Akış alımı birkaç saniye gecikme süresine sahiptir |
Not
Eventhouse, birden çok KQL veritabanı için bir çalışma alanıdır. KQL Veritabanı genel kullanıma sunulurken Eventhouse önizleme aşamasındadır. Daha fazla bilgi için bkz . Eventhouse'a genel bakış (önizleme).
Senaryolar
Doku'da veri deposu seçme konusunda yardım için bu senaryoları gözden geçirin.
1. Senaryo
Profesyonel bir geliştirici olan Susan, Microsoft Fabric'i yeni kullanmaya başladı. Verileri temizlemeye, modellemeye ve analiz etmeye başlamaya hazırdır ancak veri ambarı veya göl evi oluşturmaya karar vermeleri gerekir. Önceki tablodaki ayrıntılar gözden geçirildikten sonra, birincil karar noktaları kullanılabilir beceri kümesi ve çok tablolu işlemlere duyulan gereksinimdir.
Susan, ilişkisel veritabanı altyapılarında veri ambarları oluşturmak için uzun yıllar harcadı ve SQL söz dizimi ve işlevselliği hakkında bilgi sahibidir. Bu verilerin birincil tüketicileri daha büyük bir ekibi düşünürken SQL ve SQL analiz araçları konusunda da yeteneklidir. Susan, ekibin öncelikli olarak T-SQL ile etkileşim kurmasına ve kuruluştaki Spark kullanıcılarının verilere erişmesine izin veren bir veri ambarı kullanmaya karar verir.
2. Senaryo
Veri mühendisi rob'un dokuda birkaç terabayt veri depolaması ve modellemesi gerekir. Ekip, PySpark ve T-SQL becerilerinin bir karışımına sahiptir. T-SQL sorgularını çalıştıran ekibin çoğu tüketicidir ve bu nedenle INSERT, UPDATE veya DELETE deyimleri yazması gerekmez. Kalan geliştiriciler not defterlerinde rahatça çalışabilir ve veriler Delta'da depolandığından benzer bir SQL söz dizimi ile etkileşim kurabiliyorlar.
Rob, veri mühendisliği ekibinin verilerle ilgili çeşitli becerilerini kullanmasına olanak tanıyan bir lakehouse kullanmaya karar verirken, T-SQL'de yüksek beceriye sahip olan ekip üyelerinin de verileri kullanmasına olanak tanır.
3. Senaryo
Bir vatandaş geliştirici olan Ash, bir Power BI geliştiricisi. Excel, Power BI ve Office hakkında bilgi sahibidirler. Bir iş birimi için veri ürünü oluşturmaları gerekir. Veri ambarı veya göl evi oluşturma becerilerine sahip olmadığını biliyorlar ve bunlar ihtiyaçları ve veri hacimleri için çok fazla gibi görünüyor. Önceki tablodaki ayrıntıları gözden geçirir ve birincil karar noktalarının kendi becerileri ve self servis, kod özelliği yok ve 100 GB'ın altındaki veri hacmine olan ihtiyaçları olduğunu görürler.
Ash, Power BI ve Microsoft Office hakkında bilgi sahibi olan iş analistleriyle birlikte çalışır ve zaten bir Premium kapasite aboneliğine sahip olduklarını bilir. Büyük ekiplerini düşünürken, bu verilerin birincil tüketicilerinin kod içermeyen ve SQL analiz araçlarına aşina olan analistler olabileceğini fark ederler. Ash, ekibin kod içermeyen bir deneyim kullanarak hızlı bir şekilde yetenek oluşturmayla etkileşim kurmasını sağlayan bir Power BI veri akıllı makinesi kullanmaya karar verir. Sorgular Power BI ve T-SQL aracılığıyla yürütülebilir ve kuruluştaki Spark kullanıcılarının da verilere erişmesine olanak sağlar.
4\. Senaryo
Daisy, büyük bir küresel perakende zincirinin tedarik zinciri performans sorunlarını analiz etmek için Power BI kullanma konusunda deneyimli iş analistidir. Milyarlarca veri satırını işleyebilen ve iş kararları almak için kullanılabilecek panolar ve raporlar oluşturmak için kullanılabilen ölçeklenebilir bir veri çözümü oluşturmaları gerekir. Veriler çeşitli yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış biçimlerdeki tesislerden, tedarikçilerden, nakliyecilerden ve diğer kaynaklardan gelir.
Daisy ölçeklenebilirliği, hızlı yanıt süreleri, zaman serisi analizi, jeo-uzamsal işlevler ve Power BI'daki hızlı doğrudan sorgu modu gibi gelişmiş analiz özellikleri nedeniyle KQL Veritabanı kullanmaya karar verir. Mevcut ve önceki dönemler arasında karşılaştırma yapmak, ortaya çıkan sorunları hızla belirlemek veya kara ve deniz yolları için jeo-uzamsal analiz sağlamak için Power BI ve KQL kullanılarak sorgular yürütülebilir.
İlgili içerik
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin