Aracılığıyla paylaş


Microsoft Fabric'te Synapse Veri Ambarı performans yönergeleri

Şunlar için geçerlidir: Microsoft Fabric'te Ambar

Bunlar, Microsoft Fabric'teki Ambarınızın performansını anlamanıza yardımcı olacak yönergelerdir. Bu makalede, odaklanmanız gereken rehberlik ve önemli makaleler bulacaksınız. Microsoft Fabric'teki Ambar, iş yükü yönetimi, eşzamanlılık ve depolama yönetimi gibi etkinliklerin platform tarafından dahili olarak yönetildiği bir SaaS platformudur. Bu iç performans yönetimine ek olarak, iyi tasarlanmış ambarlara karşı yüksek performanslı sorgular geliştirerek performansınızı geliştirmeye devam edebilirsiniz.

Soğuk çalıştırma (soğuk önbellek) performansı

Yerel SSD ve bellek ile önbelleğe alma otomatiktir. Bir sorgunun ilk 1-3 yürütmeleri, sonraki yürütmelerden çok daha yavaş performans gösterir. Soğuk çalışma performansı sorunlarıyla karşılaşıyorsanız, soğuk çalışma performansınızı geliştirebilecek birkaç şey şunlardır:

  • İlk çalıştırmanın performansı önemliyse, el ile istatistik oluşturmayı deneyin. İstatistiklerin rolünü daha iyi anlamak ve sorgu performansınızı geliştirmek için el ile istatistik oluşturma yönergeleri için istatistik makalesini gözden geçirin. Ancak, ilk çalıştırmanın performansı kritik değilse, ilk sorguda oluşturulacak ve sonraki çalıştırmalarda yararlanmaya devam edecek otomatik istatistiklere güvenebilirsiniz (temel alınan veriler önemli ölçüde değişmediği sürece).

  • Power BI kullanıyorsanız mümkün olduğunca Direct Lake modunu kullanın.

İzleme performansına yönelik ölçümler

şu anda İzleme Hub'ı Ambar'ı içermez. Veri Ambarı'nı seçerseniz, gezinti çubuğundan İzleme Hub'ına erişemezsiniz.

Doku yöneticileri, Ambar içeren kapasite kullanımını izleyen güncel bilgiler için Kapasite Kullanımı ve Ölçümler raporuna erişebilir.

Sorgu yürütmeyi izlemek için dinamik yönetim görünümlerini (DMV) kullanma

Ambar'da bağlantı, oturum ve istek durumunu izlemek için dinamik yönetim görünümlerini (DMV) kullanabilirsiniz.

İstatistikler

Ambar, belirli bir SQL sorgusu için yürütme planı oluşturmak üzere bir sorgu altyapısı kullanır. Bir sorgu gönderdiğinizde, sorgu iyileştirici tüm olası planları listelemeye ve en verimli adayı seçmeye çalışır. Hangi planın en az ek yük gerektireceğini belirlemek için, altyapının her işleç tarafından işlenebilen çalışma veya satır miktarını değerlendirebilmesi gerekir. Ardından, her planın maliyetine bağlı olarak en az tahmini çalışma miktarına sahip olanı seçer. İstatistikler, sorgu iyileştiricisinin bu maliyetleri tahmin etmesine olanak sağlamak için verilerinizle ilgili bilgiler içeren nesnelerdir.

Ayrıca , en iyi sorgu planının oluşturulabilmesini sağlamak için her veri yükünden veya veri güncelleştirmeden sonra istatistikleri el ile güncelleştirebilirsiniz.

İstatistikler ve otomatik olarak oluşturulan istatistikleri nasıl artırabileceğiniz hakkında daha fazla bilgi için bkz . Doku veri ambarında istatistikler.

Veri alımı yönergeleri

Bir Ambara veri alımı için dört seçenek vardır:

  • COPY (Transact-SQL)
  • Veri ardışık düzenleri
  • Veri akışları
  • Çapraz ambar alımı

Hangi seçeneğin sizin için en uygun olduğunu belirlemenize yardımcı olmak ve bazı veri alımı en iyi yöntemlerini gözden geçirmek için Verileri alma bölümünü gözden geçirin.

INSERT deyimlerini toplu olarak gruplandırma (karmaşık eklemelerden kaçının)

Aşağıdaki örnekte gösterildiği gibi INSERT deyimine sahip küçük bir tabloya tek seferlik yük, gereksinimlerinize bağlı olarak en iyi yaklaşım olabilir. Ancak, gün boyunca binlerce veya milyonlarca satır yüklemeniz gerekiyorsa, tekil INSERT'ler en uygun değildir.

INSERT INTO MyLookup VALUES (1, 'Type 1') 

Bu karmaşık yükleme senaryolarını işleme hakkında yönergeler için bkz . Veri almak için en iyi yöntemler.

İşlem boyutları en aza indirin

INSERT, UPDATE ve DELETE deyimleri bir işlemde çalışır. Başarısız olduklarında geri alınmalıdırlar. Uzun bir geri alma olasılığını azaltmak için mümkün olduğunda işlem boyutlarını en aza indirin. INSERT, UPDATE ve DELETE deyimlerini parçalara ayırarak işlem boyutlarını en aza indirme işlemi yapılabilir. Örneğin, 1 saat sürmesini beklediğiniz bir INSERT'iniz varsa INSERT'i dört parçaya ayırabilirsiniz. Ardından her çalıştırma 15 dakikaya kısaltılır.

DELETE kullanmak yerine bir tabloda tutmak istediğiniz verileri yazmak için CTAS (Transact-SQL) kullanmayı göz önünde bulundurun. Bir CTAS aynı süreyi alıyorsa, minimum işlem günlüğü olduğundan ve gerekirse hızlı bir şekilde iptal edilebildiğinden çalıştırmak daha güvenlidir.

İstemci uygulamalarını ve Microsoft Fabric'i birlikte kullanma

İstemci uygulamaları kullanıyorsanız Microsoft Fabric'i istemci bilgisayarınıza yakın bir bölgede kullandığınızdan emin olun. Power BI Desktop, SQL Server Management Studio ve Azure Data Studio istemci uygulaması örnekleri arasında yer alır.

Yıldız şeması veri tasarımını kullanma

Yıldız şeması verileri olgu tabloları ve boyut tabloları halinde düzenler. Yüksek oranda normalleştirilmiş OLTP sistemlerindeki verileri normalleştirerek analitik işlemeyi kolaylaştırır, işlem verilerini ve kurumsal ana verileri sorgu zamanında birleştirmeleri en aza indiren, okunan satır sayısını azaltan ve toplamaları ve gruplandırma işlemlerini kolaylaştıran ortak, temizlenmiş ve doğrulanmış bir veri yapısına alır.

Daha fazla Ambar tasarımı kılavuzu için bkz . Veri ambarı içindeki tablolar.

Sorgu sonuç kümesi boyutlarını küçültme

Sorgu sonuç kümesi boyutlarını küçültmek, büyük sorgu sonuçlarının neden olduğu istemci tarafı sorunlarından kaçınmanıza yardımcı olur. BU tarayıcı tabanlı kullanıcı arabiriminde bu sorunlardan kaçınmak için SQL Query düzenleyicisi sonuç kümeleri ilk 10.000 satırla sınırlıdır. 10.000'den fazla satır döndürmeniz gerekiyorsa SQL Server Management Studio (SSMS) veya Azure Data Studio kullanın.

Performans için en iyi veri türünü seçin

Tablolarınızı tanımlarken, sorgu performansını artıracağı için verilerinizi destekleyen en küçük veri türünü kullanın. Bu öneri CHAR ve VARCHAR sütunları için önemlidir. Bir sütundaki en uzun değer 25 karakterse, sütununuzu VARCHAR(25) olarak tanımlayın. Varsayılan uzunluğu büyük olan tüm karakter sütunlarını tanımlamaktan kaçının.

Mümkünse tamsayı tabanlı veri türlerini kullanın. SIRALAMA, JOIN ve GROUP BY işlemleri tamsayılarda karakter verilerine göre daha hızlı tamamlanır.

Desteklenen veri türleri ve daha fazla bilgi için bkz . veri türleri.