Aracılığıyla paylaş


Azure Databricks'te birleştirme performansını iyileştirme

Azure Databricks ile toplu iş veya akış tablolarınızda birleşimler oluşturabilirsiniz. Bazı birleşimler pahalı olabilir. Aşağıdakiler katılımlarınızı optimize etmenize yardımcı olabilir.

Birleştirmeler hakkında daha fazla bilgi için bkz. Azure Databricks'te birleştirmelerle çalışma.

Foton etkinleştirildiğinde yapılan hesaplama her zaman en iyi birleştirme türünü seçer. Bkz . Photon nedir?. Foton etkinken en son Databricks Runtime sürümünü kullanmak genellikle iyi bir birleştirme performansı sağlar, ancak aşağıdaki önerileri de göz önünde bulundurmanız gerekir:

  • Çapraz birleşimler çok pahalıdır. Düşük gecikme süresi veya sık yeniden derleme gerektiren iş yüklerinden ve sorgulardan çapraz birleştirmeleri kaldırın.

  • Katılım sırası önemlidir. Birden çok birleştirme gerçekleştirirken, önce en küçük tablolarınızı birleştirin ve ardından sonucu daha büyük tablolarla birleştirin.

  • İyileştirici, birçok birleştirme ve toplama içeren sorgularda zorlanabilir. Ara sonuçların kaydedilmesi sorgu planlama ve bilgi işlem sonuçlarını hızlandırabilir.

  • Performansı geliştirmek için yeni istatistikler tutun. Tahmine dayalı iyileştirme, istatistikleri otomatik olarak güncelleştirir ve korur. Bkz. Unity Kataloğu tarafından yönetilen tablolar için tahmine dayalı optimizasyon.

    Sorgu planlayıcısındaki istatistikleri güncelleştirmek için sorgu ANALYZE TABLE table_name COMPUTE STATISTICS de çalıştırabilirsiniz.

Uyarı

Databricks Runtime 14.3 LTS ve üzerinde Delta Lake'in veri atlama için istatistikleri topladığı sütunları değiştirebilir ve ardından Delta günlüğündeki mevcut istatistikleri yeniden derleyebilirsiniz. Bkz. İstatistik sütunlarını belirtme.