Aracılığıyla paylaş


Veri kümesi iyileştirme ve önbelleğe alma

Yapay zeka/BI panoları değerli veri analizi ve karar alma araçlarıdır ve verimli yükleme süreleri kullanıcı deneyimini önemli ölçüde geliştirebilir. Bu makalede, önbelleğe alma ve veri kümesi iyileştirmelerinin panoları nasıl daha performanslı ve verimli hale getirmesi açıklanmaktadır.

Sorgu performansı

Çalışma alanı sorgu geçmişinde sorguları ve bunların performansını inceleyebilirsiniz. Sorgu geçmişi, SQL ambarları kullanılarak gerçekleştirilen SQL sorgularını gösterir. Sorgu geçmişini görüntülemek için kenar çubuğunda Sorgu Geçmişi'ne tıklayın Geçmiş Simgesi . Bkz. Sorgu geçmişi.

Pano veri kümeleri için Azure Databricks, veri kümesinin sonuç boyutuna bağlı olarak performans iyileştirmeleri uygular.

Veri kümesi iyileştirmeleri

AI/BI pano veri kümeleri aşağıdaki performans iyileştirmelerini içerir:

  • Veri kümesi sonuç boyutu küçükse (100.000 satıra veya 100 MB'a eşit veya daha küçükse), veri kümesi sonucu istemciye çekilir ve görselleştirmeye özgü filtreleme ve toplama işlemleri tarayıcıda gerçekleştirilir. Küçük veri kümeleri için verileri filtreleme ve toplama işlemi çok hızlıdır ve veri kümenizin küçük olduğundan emin olmak pano performansını iyileştirmenize yardımcı olabilir. Küçük veri kümelerinde, sorgu geçmişinde yalnızca veri kümesi sorgusu görüntülenir.
  • Veri kümesi sonuç boyutu büyükse (100.000 satır veya 100 MB'den büyük), veri kümesi sorgu metni bir SQL WITH yan tümcesine sarmalanır ve görselleştirmeye özgü filtreleme ve toplama işlemleri tarayıcı yerine arka uçtaki bir sorguda gerçekleştirilir. Büyük veri kümelerinde görselleştirme sorgusu sorgu geçmişinde görünür.
  • Arka uçta gönderilen görselleştirme sorguları için, aynı yan tümceleri ve filtre koşullarını paylaşan aynı GROUP BY veri kümesine karşı ayrı görselleştirme sorguları, işlenmek üzere tek bir sorguda birleştirilir. Bu durumda, kullanıcılar sorgu geçmişinde birden çok görselleştirmenin sonuçlarını getiren birleştirilmiş bir sorgu görebilir.

Önbelleğe alma ve veri güncelliği

Panolar, ilk yükleme sürelerini iyileştirmek için en iyi çaba temelinde çalışan 24 saatlik bir sonuç önbelleği tutar. Başka bir deyişle, sistem performansı artırmak için pano kimlik bilgilerine bağlı geçmiş sorgu sonuçlarını her zaman kullanmaya çalışsa da, önbelleğe alınan sonuçların oluşturulamadığı veya korunamadığı bazı durumlar vardır.

Aşağıdaki tabloda önbelleğe almanın pano durumuna ve kimlik bilgilerine göre nasıl değiştiği açıklanmaktadır:

Pano türü Önbelleğe alma türü
Eklenmiş kimlik bilgileriyle yayımlanan pano Paylaşılan önbellek. Tüm izleyiciler aynı sonuçları görür.
Eklenmiş kimlik bilgileri olmayan taslak pano veya yayımlanmış pano Kullanıcı önbelleği başına. İzleyiciler sonuçları veri izinlerine göre görür.

Panolar, temel alınan veriler son sorgudan sonra değişmeden kalırsa veya sonuçların 24 saatten kısa bir süre önce alınması durumunda otomatik olarak önbelleğe alınmış sorgu sonuçlarını kullanır. Eski sonuçlar varsa ve parametreler panoya uygulanırsa, son 24 saat içinde aynı parametreler kullanılmadığı sürece sorgular yeniden çalıştırılır. Benzer şekilde, 100.000 satırı aşan veri kümelerine filtre uygulamak, son 24 saat içinde aynı filtreler uygulanmadığı sürece sorguların yeniden çalıştırılmasını ister.

Zamanlanmış sorgular

Yayımlanmış bir panoya eklenmiş kimlik bilgileriyle zamanlama eklemek, tüm pano görüntüleyicileri için ilk yükleme işlemini önemli ölçüde hızlandırabilir.

Zamanlanan her pano güncelleştirmesi için aşağıdakiler gerçekleşir:

  • Veri kümelerini tanımlayan tüm SQL mantığı belirlenen zaman aralığında çalışır.
  • Sonuçlar sorgu sonucu önbelleğini doldurur ve ilk pano yükleme süresini geliştirmeye yardımcı olur.