Udostępnij za pośrednictwem


Wgląd w wydajność zapytań

Ważne

Ta funkcja jest dostępna w prywatnej wersji zapoznawczej. Aby ją wypróbować, skontaktuj się z osobą kontaktową usługi Azure Databricks.

Po uruchomieniu zapytań usługa Databricks może zwracać szczegółowe informacje, które identyfikują możliwości poprawy wydajności. Na tej stronie wymieniono obsługiwane analizy i ich znaczenie.

Aby zapoznać się z szerszym omówieniem najlepszych rozwiązań dotyczących wydajności, zapoznaj się z kompleksowym przewodnikiem optymalizacji obciążeń usługi Databricks, Spark i Delta Lake.

RÓWNOCZESNE_PISANIE

  • Współbieżne zapisy w tabeli powodują konflikty , które są automatycznie rozwiązywane lub kończą się niepowodzeniem.
  • Zalecenie: Przejrzyj historię delty aby zidentyfikować współbieżne zapisy i rozważ różne harmonogramowanie, aby uniknąć konfliktów.

KLUCZE_FILTRA_POKRYCIA_GRUPOWANIE

  • Tabela jest klasterowana przez co najmniej jeden klucz, który nie jest używany podczas filtrowania podczas skanowania tabeli.
  • Zalecenie: określ, który podzbiór danych jest potrzebny dla żądanego wyniku, a następnie dodaj filtry do pasujących kluczy klastrowania, aby zmniejszyć odczyt bajtów.

PARTYCJONOWANIE_KLUCZY_FILTRACJI_POKRYCIA

  • Tabela jest partycjonowana przez co najmniej jeden klucz, który nie jest używany podczas filtrowania podczas skanowania tabeli.
  • Zalecenie: określ, który podzbiór danych jest potrzebny dla żądanego wyniku, a następnie dodaj filtry do pasujących kluczy partycjonowania, aby zmniejszyć odczyt bajtów.

Pokrycie_Foton

  • Photon nie może przyspieszyć operacji, więc użyto standardowego silnika środowiska uruchomieniowego.
  • Zalecenie: Zapoznaj się z ograniczeniami Photon i rozważ dostosowanie zapytania, aby użyć obsługiwanej strategii wykonania w celu szybszego czasu wykonania.

COVERAGE_STATS_DELTA

  • Statystyki dotyczące pomijania danych delta są nieobecne lub niekompletne dla filtrów plików skanowania tabeli, w związku z czym zapytanie używa filtrowania wewnątrz pliku. Możliwe są następujące stany statystyk:
    • Pełne: Statystyki są dostępne dla wszystkich filtrów.
    • Częściowe: Statystyki są dostępne w podzestawie filtrów.
    • Niedostępne: statystyki nie są dostępne w żadnym filtrze.
    • Nieużywane: nie można użyć statystyk w filtrze, który konwertuje typ danych.
  • Zalecenie: Zbierz statystyki różnicowe , aby zmniejszyć liczbę odczytanych bajtów.

COVERAGE_STATS_OPTIMIZER

DATA_SKEW

EXPLODING_JOIN

  • Łączeniegeneruje znacznie więcej wierszy niż zostało odczytane.
  • Zalecenie: określ, który podzbiór wyników jest wymagany, a następnie zaktualizuj sprzężenia lub zmniejsz liczbę wierszy wejściowych z obu relacji.

IO_THROTTLING

  • Żądanie przechowywania w chmurze zostało zdławione przez dostawcę chmury.
  • Zalecenie: skontaktuj się z administratorem, aby zwiększyć limity żądań magazynu w chmurze u dostawcy usług w chmurze.