Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
Ta funkcja jest dostępna w prywatnej wersji zapoznawczej. Aby ją wypróbować, skontaktuj się z osobą kontaktową usługi Azure Databricks.
Po uruchomieniu zapytań usługa Databricks może zwracać szczegółowe informacje, które identyfikują możliwości poprawy wydajności. Na tej stronie wymieniono obsługiwane analizy i ich znaczenie.
Aby zapoznać się z szerszym omówieniem najlepszych rozwiązań dotyczących wydajności, zapoznaj się z kompleksowym przewodnikiem optymalizacji obciążeń usługi Databricks, Spark i Delta Lake.
RÓWNOCZESNE_PISANIE
- Współbieżne zapisy w tabeli powodują konflikty , które są automatycznie rozwiązywane lub kończą się niepowodzeniem.
- Zalecenie: Przejrzyj historię delty aby zidentyfikować współbieżne zapisy i rozważ różne harmonogramowanie, aby uniknąć konfliktów.
KLUCZE_FILTRA_POKRYCIA_GRUPOWANIE
- Tabela jest klasterowana przez co najmniej jeden klucz, który nie jest używany podczas filtrowania podczas skanowania tabeli.
- Zalecenie: określ, który podzbiór danych jest potrzebny dla żądanego wyniku, a następnie dodaj filtry do pasujących kluczy klastrowania, aby zmniejszyć odczyt bajtów.
PARTYCJONOWANIE_KLUCZY_FILTRACJI_POKRYCIA
- Tabela jest partycjonowana przez co najmniej jeden klucz, który nie jest używany podczas filtrowania podczas skanowania tabeli.
- Zalecenie: określ, który podzbiór danych jest potrzebny dla żądanego wyniku, a następnie dodaj filtry do pasujących kluczy partycjonowania, aby zmniejszyć odczyt bajtów.
Pokrycie_Foton
- Photon nie może przyspieszyć operacji, więc użyto standardowego silnika środowiska uruchomieniowego.
- Zalecenie: Zapoznaj się z ograniczeniami Photon i rozważ dostosowanie zapytania, aby użyć obsługiwanej strategii wykonania w celu szybszego czasu wykonania.
COVERAGE_STATS_DELTA
- Statystyki dotyczące pomijania danych delta są nieobecne lub niekompletne dla filtrów plików skanowania tabeli, w związku z czym zapytanie używa filtrowania wewnątrz pliku. Możliwe są następujące stany statystyk:
- Pełne: Statystyki są dostępne dla wszystkich filtrów.
- Częściowe: Statystyki są dostępne w podzestawie filtrów.
- Niedostępne: statystyki nie są dostępne w żadnym filtrze.
- Nieużywane: nie można użyć statystyk w filtrze, który konwertuje typ danych.
- Zalecenie: Zbierz statystyki różnicowe , aby zmniejszyć liczbę odczytanych bajtów.
COVERAGE_STATS_OPTIMIZER
- Brak lub niekompletne statystyki optymalizatora opartego na kosztach, dlatego standardowe heurystyki zostały użyte do wygenerowania planu zapytania.
- Zalecenie: Zbierz statystyki , aby umożliwić optymalizatorowi tworzenie lepszego planu.
DATA_SKEW
- Dane są przetwarzane nierównomiernie przez dostępne zasoby obliczeniowe.
- Zalecenie: Przejrzyj rozkład danych, a następnie klucze soli lub wstępnie zagregowane dane.
EXPLODING_JOIN
- Łączeniegeneruje znacznie więcej wierszy niż zostało odczytane.
- Zalecenie: określ, który podzbiór wyników jest wymagany, a następnie zaktualizuj sprzężenia lub zmniejsz liczbę wierszy wejściowych z obu relacji.
IO_THROTTLING
- Żądanie przechowywania w chmurze zostało zdławione przez dostawcę chmury.
- Zalecenie: skontaktuj się z administratorem, aby zwiększyć limity żądań magazynu w chmurze u dostawcy usług w chmurze.