Sdílet prostřednictvím


Přehled výkonu dotazu

Důležité

Tato funkce je ve verzi Private Preview. Pokud ji chcete vyzkoušet, obraťte se na svou kontaktní osobu pro Azure Databricks.

Při spuštění dotazů může Databricks vrátit přehledy, které identifikují příležitosti ke zlepšení výkonu. Tato stránka obsahuje seznam podporovaných přehledů a jejich významu.

Širší přehled osvědčených postupů pro výkon najdete v komplexní příručce pro optimalizaci úloh Databricks, Spark a Delta Lake.

SOUBĚŽNÝ_ZÁPIS

  • Souběžné zápisy v tabulce způsobují konflikty , které se automaticky vyřeší nebo selžou.
  • Doporučení: Zkontrolujte rozdílovou historii a identifikujte souběžné zápisy a zvažte různé plánování, abyste se vyhnuli konfliktům.

COVERAGE_FILTER_KEYS_CLUSTERING

  • Tabulka je clusterována jedním nebo více klíči, které se při filtrování během prohledávání tabulky nepoužívají.
  • Doporučení: Určete, která datová podmnožina potřebujete pro požadovaný výsledek, a pak přidejte filtry odpovídajících klíčů clusteringu, abyste snížili počet přečtených bajtů.

ROZDĚLENÍ_KLÍČŮ_FILTROVÁNÍ_POKRYTÍ

  • Tabulka je rozdělená podle jednoho nebo více klíčů, které se během prohledávání tabulky nepoužívají při filtrování.
  • Doporučení: Určete, kterou datovou podmnožinu potřebujete pro požadovaný výsledek, a pak přidejte filtry na odpovídající klíče pro dělení, abyste snížili čtení bajtů.

COVERAGE_PHOTON

  • Photon nemůže operaci urychlit, takže byl použit standardní běhový modul.
  • Doporučení: Zkontrolujte omezení Photon a zvažte úpravu dotazu tak, aby používal podporovanou strategii spouštění pro rychlejší běh.

COVERAGE_STATS_DELTA

  • Statistiky Delta přeskakování dat pro filtrování souborů ve skenech tabulky chybí nebo nejsou úplné, takže dotaz používá filtrování uvnitř souborů. Možné jsou následující stavy statistik:
    • Úplné: Statistiky jsou k dispozici pro všechny filtry.
    • Částečná: Statistika je k dispozici v podmnožině filtrů.
    • Nedostupné: Statistika není k dispozici u žádného filtru.
    • Nepoužité: Statistiky nelze použít u filtru, který převádí datový typ.
  • Doporučení: Shromážděte statistiky Delta , abyste snížili počet přečtených bajtů.

Optimalizátor statistik pokrytí

DATA_SKEW

  • Data se zpracovávají nerovnoměrně dostupnými výpočetními prostředky.
  • Doporučení: Zkontrolujte distribuci dat a poté proveďte solení klíčů nebo data předem agregujte.

EXPLODING_JOIN

  • Spojenígeneruje výrazně více řádků , než je přečteno.
  • Doporučení: Určete požadovanou podmnožinu výsledků a pak aktualizujte spojení nebo snižte počet vstupních řádků z obou relací.

IO_THROTTLING

  • Požadavek na cloudové úložiště omezil váš poskytovatel cloudu.
  • Doporučení: Obraťte se na správce a požádejte o zvýšení limitů požadavků na cloudové úložiště u svého poskytovatele cloudu.