Statistik zur Abfrageleistung

Von Bedeutung

Dieses Feature befindet sich in Privater Vorschau. Wenden Sie sich an Ihren Azure Databricks-Kontakt, um es zu testen.

Wenn Abfragen ausgeführt werden, gibt Databricks möglicherweise Einblicke zurück, die Möglichkeiten zur Verbesserung der Leistung identifizieren. Auf dieser Seite werden die unterstützten Erkenntnisse und ihre Bedeutung aufgeführt.

Eine umfassendere Übersicht über bewährte Methoden zur Leistung finden Sie im umfassenden Leitfaden zum Optimieren von Databricks- und Spark- und Delta Lake-Workloads.

GLEICHZEITIGES_SCHREIBEN

  • Gleichzeitige Schreibvorgänge in der Tabelle führen zu Konflikten , die automatisch aufgelöst oder fehlschlagen.
  • Empfehlung: Überprüfen Sie den Deltaverlauf , um gleichzeitige Schreibvorgänge zu identifizieren und unterschiedliche Planungen zu berücksichtigen, um Konflikte zu vermeiden.

COVERAGE_FILTER_KEYS_CLUSTERING

  • Die Tabelle wird nach einem oder mehreren Schlüsseln gruppiert , die beim Filtern während des Tabellenscans nicht verwendet werden.
  • Empfehlung: Bestimmen Sie, welche Datenuntermenge Sie für das gewünschte Ergebnis benötigen, und fügen Sie dann Filter nach übereinstimmenden Clusteringschlüsseln hinzu, um das Lesen von Bytes zu reduzieren.

ABDECKUNGS_FILTIER_SCHLÜSSEL_PARTITIONIERUNG

  • Die Tabelle wird durch einen oder mehrere Schlüssel partitioniert , die beim Filtern während der Tabellenüberprüfung nicht verwendet werden.
  • Empfehlung: Bestimmen Sie, welche Datenuntermenge Sie für das gewünschte Ergebnis benötigen, und fügen Sie dann Filter nach übereinstimmenden Partitionierungsschlüsseln hinzu, um den Lesevorgang von Bytes zu reduzieren.

COVERAGE_PHOTON

  • Photon kann den Betrieb nicht beschleunigen, daher wurde die Standard-Runtime-Engine verwendet.
  • Empfehlung: Überprüfen Sie Photon-Einschränkungen, und berücksichtigen Sie die Anpassung der Abfrage, um eine unterstützte Ausführungsstrategie für eine schnellere Laufzeit zu verwenden.

COVERAGE_STATS_DELTA

  • Delta-Datenübersprung-Statistiken fehlen oder sind für die Tabellen-Scan-Dateifilter unvollständig, sodass die Abfrage dateiinterne Filter verwendet. Die folgenden Statistikstatus sind möglich:
    • Vollständig: Statistiken sind für alle Filter verfügbar.
    • Teilweise: Statistiken sind für eine Auswahl von Filtern verfügbar.
    • Nicht verfügbar: Statistiken sind für keinen Filter verfügbar.
    • Nicht verwendet: Statistiken konnten nicht für einen Filter verwendet werden, der den Datentyp konvertiert.
  • Empfehlung: Sammeln Sie Delta-Statistiken , um die Anzahl der Gelesenen von Bytes zu reduzieren.

ABDECKUNGS_STATISTIKEN_OPTIMIERER

DATA_SKEW

DATA_SPILL

  • Datenüberlauf auf den Datenträger beim Ausführen eines Operators, da die Datengröße nicht in den Arbeitsspeicher passte.
  • Empfehlung: Erhöhen Sie die Lagergröße , um den verfügbaren Speicher zu erhöhen. Verringern Sie die Anzahl der Zeilen, die Anzahl der Spalten oder die Größe großer Spalten (Zeichenfolgen, Arrays, Zuordnungen, Strukturen), um die Speicherauslastung zu verringern.

EXCESSIVE_QUEUE_TIME

EXPLODING_JOIN

  • Verknüpfunggeneriert deutlich mehr Zeilen als gelesen.
  • Empfehlung: Bestimmen Sie, welche Ergebnisuntermenge erforderlich ist, aktualisieren Sie dann die Verknüpfung, oder verringern Sie die Anzahl der Eingabezeilen aus beiden Beziehungen.

FLOW_FULL_RECOMPUTE

IO_THROTTLING

  • Die Cloudspeicheranforderung wurde von Ihrem Cloudanbieter gedrosselt.
  • Empfehlung: Wenden Sie sich an Ihren Administrator, um Ihre Grenzwerte für Cloudspeicheranforderungen mit Ihrem Cloudanbieter zu erhöhen.

REDUNDANT_AGGREGATION

SELECTIVE_JOIN

  • Verknüpfung generiert deutlich weniger Zeilen als gelesen.
  • Empfehlung: Bestimmen Sie, welche Ergebnisuntermenge erforderlich ist, und fügen Sie dann Filter vor der Verknüpfung hinzu, um die Anzahl der Eingabezeilen zu verringern.

WIDE_PROJECTION

  • Projizieren aller Spalten in der Tabelle.
  • Empfehlung: Ermitteln Sie, welche Ergebnisuntermenge erforderlich ist, und projizieren Sie dann nur diese Spalten, um die Anzahl der gelesenen Bytes zu verringern.