Share via


Optimierung und Zwischenspeicherung von Datasets

Dashboards sind wertvolle Datenanalyse- und Entscheidungstools, und effiziente Ladezeiten können die Benutzererfahrung erheblich verbessern. In diesem Artikel wird erläutert, wie Cache- und Datasetoptimierungen Dashboards effizienter und effizienter gestalten.

Abfrageleistung

Sie können Abfragen und deren Leistung im Abfrageverlauf des Arbeitsbereichs untersuchen. Im Abfrageverlauf werden die mit SQL-Warehouses ausgeführten SQL-Abfragen angezeigt. Klicken Sie auf der Randleiste auf VerlaufssymbolAbfrageverlauf, um den Abfrageverlauf anzuzeigen. Weitere Informationen finden Sie unter Abfrageverlauf.

Bei Dashboard-Datasets wendet Azure Databricks Leistungsoptimierungen abhängig von der Ergebnisgröße des Datasets an.

Datasetoptimierungen

Datasets umfassen die folgenden Leistungsoptimierungen:

  • Wenn die Größe des Datasetergebnisses gering ist (weniger als 64.000 Zeilen), wird das Datasetergebnis auf den Client gepullt, und die visualisierungsspezifische Filterung und Aggregation werden dort ausgeführt. Das Filtern und Aggregieren von Daten für kleine Datasets ist sehr schnell. Wenn Sie also sicherstellen, dass Ihr Dataset klein ist, kann das die Dashboardleistung optimieren. Bei kleinen Datasets wird nur die Datasetabfrage im Abfrageverlauf angezeigt.
  • Wenn die Ergebnisgröße des Datasets groß ist (>= 64.000 Zeilen), wird der Text der Datasetabfrage in einer SQL-WITH-Klausel umschlossen, und die visualisierungsspezifische Filterung und Aggregation erfolgt in einer Abfrage am Back-End und nicht im Client. Bei großen Datasets ist die Visualisierungsabfrage im Abfrageverlauf enthalten.
  • Visualisierungsabfragen, die an das Back-End gesendet werden und für dasselbe Dataset mit denselben GROUP BY-Klauseln und Filterprädikaten gelten, werden für die Verarbeitung in einer einzigen Abfrage zusammengefasst. In diesem Fall wird Benutzer*innen im Abfrageverlauf möglicherweise eine kombinierte Abfrage angezeigt, die Ergebnisse für mehrere Visualisierungen abruft.

Zwischenspeicherung und Aktualität von Daten

Dashboards verwalten einen 24-Stunden-Ergebniscache, um die anfänglichen Ladezeiten zu optimieren. Dabei wird das Prinzip der bestmöglichen Leistung angewandt. Das System versucht daher zwar immer, historische Abfrageergebnisse in Verbindung mit Dashboardanmeldeinformationen zu verwenden, um die Leistung zu verbessern, es gibt jedoch einige Fälle, in denen zwischengespeicherte Ergebnisse nicht erstellt oder verwaltet werden können.

In der folgenden Tabelle wird erläutert, wie die Zwischenspeicherung je nach Dashboardstatus und Anmeldeinformationen variiert:

Dashboardtyp Cachingtyp
Entwurf oder veröffentlichtes Dashboard mit eingebetteten Anmeldeinformationen Freigegebener Cache. Alle Betrachter sehen dieselben Ergebnisse.
Entwurf oder veröffentlichtes Dashboard ohne eingebettete Anmeldeinformationen Cache pro Benutzer. Betrachter sehen Ergebnisse basierend auf ihren Datenberechtigungen.

Dashboards verwenden automatisch zwischengespeicherte Abfrageergebnisse, wenn die zugrunde liegenden Daten nach der letzten Abfrage unverändert bleiben oder die Ergebnisse vor weniger als 24 Stunden abgerufen wurden. Wenn veraltete Ergebnisse vorhanden sind und Parameter auf das Dashboard angewandt wurden, werden Abfragen erneut ausgeführt, sofern nicht dieselben Parameter in den letzten 24 Stunden verwendet wurden. Ebenso fordert das Anwenden von Filtern auf Datasets, die mehr als 64.000 Zeilen überschreiten, eine erneute Ausführung der Abfragen an, sofern nicht dieselben Filter in den letzten 24 Stunden zuvor angewandt wurden.

Geplante Abfragen

Das Hinzufügen eines Zeitplans zu einem veröffentlichten Dashboard mit eingebetteten Anmeldeinformationen kann den anfänglichen Ladevorgang für alle Dashboardbetrachter erheblich beschleunigen.

Für jedes geplante Dashboard-Update geschieht Folgendes:

  • Alle SQL-Logik, die Datasets definiert, wird im festgelegten Zeitintervall ausgeführt.
  • Ergebnisse füllen den Abfrageergebniscache und helfen, die anfängliche Ladezeit des Dashboards zu verbessern.