Asynchrone Zustandsprüfpunkte für zustandsbehaftete Abfragen

Hinweis

Verfügbar in Databricks Runtime 10.4 LTS und höher.

Asynchrone Zustandsprüfpunkte erhalten eine Genau-einmal-Garantie für Streamingabfragen aufrecht, können jedoch die Gesamtlatenz bei einigen strukturierten, zustandsbehafteten Workloads mit Engpässen bei Zustandsaktualisierungen verringern. Dies wird dadurch erreicht, dass mit der Verarbeitung des nächsten Mikrobatches begonnen wird, sobald die Berechnung des vorherigen Mikrobatches abgeschlossen ist, ohne dass auf den Abschluss der Zustandsprüfpunkte gewartet wird. In der folgenden Tabelle werden die Kompromisse für synchrone und asynchrone Checkpoints verglichen.

Merkmal	Synchrone Prüfpunkte	Asynchrone Prüfpunkte
Latenz	Höhere Latenz für jeden Mikrobatch.	Verringerte Latenz, da sich Mikrobatches überlappen können.
Neu starten	Schnelle Wiederherstellung, da nur der letzte Batch erneut ausgeführt werden muss.	Größere Verzögerung beim Neustart, da möglicherweise mehrere Mikrobatches neu gestartet werden müssen.

Im Folgenden sind Merkmale von Streamingaufträgen aufgeführt, die von asynchronen Zustandsprüfpunkten profitieren können:

Der Auftrag weist einen oder mehrere zustandsbehaftete Vorgänge auf (z. B. Aggregation, flatMapGroupsWithState, mapGroupsWithState, Stream-Stream-Joins).
Die Latenz von Zustandsprüfpunkten trägt wesentlich zur Gesamtlatenz bei der Batchausführung bei. Diese Informationen finden Sie in den StreamingQueryProgress-Ereignissen. Diese Ereignisse sind auch in log4j-Protokollen im Spark-Treiber zu finden. Nachfolgend sehen Sie ein Beispiel für den Fortschritt einer Streamingabfrage und die Feststellung der Auswirkungen des Statusprüfpunkts auf die Batch-Ausführungsgesamtlatenz.
- ```
{
   "id" : "2e3495a2-de2c-4a6a-9a8e-f6d4c4796f19",
   "runId" : "e36e9d7e-d2b1-4a43-b0b3-e875e767e1fe",
   "...",
   "batchId" : 0,
   "durationMs" : {
     "...",
     "triggerExecution" : 547730,
     "..."
   },
   "stateOperators" : [ {
     "...",
     "commitTimeMs" : 3186626,
     "numShufflePartitions" : 64,
     "..."
   }]
}
```
- Analyse der Latenz von Zustandsprüfpunkten beim oben angegebenen Abfragefortschrittsereignis
  - Die Batchdauer (durationMs.triggerDuration) beträgt ca. 547 Sekunden.
  - Die Latenz des Zustandsspeichercommits (stateOperations[0].commitTimeMs) beträgt ca. 3.186 Sekunden. Die Commit-Latenz wird für Aufgaben, die einen Zustandsspeicher enthalten, aggregiert. In diesem Fall gibt es 64 solcher Aufgaben (stateOperators[0].numShufflePartitions).
  - Jede Aufgabe, die den Zustandsoperator enthält, dauerte im Durchschnitt 50 Sekunden (3.186/64) für den Speicherpunkt. Dies ist eine zusätzliche Latenz, die zur Batchdauer beiträgt. Wenn alle 64 Aufgaben gleichzeitig ausgeführt werden, macht der Prüfpunktschritt ungefähr 9 % (50 Sek./547 Sek.) der Batchdauer aus. Der Prozentsatz wird noch höher, wenn die maximale Anzahl gleichzeitiger Aufgaben kleiner als 64 ist.

Aktivieren asynchroner Zustandsprüfpunkte

Sie müssen für asynchrone Zustandsprüfpunkte den RocksDB-basierten Zustandsspeicher verwenden. Legen Sie die folgenden Konfigurationen fest:


spark.conf.set(
  "spark.databricks.streaming.statefulOperator.asyncCheckpoint.enabled",
  "true"
)

spark.conf.set(
  "spark.sql.streaming.stateStore.providerClass",
  "com.databricks.sql.streaming.state.RocksDBStateStoreProvider"
)

Einschränkungen und Anforderungen für asynchrone Prüfpunkte

Hinweis

Die automatische Computeskalierung hat Einschränkungen beim Herunterskalieren der Clustergröße für strukturierten Streaming-Workloads. Databricks empfiehlt die Verwendung von Lakeflow Spark Declarative Pipelines mit verbesserter automatischer Skalierung für Streaming-Workloads. Siehe Optimieren der Clusternutzung von Lakeflow Spark Declarative Pipelines mit automatischer Skalierung.

Jeder Fehler bei einem asynchronen Prüfpunkt in einem oder mehreren Speichern führt zu einem Fehler bei der Abfrage. Im synchronen Prüfpunktmodus wird der Prüfpunkt als Teil der Aufgabe ausgeführt, und Spark wiederholt die Aufgabe mehrmals, bevor die Abfrage fehlschlägt. Dieser Mechanismus ist bei asynchronen Zustandsprüfpunkten nicht vorhanden. Databricks empfiehlt die Nutzung fortlaufender Aufträge für automatische Wiederholungsversuche bei Auftragsfehlern. Weitere Informationen finden Sie unter Fortlaufendes Ausführen von Aufträgen.
Asynchrone Prüfpunkterstellung funktioniert am besten, wenn die Speicherorte zwischen den Mikrobatch-Ausführungen nicht geändert werden. Eine Größenanpassung des Clusters funktioniert in Kombination mit asynchronen Zustandsprüfpunkten möglicherweise nicht gut, da die Zustandsspeicherinstanz ggf. neu verteilt wird, wenn Knoten im Rahmen einer Änderung der Clustergröße hinzugefügt oder gelöscht werden.
Asynchrone Zustandsprüfpunkte werden nur in der Implementierung des RocksDB-Zustandsspeicheranbieters unterstützt. Die Standardimplementierung des In-Memory-Zustandsspeichers unterstützt diese nicht.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-03

Asynchrone Zustandsprüfpunkte für zustandsbehaftete Abfragen

Aktivieren asynchroner Zustandsprüfpunkte

Einschränkungen und Anforderungen für asynchrone Prüfpunkte

Feedback

Zusätzliche Ressourcen