Asynchrone controlepunten van de toestand voor toestandsafhankelijke query's

Notitie

Beschikbaar in Databricks Runtime 10.4 LTS en hoger.

Controlepunten voor asynchrone statussen handhaven exactly-once garanties voor streamingquery's, maar kunnen de algehele latentie verminderen voor sommige stateful Structured Streaming-workloads die een knelpunt vormen bij statusupdates. Dit wordt bereikt door de volgende microbatch te verwerken zodra de berekening van de vorige microbatch is voltooid zonder te wachten tot statuscontrolepunten zijn voltooid. In de volgende tabel worden de afwegingen voor synchrone en asynchrone controlepunten vergeleken:

Karakteristiek	Synchrone controlepunten	Asynchrone controlepunten
Latentie	Hogere latentie voor elke microbatch.	Verminderde latentie omdat microbatches elkaar kunnen overlappen.
Opnieuw starten	Snel herstel omdat alleen de laatste batch opnieuw moet worden uitgevoerd.	Een hogere herstartvertraging omdat er mogelijk meer dan in microbatch opnieuw moet worden uitgevoerd.

Hier volgen de kenmerken van streamingtaken die kunnen profiteren van asynchrone statuscontrolepunten:

Taak heeft een of meer stateful bewerkingen (bijvoorbeeld aggregatie, flatMapGroupsWithState, mapGroupsWithState, stream-stream joins)
Statuscontrolepuntlatentie is een van de belangrijkste factoren die bijdragen tot de totale batchuitvoeringslatentie. Deze informatie vindt u in de StreamingQueryProgress-gebeurtenissen . Deze gebeurtenissen vindt u ook in log4j-logs op de Spark-driver. Hier volgt een voorbeeld van de voortgang van streamingquery's en hoe u de invloed van het statuscontrolepunt kunt vinden op de algehele latentie van batchuitvoering.
- ```
{
   "id" : "2e3495a2-de2c-4a6a-9a8e-f6d4c4796f19",
   "runId" : "e36e9d7e-d2b1-4a43-b0b3-e875e767e1fe",
   "...",
   "batchId" : 0,
   "durationMs" : {
     "...",
     "triggerExecution" : 547730,
     "..."
   },
   "stateOperators" : [ {
     "...",
     "commitTimeMs" : 3186626,
     "numShufflePartitions" : 64,
     "..."
   }]
}
```
- Statuscontrolepuntlatentieanalyse van de bovenstaande queryvoortgangs gebeurtenis
  - De batchduur (durationMs.triggerDuration) bedraagt ongeveer 547 sec.
  - Doorvoerlatentie voor statusopslag (stateOperations[0].commitTimeMs) is ongeveer 3186 sec. Doorvoerlatentie wordt geaggregeerd voor taken die een statusarchief bevatten. In dit geval zijn er 64 dergelijke taken (stateOperators[0].numShufflePartitions).
  - Elke taak met statusoperator duurde gemiddeld 50 sec (3.186/64) voor controlepunt. Dit is een extra latentie die wordt bijgedragen aan de batchduur. Ervan uitgaande dat alle 64 taken gelijktijdig worden uitgevoerd, heeft de controlepuntstap ongeveer 9% (50 sec/ 547 sec) van de batchduur bijgedragen. Het percentage wordt nog hoger wanneer het maximum aantal gelijktijdige taken kleiner is dan 64.

Asynchrone statuscontrolepunten inschakelen

U moet het op RocksDB gebaseerde statusarchief gebruiken voor asynchrone statuscontrolepunten. Stel de volgende configuraties in:


spark.conf.set(
  "spark.databricks.streaming.statefulOperator.asyncCheckpoint.enabled",
  "true"
)

spark.conf.set(
  "spark.sql.streaming.stateStore.providerClass",
  "com.databricks.sql.streaming.state.RocksDBStateStoreProvider"
)

Beperkingen en vereisten voor asynchrone controlepunten

Notitie

Het automatisch schalen heeft beperkingen bij het verkleinen van de clustergrootte voor Structured Streaming-workloads. Databricks raadt aan om declaratieve pijplijnen van Lakeflow Spark te gebruiken met verbeterde automatische schaalaanpassing voor streamingworkloads. Zie Het clustergebruik van declaratieve Pijplijnen van Lakeflow Spark optimaliseren met automatisch schalen.

Elke fout in een asynchroon controlepunt in een of meer winkels zorgt ervoor dat de query mislukt. In de synchrone controlepuntmodus wordt het controlepunt uitgevoerd als onderdeel van de taak en voert Spark de taak meerdere keren opnieuw uit voordat de query mislukt. Dit mechanisme is niet aanwezig bij asynchrone toestandscontroles. Databricks raadt aan doorlopende taken te gebruiken voor automatische nieuwe pogingen bij taakfouten. Zie Voer taken continu uit.
Asynchrone controlepunten werken het beste wanneer de locaties van de statusopslag niet worden gewijzigd tussen microbatchuitvoeringen. Het aanpassen van de clusteromvang, in combinatie met asynchrone toestandcontrolepunten, werkt mogelijk niet goed omdat de toestandopslag mogelijk opnieuw wordt verdeeld wanneer knooppunten worden toegevoegd of verwijderd bij een clusteromvangaanpassing.
Asynchrone statuscontrolepunten worden alleen ondersteund in de implementatie van de RocksDB-statusarchiefprovider. De standaard implementatie van het statusarchief in het geheugen biedt geen ondersteuning voor deze opslag.

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-29

Asynchrone controlepunten van de toestand voor toestandsafhankelijke query's

Asynchrone statuscontrolepunten inschakelen

Beperkingen en vereisten voor asynchrone controlepunten

Feedback

Aanvullende resources