Ausführen fortlaufender Aufträge
Verwenden Sie den kontinuierlichen Modus, um Workloads für die kontinuierliche Ausführung zu planen. Databricks empfiehlt die Verwendung des kontinuierlichen Modus für Always-On-Streaming-Workloads.
Der kontinuierliche Modus ersetzt die bisherigen Empfehlungen für Structured-Streaming-Workloads, Aufträge mit einer unbegrenzten Wiederholungsrichtlinie und maximal einem gleichzeitigen Lauf zu konfigurieren.
Wichtig
Serverloses Computing für Aufträge unterstützt keinen kontinuierlichen Modus.
Konfigurieren des Auftrags für die Ausführung im kontinuierlichen Modus
Gehen Sie wie folgt vor, um einen Auftrag so zu konfigurieren, dass er im kontinuierlichen Modus ausgeführt wird:
- Klicken Sie auf der Seitenleiste auf Workflows.
- Klicken Sie in der Spalte Name auf der Registerkarte Aufträge auf den Auftragsnamen.
- Klicken Sie im Bereich Auftragsdetails auf Trigger hinzufügen, wählen Sie unter Triggertyp Kontinuierlich und klicken Sie auf Speichern.
Um einen fortlaufenden Auftrag anzuhalten, klicken Sie auf die Schaltfläche Anhalten. Klicken Sie auf Fortsetzen, um den Auftrag im kontinuierlichen Modus neu zu starten.
Hinweis
- Zu einem gegebenen Zeitpunkt kann jeweils nur eine Instanz eines fortlaufenden Auftrags ausgeführt werden.
- Zwischen dem Beenden einer Ausführung und dem Starten einer neuen Ausführung tritt eine Verzögerung auf. Diese Verzögerung sollte weniger als 60 Sekunden betragen.
- Sie können bei fortlaufenden Aufträgen keine Anordnungsbeziehungen verwenden.
- Sie können bei fortlaufenden Aufträgen keine Wiederholungsrichtlinien verwenden. Stattdessen wird exponentielles Backoff zum Verwalten von Auftragsausführungsfehlern bei fortlaufenden Aufträgen verwendet.
- Wählen Sie Jetzt ausführen, um einen neuen Joblauf für einen angehaltenen kontinuierlichen Auftrag auszulösen.
- Wenn Ihr fortlaufender Auftrag eine neue Konfiguration übernehmen soll, brechen Sie die vorhandene Ausführung ab. Eine neue Ausführung wird automatisch gestartet. Sie können auch auf Ausführung neu starten klicken, um den Auftrag mit der aktualisierten Konfiguration neu zu starten.
Wie werden Fehler bei fortlaufenden Aufträge behandelt?
Für Azure Databricks wird das Schema exponentielles Backoff verwendet, um fortlaufende Aufträge mit mehreren aufeinander folgenden Fehlern zu verwalten. Exponentielles Backoff ermöglicht es, fortlaufende Aufträge ohne Unterbrechung auszuführen und bei behebbaren Fehlern in einen Integritätszustand zurückzukehren.
Wenn ein fortlaufender Auftrag den zulässigen Schwellenwert für aufeinander folgende Fehler überschreitet, werden nachfolgende Auftragsausführungen wie unten beschrieben verwaltet:
- Der Auftrag wird nach einem vom System festgelegten Wiederholungszeitraum neu gestartet.
- Wenn die nächste Auftragsausführung fehlschlägt, wird der Wiederholungszeitraum erhöht, und der Auftrag wird nach diesem neuen Wiederholungszeitraum neu gestartet.
- Bei jedem nachfolgenden Fehler bei der Auftragsausführung wird der Wiederholungszeitraum erhöht, bis zu einem vom System festgelegten maximalen Wiederholungszeitraum. Nach Erreichen des maximalen Wiederholungszeitraums wird der Auftrag weiterhin unter Verwendung des maximalen Wiederholungszeitraums wiederholt. Es gibt keine Beschränkung für die Anzahl der Wiederholungen für einen kontinuierlichen Auftrag.
- Wenn der Auftrag erfolgreich ausgeführt wird und eine neue Ausführung gestartet wird oder die Ausführung einen Schwellenwert ohne Fehler überschreitet, gilt der Auftrag als fehlerfrei, und die Backoffsequenz wird zurückgesetzt.
Sie können einen fortlaufenden Auftrag im exponentiellen Backoff-Zustand in der Benutzeroberfläche für Aufträge neu starten oder die Auftrags-ID an die Anforderung POST /api/2.1/jobs/run-now in der Jobs 2.1-API oder die Anforderung POST /api/2.0/jobs/run-now in der Jobs 2.0-API übergeben.