Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
Verwenden Sie die Python-Skript-Aufgabe, um eine Python-Datei auszuführen.
Konfigurieren einer Python-Skriptaufgabe
Bevor Sie beginnen, müssen Sie Ihr Python-Skript an einen Speicherort hochladen, auf den der Benutzer zugreifen kann, der den Job konfiguriert. Databricks empfiehlt die Verwendung von Arbeitsbereichsdateien für Python-Skripts. Weitere Informationen finden Sie unter Was sind Arbeitsbereichsdateien?.
Note
Die Job-Benutzeroberfläche zeigt Optionen dynamisch basierend auf anderen konfigurierten Einstellungen an.
Databricks empfiehlt, Code oder Daten mithilfe von DBFS-Wurzel oder Bereitstellungen zu speichern. Stattdessen können Sie Python-Skripts zu Arbeitsbereichsdateien oder Volumes migrieren oder URIs verwenden, um auf Cloud-Objektspeicher zuzugreifen.
So beginnen Sie den Flow zum Konfigurieren einer Python script-Aufgabe:
- Navigieren Sie zur Registerkarte Aufgaben in der Benutzeroberfläche „Jobs“.
- Klicken Sie auf "Aufgabe hinzufügen".
- Geben Sie einen Namen in das Feld " Vorgangsname " ein.
- Wählen Sie im Dropdownmenü Typ die Option
Python scriptaus.
Konfigurieren der Quelle
Wählen Sie im Dropdown-Menü Quelle einen Speicherort für das Python-Skript mit einer der folgenden Optionen aus.
Workspace
Verwenden Sie Arbeitsbereich, um ein Python-Skript zu konfigurieren, das mithilfe von Arbeitsbereichsdateien gespeichert ist.
- Klicken Sie auf das Feld Pfad. Der Dialog Python-Datei auswählen wird angezeigt.
- Navigieren Sie zum Python-Skript, klicken Sie, um die Datei hervorzuheben, und klicken Sie auf Bestätigen.
Note
Mit dieser Option können Sie eine Aufgabe in einem Python-Skript konfigurieren, das in einem Git-Ordner „Databricks“ gespeichert ist. Databricks empfiehlt die Verwendung der Git-Anbieter-Optionen und eines Remote-Git-Repositorys zur Versionsverwaltung von Ressourcen, die mit Jobs geplant sind.
DBFS/ADLS
Verwenden Sie DBFS/ADLS, um ein Python-Skript zu konfigurieren, das in einem Volume, in einem Cloud-Objektspeicherort oder in der DBFS-Wurzel gespeichert ist.
Databricks empfiehlt, Python-Skripts in Unity Catalog-Volumes oder Cloud-Objektspeicher zu speichern.
Geben Sie im Feld Pfad die URI zu Ihrem Python-Skript ein. Zum Beispiel: dbfs:/path/to/script.py oder abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.
Git-Anbieter
Verwenden Sie Git-Anbieter, um ein Python-Skript zu konfigurieren, das in einem Remote-Git-Repository gespeichert ist.
Die von der Benutzeroberfläche angezeigten Optionen hängen davon ab, ob Sie bereits einen Git-Anbieter an anderer Stelle konfiguriert haben. Nur ein Git-Remote-Repository kann für alle Aufgaben in einem Job verwendet werden. Siehe Verwenden von Git mit Jobs.
Das Feld Pfad wird angezeigt, nachdem Sie eine Git-Referenz konfiguriert haben.
Geben Sie den relativen Pfad für Ihr Python-Skript ein, z. B. etl/bronze/ingest.py.
Important
Wenn Sie den relativen Pfad eingeben, beginnen Sie nicht mit / oder ./. Ist der absolute Pfad für den Python-Code, auf den Sie zugreifen möchten, beispielsweise /etl/bronze/ingest.py, geben Sie im Feld etl/bronze/ingest.py ein.
Konfigurieren von Compute und abhängigen Bibliotheken
- Verwenden Sie Compute, um einen Cluster auszuwählen oder zu konfigurieren, der die Logik in Ihrem Skript unterstützt.
- Wenn Sie
Serverless-Compute verwenden, verwenden Sie das Feld Umgebung und Bibliotheken, um eine neue Umgebung auszuwählen, zu bearbeiten oder hinzuzufügen. Siehe Konfigurieren der serverlosen Umgebung. - Klicken Sie für alle anderen Computekonfigurationen unter abhängigen Bibliotheken auf +Hinzufügen. Der Dialog Abhängige Bibliothek hinzufügen wird angezeigt.
- Sie können eine vorhandene Bibliothek auswählen oder eine neue Bibliothek hochladen.
- Sie können nur Bibliotheken verwenden, die an einem Speicherort gespeichert sind, der von Ihren Compute-Konfigurationen unterstützt wird. Siehe Python-Bibliotheksunterstützung.
- Jede Bibliotheksquelle verfügt über einen anderen Flow zum Auswählen oder Hochladen einer Bibliothek. Siehe Installieren von Bibliotheken.
Abschließen der Job-Konfiguration
- (Optional) Konfigurieren Sie Parameter als eine Liste von Zeichenketten, die als CLI-Argumente an das Python-Skript übergeben werden. Weitere Informationen finden Sie unter Konfigurieren von Aufgabenparametern.
- Klicken Sie auf Aufgabe speichern.