Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Użyj skryptu Python, aby uruchomić plik Python.
Konfigurowanie zadania skryptu Python
Przed rozpoczęciem należy przekazać skrypt Python do lokalizacji dostępnej dla użytkownika konfigurującego zadanie. Usługa Databricks zaleca używanie plików obszaru roboczego na potrzeby skryptów Python. Zobacz Czym są pliki obszaru roboczego?.
Note
Interfejs użytkownika zadań wyświetla opcje dynamicznie na podstawie innych skonfigurowanych ustawień.
Databricks odradza przechowywanie kodu lub danych przy użyciu katalogu głównego lub punktów montowania systemu plików DBFS. Zamiast tego można migrować skrypty Python do plików obszarów roboczych lub woluminów lub używać identyfikatorów URI w celu uzyskania dostępu do magazynu obiektów w chmurze.
Aby rozpocząć proces konfiguracji zadania Python script:
- Przejdź do karty Zadania w interfejsie użytkownika zadań.
- Kliknij pozycję Dodaj zadanie.
- Wprowadź nazwę w polu Nazwa zadania .
- W menu rozwijanym Type wybierz
Python script.
Konfigurowanie źródła
W menu rozwijanym Source wybierz lokalizację skryptu Python przy użyciu jednej z następujących opcji.
Workspace
Użyj Workspace aby skonfigurować skrypt Python przechowywany przy użyciu plików obszaru roboczego.
- Kliknij pole Ścieżka. Zostanie wyświetlone okno dialogowe Wybierz plik Python.
- Przejdź do skryptu Python, kliknij, aby wyróżnić plik, a następnie kliknij Confirm.
Note
Za pomocą tej opcji można skonfigurować zadanie w skrybacie Python przechowywanym w folderze Git usługi Databricks. Usługa Databricks zaleca użycie opcji dostawcy Git i zdalnego repozytorium Git do wersjonowania zasobów zaplanowanych w zadaniach.
DBFS/ADLS
Użyj DBFS/ADLS, aby skonfigurować skrypt Pythona przechowywany w lokalizacji magazynowej woluminu, magazynie obiektów w chmurze lub katalogu głównym root DBFS.
Databricks zaleca przechowywanie skryptów Python w woluminach Unity Catalog lub w magazynie obiektowym w chmurze.
W polu Path wprowadź identyfikator URI skryptu Python. Na przykład: dbfs:/path/to/script.py lub abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/script.py.
Dostawca usługi Git
Użyj dostawcy Git aby skonfigurować skrypt Python przechowywany w zdalnym repozytorium Git.
Opcje wyświetlane przez interfejs użytkownika zależą od tego, czy dostawca git został już skonfigurowany w innym miejscu. Tylko jedno zdalne repozytorium Git może być używane dla wszystkich zadań w zadaniu. Zobacz Używaj Gita z zadaniami Lakeflow.
Pole Ścieżka pojawi się po skonfigurowaniu odniesienia do git.
Wprowadź ścieżkę względną skryptu Python, na przykład etl/bronze/ingest.py.
Important
Po wprowadzeniu ścieżki względnej nie zaczynaj od / ani ./. Jeśli na przykład ścieżka bezwzględna kodu Python, do którego chcesz uzyskać dostęp, to /etl/bronze/ingest.py, wprowadź etl/bronze/ingest.py w polu Path.
Konfigurowanie bibliotek obliczeniowych i zależnych
- Użyj funkcji Compute , aby wybrać lub skonfigurować klaster, który obsługuje logikę w skryscie.
- Jeśli używasz
Serverlessobliczeń, użyj pola Środowisko i biblioteki , aby wybrać, edytować lub dodać nowe środowisko. Zobacz Konfigurowanie środowiska bezserwerowego. - Dla wszystkich innych konfiguracji obliczeniowych kliknij pozycję + Dodaj w obszarze Biblioteki zależne. Zostanie wyświetlone okno dialogowe Dodawanie biblioteki zależnej .
- Możesz wybrać istniejącą bibliotekę lub przekazać nową bibliotekę.
- Można używać tylko bibliotek przechowywanych w lokalizacji obsługiwanej przez konfiguracje obliczeniowe. Zobacz obsługę biblioteki Python.
- Każde źródło biblioteki ma inną procedurę wybierania lub przesyłania biblioteki. Zobacz Instalowanie bibliotek.
Finalizowanie konfiguracji zadania
- (Opcjonalnie) Skonfiguruj Parameters jako listę ciągów przekazywanych jako argumenty interfejsu wiersza polecenia do skryptu Python. Zobacz Konfigurowanie parametrów zadania.
- Kliknij pozycję Zapisz zadanie.