Co to są pliki obszaru roboczego?
Plik obszaru roboczego to dowolny plik w obszarze roboczym usługi Azure Databricks, który nie jest notesem usługi Databricks. Pliki obszaru roboczego mogą być dowolnym typem pliku. Do powszechnych przykładów należą:
.py
pliki używane w modułach niestandardowych..md
pliki, takie jakREADME.md
..csv
lub inne małe pliki danych..txt
Pliki..whl
Biblioteki.- Pliki dziennika.
Pliki obszaru roboczego zawierają pliki wcześniej określane jako "Pliki w repozytoriach". Aby uzyskać zalecenia dotyczące pracy z plikami, zobacz Rekomendacje dla plików w woluminach i plikach obszaru roboczego.
Ważne
Pliki obszaru roboczego są domyślnie włączone w środowisku Databricks Runtime w wersji 11.2, ale mogą być wyłączone przez administratorów przy użyciu interfejsu API REST. W przypadku obciążeń produkcyjnych użyj środowiska Databricks Runtime 11.3 LTS lub nowszego. Skontaktuj się z administratorem obszaru roboczego, jeśli nie możesz uzyskać dostępu do tej funkcji.
Co można zrobić za pomocą plików obszaru roboczego
Usługa Azure Databricks udostępnia funkcje podobne do programowania lokalnego dla wielu typów plików obszarów roboczych, w tym wbudowanego edytora plików. Nie wszystkie przypadki użycia dla wszystkich typów plików są obsługiwane. Na przykład podczas dołączania obrazów do zaimportowanego katalogu lub repozytorium nie można osadzać obrazów w notesach.
Dostęp do plików obszaru roboczego można tworzyć, edytować i zarządzać nimi przy użyciu znanych wzorców z interakcji z notesem. Ścieżki względne można używać do importowania biblioteki z plików obszaru roboczego, podobnie jak w przypadku programowania lokalnego. Aby uzyskać więcej informacji, zobacz:
- Podstawowe użycie plików obszaru roboczego
- Programowe interakcje z plikami obszaru roboczego
- Praca z modułami python i R
- Zarządzanie notesami
- Listy ACL plików
Skrypty inicjowania przechowywane w plikach obszaru roboczego mają specjalne zachowanie. Za pomocą plików obszaru roboczego można przechowywać skrypty inicjowania i odwoływać się do nich w dowolnych wersjach środowiska Databricks Runtime. Zobacz Przechowywanie skryptów inicjowania w plikach obszaru roboczego.
Uwaga
W środowisku Databricks Runtime 14.0 lub nowszym domyślnym bieżącym katalogiem roboczym (CWD) wykonywanym lokalnie jest katalog zawierający notes lub skrypt. Jest to zmiana zachowania środowiska Databricks Runtime 13.3 LTS i poniżej. Zobacz Co to jest domyślny bieżący katalog roboczy?.
Ograniczenia
Pełną listę ograniczeń plików obszaru roboczego można znaleźć w temacie Ograniczenia plików obszaru roboczego.
Limit rozmiaru pliku
Pojedyncze pliki obszaru roboczego są ograniczone do 500 MB.
Użytkownicy mogą przekazywać rozmiary plików do 500 MB z interfejsu użytkownika. Maksymalny rozmiar pliku dozwolony podczas zapisywania z klastra wynosi 256 MB.
Wersje środowiska Databricks Runtime dla plików w folderach Git z klastrem z usługami Azure Databricks Container Services
W klastrach z uruchomionym środowiskiem Databricks Runtime 11.3 LTS lub nowszym domyślne ustawienia umożliwiają używanie plików obszaru roboczego w folderach Git z usługami Azure Databricks Container Services (DCS).
W klastrach z uruchomionym środowiskiem Databricks Runtime w wersjach 10.4 LTS i 9.1 LTS należy skonfigurować plik dockerfile w celu uzyskiwania dostępu do plików obszarów roboczych w folderach Git w klastrze przy użyciu usługi DCS. Zapoznaj się z następującymi plikami dockerfile dla żądanej wersji środowiska Databricks Runtime:
Zobacz Dostosowywanie kontenerów za pomocą usługi Kontener usługi Databricks
Włączanie plików obszaru roboczego
Aby włączyć obsługę plików innych niż notes w obszarze roboczym usługi Databricks, wywołaj interfejs API REST /api/2.0/workspace-conf z notesu lub innego środowiska z dostępem do obszaru roboczego usługi Databricks. Pliki obszaru roboczego są domyślnie włączone .
Aby włączyć lub ponownie włączyć obsługę plików innych niż notes w obszarze roboczym usługi Databricks, wywołaj /api/2.0/workspace-conf
metodę i pobierz wartość enableWorkspaceFileSystem
klucza. Jeśli jest ona ustawiona na true
, pliki inne niż notesy są już włączone dla obszaru roboczego.
W poniższym przykładzie pokazano, jak wywołać ten interfejs API z notesu, aby sprawdzić, czy pliki obszaru roboczego są wyłączone, a jeśli tak, włącz je ponownie.
Przykład: notes do ponownego włączania obsługi plików obszaru roboczego usługi Databricks
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla