Mik azok a munkaterületfájlok?
A munkaterületfájl az Azure Databricks-munkaterület bármely olyan fájlja, amely nem Databricks-jegyzetfüzet. A munkaterület fájljai bármilyen fájltípust tartalmazhatnak. Néhány általános példa:
.py
egyéni modulokban használt fájlok..md
fájlokat, példáulREADME.md
..csv
vagy más kis adatfájlokat..txt
Fájlokat..whl
Könyvtárak.- Naplófájlok.
A munkaterület fájljai közé tartoznak a korábban "Tárakban lévő fájlok" néven is emlegetett fájlok.
Fontos
A munkaterületfájlok alapértelmezés szerint mindenhol engedélyezve vannak a Databricks Runtime 11.2-es verziójában, de a REST API-t használó rendszergazdák letilthatják. Éles számítási feladatokhoz használja a Databricks Runtime 11.3 LTS vagy újabb verzióját. Ha nem fér hozzá ehhez a funkcióhoz, forduljon a munkaterület rendszergazdájához.
Mit tehet a munkaterület fájljaival?
Az Azure Databricks a helyi fejlesztéshez hasonló funkciókat biztosít számos munkaterületi fájltípushoz, beleértve a beépített fájlszerkesztőt is. Az összes fájltípushoz nem minden használati eset támogatott. Bár például képeket is felvehet egy importált könyvtárba vagy adattárba, nem ágyazhat be képeket jegyzetfüzetekbe.
A munkaterület-fájlokhoz való hozzáférést a jegyzetfüzet-interakciók ismerős mintáival hozhatja létre, szerkesztheti és kezelheti. A munkaterületfájlokból származó tárimportálások relatív elérési útjai a helyi fejlesztéshez hasonlóan használhatók. További információ:
- A munkaterület fájljainak alapszintű használata
- Programozott módon kezelheti a munkaterület fájljait
- Python- és R-modulok használata
- Jegyzetfüzetek kezelése
- Fájl ACL-ek
A munkaterületfájlokban tárolt Init-szkriptek speciális viselkedést igényelnek. A munkaterület fájljaival bármilyen Databricks Runtime-verzióban tárolhat és hivatkozhat init-szkriptekre. Lásd: Store init scripts in workspace files.
Feljegyzés
A Databricks Runtime 14.0-s vagy újabb verziójában a helyileg végrehajtott kód alapértelmezett aktuális munkakönyvtára (CWD) a futtatandó jegyzetfüzetet vagy szkriptet tartalmazó könyvtár. Ez a Databricks Runtime 13.3 LTS és az alábbi viselkedésbeli változás. Lásd : Mi az alapértelmezett aktuális munkakönyvtár?.
Korlátozások
A munkaterületfájlokra vonatkozó korlátozások teljes listája megtalálható a Munkaterület-fájlokra vonatkozó korlátozások között.
Fájlméretkorlát
Az egyes munkaterületfájlok legfeljebb 500 MB méretűek.
A felhasználók legfeljebb 500 MB méretű fájlokat tölthetnek fel a felhasználói felületről. A fürtről való íráskor megengedett maximális fájlméret 256 MB.
Databricks Runtime-verziók a Git-mappákban lévő fájlokhoz az Azure Databricks Container Services szolgáltatással rendelkező fürttel
A Databricks Runtime 11.3 LTS-t és újabb verziót futtató fürtök esetében az alapértelmezett beállítások lehetővé teszik a munkaterületfájlok használatát a Git-mappákban az Azure Databricks Container Services (DCS) használatával.
A Databricks Runtime 10.4 LTS-t és 9.1 LTS-t futtató fürtök esetén konfigurálnia kell a dockerfile-t, hogy hozzáférjen a Git-mappákban lévő munkaterületfájlokhoz a DCS-sel rendelkező fürtön. A databricks runtime kívánt verziójához tekintse meg a következő dockerfile-fájlokat:
Lásd: Tárolók testreszabása a Databricks Container Service szolgáltatással
Munkaterületfájlok engedélyezése
A Databricks-munkaterületen lévő nem jegyzetfüzetfájlok támogatásának engedélyezéséhez hívja meg a /api/2.0/workspace-conf REST API-t egy jegyzetfüzetből vagy más környezetből, amely hozzáfér a Databricks-munkaterülethez. A munkaterület fájljai alapértelmezés szerint engedélyezve vannak.
A Databricks-munkaterületen lévő nem jegyzetfüzet-fájlok támogatásának engedélyezéséhez vagy újbóli engedélyezéséhez hívja meg a /api/2.0/workspace-conf
kulcsot, és kérje le a enableWorkspaceFileSystem
kulcs értékét. Ha be van állítva true
, a nem jegyzetfüzet-fájlok már engedélyezve vannak a munkaterületen.
Az alábbi példa bemutatja, hogyan hívhatja meg ezt az API-t egy jegyzetfüzetből annak ellenőrzéséhez, hogy a munkaterület fájljai le vannak-e tiltva, és ha igen, hogyan engedélyezheti újra azokat. A munkaterület fájljainak letiltásához állítsa be enableWorkspaceFilesystem
false
az /api/2.0/workspace-conf
API-t.
Példa: Jegyzetfüzet a Databricks-munkaterület fájltámogatásának újbóli engedélyezéséhez
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: