Megosztás a következőn keresztül:


Mik azok a munkaterületfájlok?

A munkaterületfájl az Azure Databricks-munkaterület fájlfája olyan fájl, amely nem tartozik a következő típusok közé:

  • Jegyzetfüzetek
  • Lekérdezések
  • Irányítópultok
  • Genie szóközök
  • Kísérletek

A kizárt típusokon kívül a munkaterületfájlok bármilyen fájltípust tartalmazhatnak. Néhány általános példa:

  • .py egyéni modulokban használt fájlok.
  • .md fájlokat, például README.md.
  • .csv vagy más kis adatfájlokat.
  • .txt Fájlokat.
  • .whl Könyvtárak.
  • Naplófájlok.

A fájlok használatával kapcsolatos javaslatokért tekintse meg a kötetekben és munkaterületfájlokban lévő fájlokra vonatkozó javaslatokat.

Az Azure Databricks-munkaterület fájlfája tartalmazhatja a "Databricks Git-mappák" nevű Git-adattárhoz csatolt mappákat. A fájltípus-támogatás további korlátozásokkal rendelkezik. A Git-mappákban (korábbi nevén "Adattárak") támogatott fájltípusok listájáért tekintse meg a Git-mappákban támogatott eszköztípusokat.

Fontos

A Munkaterület-fájlok alapértelmezés szerint mindenhol engedélyezve vannak a Databricks Runtime 11.2-es verziójában. Éles számítási feladatokhoz használja a Databricks Runtime 11.3 LTS vagy újabb verzióját. Ha nem fér hozzá ehhez a funkcióhoz, forduljon a munkaterület rendszergazdájához.

Mit tehet a munkaterület fájljaival?

Az Azure Databricks a helyi fejlesztéshez hasonló funkciókat biztosít számos munkaterületi fájltípushoz, beleértve a beépített fájlszerkesztőt is. Az összes fájltípushoz nem minden használati eset támogatott.

A munkaterület-fájlokhoz való hozzáférést a jegyzetfüzet-interakciók ismerős mintáival hozhatja létre, szerkesztheti és kezelheti. A munkaterületfájlokból származó tárimportálások relatív elérési útjai a helyi fejlesztéshez hasonlóan használhatók. További információ:

A munkaterületfájlokban tárolt Init-szkriptek speciális viselkedést igényelnek. A munkaterület fájljaival bármilyen Databricks Runtime-verzióban tárolhat és hivatkozhat init-szkriptekre. Lásd: Store init scripts in workspace files.

Feljegyzés

A Databricks Runtime 14.0-s vagy újabb verziójában a helyileg végrehajtott kód alapértelmezett aktuális munkakönyvtára (CWD) a futtatandó jegyzetfüzetet vagy szkriptet tartalmazó könyvtár. Ez a Databricks Runtime 13.3 LTS és az alábbi viselkedésbeli változás. Lásd : Mi az alapértelmezett aktuális munkakönyvtár?.

Korlátozások

  • Ha a munkafolyamat egy távoli Git-adattárban található forráskódot használ, nem írhat az aktuális könyvtárba, és nem írhat relatív elérési úttal. Adatok írása más helyekre.
  • Nem használhat git parancsokat a munkaterület fájljaiba való mentéskor. A címtárak létrehozása .git nem engedélyezett a munkaterület fájljaiban.
  • A kiszolgáló nélküli számítás nem támogatja a munkaterületi fájlokból a Spark-végrehajtókkal (például spark.read.format("csv").load("file:/Workspace/Users/<user-folder>/data.csv")) végzett olvasást.
  • A végrehajtók nem tudnak munkaterületfájlokba írni.
  • A symlinkek a gyökérmappában /Workspace lévő célkönyvtárak esetében támogatottak.
  • A munkaterület-fájlok nem érhetők el a felhasználó által definiált függvényekből (UDF-ekből) a Databricks Runtime 14.2-ben és az alábbi, megosztott hozzáférési móddal rendelkező fürtökön.

Fájlméretkorlát

  • A munkaterület fájlmérete a felhasználói felületen legfeljebb 500 MB lehet. A fürtről való íráskor megengedett maximális fájlméret 256 MB.

Fájlhozzáférés engedélykorlátja

A mappákban /Workspace lévő fájlok elérésére vonatkozó engedély 36 óra után jár le az interaktív számításhoz és 30 nap után a feladatokhoz. A Databricks azt javasolja, hogy hosszú végrehajtásokat futtasson feladatként, ha /Munkaterület fájlhozzáférésre van szükségük.

Munkaterületfájlok engedélyezése

A Databricks-munkaterületen lévő nem jegyzetfüzetfájlok támogatásának engedélyezéséhez hívja meg a /api/2.0/workspace-conf REST API-t egy jegyzetfüzetből vagy más környezetből, amely hozzáfér a Databricks-munkaterülethez. A munkaterület fájljai alapértelmezés szerint engedélyezve vannak.

A Databricks-munkaterületen lévő nem jegyzetfüzet-fájlok támogatásának engedélyezéséhez vagy újbóli engedélyezéséhez hívja meg a /api/2.0/workspace-conf kulcsot, és kérje le a enableWorkspaceFileSystem kulcs értékét. Ha be van állítva true, a nem jegyzetfüzet-fájlok már engedélyezve vannak a munkaterületen.

Az alábbi példa bemutatja, hogyan hívhatja meg ezt az API-t egy jegyzetfüzetből annak ellenőrzéséhez, hogy a munkaterület fájljai le vannak-e tiltva, és ha igen, hogyan engedélyezheti újra azokat.

Példa: Jegyzetfüzet a Databricks-munkaterület fájltámogatásának újbóli engedélyezéséhez

Jegyzetfüzet beszerzése