Megosztás a következőn keresztül:


Felügyelt és külső kötetek

Ez a cikk a felügyelt kötetek és a külső kötetek közötti különbségeket, valamint a külső kötetek használatának okait ismerteti. A Databricks a felügyelt köteteket javasolja a legegyszerűbb megoldásként a nem táblázatos adatokhoz való hozzáférés tárolására és kezelésére.

A Unity Catalog felhőobjektum-tárolóhoz való hozzáférés konfigurálásához való használatával kapcsolatos további útmutatásért lásd : Csatlakozás a felhőobjektum-tárolóhoz a Unity Catalog használatával.

Viselkedésbeli különbségek a felügyelt és a külső kötetek között

A felügyelt és külső kötetek szinte azonos élményt nyújtanak az Azure Databricks-eszközök, felhasználói felületek és API-k használatakor. Az alábbiakban a kötettípusok közötti különbségeket mutatjuk.

A felügyelt kötetek teljes körűen felügyelt tárolási élményt nyújtanak. Ez a következőt jelenti:

  • A felügyelt kötetekben lévő fájlokkal való minden interakciónak végig kell mennie a Unity Katalóguson.
  • A címtár elnevezését és az adatelrendezést a Unity Catalog felügyeli. A címtárnevek kivonatokat tartalmaznak a mögöttes felhőobjektum-tárfiókokban előforduló ütközések elkerülése érdekében.
  • Felügyelt kötet elvetésekor az Azure Databricks 30 napon belül törli a mögöttes adatokat.

A külső kötetek adatszabályozást hoznak a felhőobjektum-tárolókba. Ez a következőt jelenti:

  • Az Azure Databricks vagy külső rendszerek felhőalapú URI-jait használhatja a külső kötetekben lévő fájlok kezeléséhez.
  • A külső köteten vagy a feltöltött fájlokon belül létrehozott összes könyvtár a LOCATION létrehozáskor megadotthoz képest van.
  • Külső kötet elvetésekor eltávolítja a kötetet a Unity Katalógusból, de a mögöttes adatok nem változnak a külső helyen.

Miért érdemes külső köteteket használni?

A külső kötetek lehetővé teszik a Unity Catalog adatszabályozásának hozzáadását a meglévő felhőobjektum-tárolókönyvtárakhoz. A külső kötetek egyes használati esetei a következők:

  • Irányítás hozzáadása adatfájlokhoz migrálás nélkül.
  • A más rendszerek által létrehozott, az Azure Databricks által betöltött vagy elérhető fájlok szabályozása.
  • Az Azure Databricks által előállított olyan adatok szabályozása, amelyeket más rendszerek közvetlenül a felhőobjektum-tárolóból kell elérni.

A Databricks azt javasolja, hogy külső kötetekkel tárolja a nem táblázatos adatfájlokat, amelyeket az Azure Databricks mellett külső rendszerek olvasnak vagy írnak. A Unity Catalog nem szabályozza a közvetlenül a külső rendszerekből származó felhőobjektum-tárolókon végzett olvasásokat és írásokat, ezért további szabályzatokat és hitelesítő adatokat kell konfigurálnia a felhőfiókban, hogy az adatszabályozási szabályzatokat az Azure Databricksen kívül is tiszteletben tartsák.