Felügyelt és külső kötetek
Ez a cikk a felügyelt kötetek és a külső kötetek közötti különbségeket, valamint a külső kötetek használatának okait ismerteti. A Databricks a felügyelt köteteket javasolja a legegyszerűbb megoldásként a nem táblázatos adatokhoz való hozzáférés tárolására és kezelésére.
A Unity Catalog felhőobjektum-tárolóhoz való hozzáférés konfigurálásához való használatával kapcsolatos további útmutatásért lásd : Csatlakozás a felhőobjektum-tárolóhoz a Unity Catalog használatával.
Viselkedésbeli különbségek a felügyelt és a külső kötetek között
A felügyelt és külső kötetek szinte azonos élményt nyújtanak az Azure Databricks-eszközök, felhasználói felületek és API-k használatakor. Az alábbiakban a kötettípusok közötti különbségeket mutatjuk.
A felügyelt kötetek teljes körűen felügyelt tárolási élményt nyújtanak. Ez a következőt jelenti:
- A felügyelt kötetekben lévő fájlokkal való minden interakciónak végig kell mennie a Unity Katalóguson.
- A címtár elnevezését és az adatelrendezést a Unity Catalog felügyeli. A címtárnevek kivonatokat tartalmaznak a mögöttes felhőobjektum-tárfiókokban előforduló ütközések elkerülése érdekében.
- Felügyelt kötet elvetésekor az Azure Databricks 30 napon belül törli a mögöttes adatokat.
A külső kötetek adatszabályozást hoznak a felhőobjektum-tárolókba. Ez a következőt jelenti:
- Az Azure Databricks vagy külső rendszerek felhőalapú URI-jait használhatja a külső kötetekben lévő fájlok kezeléséhez.
- A külső köteten vagy a feltöltött fájlokon belül létrehozott összes könyvtár a
LOCATION
létrehozáskor megadotthoz képest van. - Külső kötet elvetésekor eltávolítja a kötetet a Unity Katalógusból, de a mögöttes adatok nem változnak a külső helyen.
Miért érdemes külső köteteket használni?
A külső kötetek lehetővé teszik a Unity Catalog adatszabályozásának hozzáadását a meglévő felhőobjektum-tárolókönyvtárakhoz. A külső kötetek egyes használati esetei a következők:
- Irányítás hozzáadása adatfájlokhoz migrálás nélkül.
- A más rendszerek által létrehozott, az Azure Databricks által betöltött vagy elérhető fájlok szabályozása.
- Az Azure Databricks által előállított olyan adatok szabályozása, amelyeket más rendszerek közvetlenül a felhőobjektum-tárolóból kell elérni.
A Databricks azt javasolja, hogy külső kötetekkel tárolja a nem táblázatos adatfájlokat, amelyeket az Azure Databricks mellett külső rendszerek olvasnak vagy írnak. A Unity Catalog nem szabályozza a közvetlenül a külső rendszerekből származó felhőobjektum-tárolókon végzett olvasásokat és írásokat, ezért további szabályzatokat és hitelesítő adatokat kell konfigurálnia a felhőfiókban, hogy az adatszabályozási szabályzatokat az Azure Databricksen kívül is tiszteletben tartsák.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: