Tároló hitelesítő adatainak létrehozása az Azure Data Lake Storage Gen2-hez való csatlakozáshoz
Ez a cikk azt ismerteti, hogyan hozhat létre tároló hitelesítő adatokat a Unity Katalógusban az Azure Data Lake Storage Gen2-hez való csatlakozáshoz.
A táblákat és köteteket tartalmazó mögöttes felhőalapú tárolóhoz való hozzáférés kezeléséhez a Unity Catalog a következő objektumtípusokat használja:
- A tárolási hitelesítő adatok hosszú távú felhőalapú hitelesítő adatokat foglalnak magában, amely hozzáférést biztosít a felhőbeli tárolókhoz.
- A külső helyek egy tárolási hitelesítő adatokra és egy felhőbeli tárolási útvonalra mutató hivatkozást tartalmaznak.
További információ: Felhőbeli tárolóhoz való hozzáférés kezelése a Unity Catalog használatával.
Feljegyzés
Ha a Unity Katalógus használatával szeretné szabályozni a külső szolgáltatásokhoz való hozzáférést a felhőbeli tárolás helyett, olvassa el a külső felhőszolgáltatásokhoz való hozzáférés kezelése szolgáltatás hitelesítő adataival című témakört.
A Unity Catalog két felhőalapú tárolási lehetőséget támogat az Azure Databrickshez: az Azure Data Lake Storage Gen2-tárolókat és a Cloudflare R2-gyűjtőket. A Cloudflare R2 elsősorban deltamegosztási használati esetekhez készült, amelyekben el szeretné kerülni az adatforgalom díját. Az Azure Data Lake Storage Gen2 a legtöbb más használati esethez megfelelő. Ez a cikk az Azure Data Lake Storage Gen2-tárolók tárolási hitelesítő adatainak létrehozását ismerteti. A Cloudflare R2 esetében lásd : Tároló hitelesítő adatainak létrehozása a Cloudflare R2-hez való csatlakozáshoz.
Egy Azure Data Lake Storage Gen2-tárolóhoz való hozzáféréshez szükséges tárolási hitelesítő adatok létrehozásához létre kell hoznia egy Azure Databricks hozzáférési összekötőt, amely egy Azure-beli felügyelt identitásra hivatkozik, és engedélyeket rendel hozzá a tárolóhoz. Ezután hivatkozhat erre a hozzáférési összekötőre a tároló hitelesítő adatainak definíciójában.
Követelmények
Az Azure Databricksben:
A Unity Cataloghoz engedélyezett Azure Databricks-munkaterület.
CREATE STORAGE CREDENTIAL
jogosultságot a munkaterülethez csatolt Unity Catalog metaadattárban. A fiókadminisztrátor és a metaadattár-rendszergazdák alapértelmezés szerint rendelkeznek ezzel a jogosultsággal.Feljegyzés
A szolgáltatásneveknek fiókadminisztrátori szerepkörrel kell rendelkezniük egy felügyelt identitást használó tároló hitelesítő adatok létrehozásához. Szolgáltatásnévre nem delegálható
CREATE STORAGE CREDENTIAL
. Ez az Azure Databricks szolgáltatásnevekre és a Microsoft Entra ID szolgáltatásnevekre is vonatkozik.
Az Azure-bérlőben:
Egy Azure Data Lake Storage Gen2 tároló. A kimenő forgalom költségeinek elkerülése érdekében ennek ugyanabban a régióban kell lennie, ahonnan az adatokat el szeretné érni.
Az Azure Data Lake Storage Gen2-tárfióknak hierarchikus névtérrel kell rendelkeznie.
Azure-erőforráscsoport közreműködője vagy tulajdonosa.
Tulajdonos vagy felhasználó, aki a tárfiók felhasználói hozzáférés-rendszergazdai Azure RBAC-szerepkörével rendelkezik.
Tároló hitelesítő adatainak létrehozása felügyelt identitással
Használhat azure-beli felügyelt identitást vagy szolgáltatásnevet a tárolóhoz való hozzáférést engedélyező identitásként. A felügyelt identitások használata erősen ajánlott. Előnyük, hogy lehetővé teszik a Unity Catalog számára, hogy hozzáférjenek a hálózati szabályok által védett tárfiókokhoz, ami szolgáltatásnevek használatával nem lehetséges, és szükségtelenné teszik a titkos kulcsok kezelését és elforgatását. Ha szolgáltatásnevet szeretne használni, olvassa el a Unity Catalog által felügyelt tároló létrehozása szolgáltatásnévvel (örökölt) című témakört.
Az Azure Portalon hozzon létre egy Azure Databricks hozzáférési összekötőt, és rendelje hozzá az engedélyeket a elérni kívánt tárolóhoz a Unity Catalog felügyelt identitásának konfigurálása című témakörben található utasítások alapján.
Az Azure Databricks hozzáférési összekötő egy belső Azure-erőforrás, amellyel felügyelt identitásokat csatlakoztathat egy Azure Databricks-fiókhoz. A tároló hitelesítő adatainak hozzáadásához rendelkeznie kell a közreműködői szerepkörsel vagy annál magasabb szintű hozzáférés-összekötő-erőforrással az Azure-ban.
Jegyezze fel a hozzáférési összekötő erőforrás-azonosítóját.
Jelentkezzen be a Unity Catalog-kompatibilis Azure Databricks-munkaterületre olyan felhasználóként, aki rendelkezik jogosultsággal
CREATE STORAGE CREDENTIAL
.A metaadattár-rendszergazdai és a fiókadminisztrátori szerepkör is tartalmazza ezt a jogosultságot. Ha szolgáltatásnévként van bejelentkezve (akár Microsoft Entra-azonosító, akár natív Azure Databricks-szolgáltatásnév), akkor a felügyelt identitást használó tároló hitelesítő adatok létrehozásához fiókadminisztrátori szerepkörrel kell rendelkeznie.
Kattintson a Katalógus gombra .
A Gyorselérési lapon kattintson a Külső adatok > gombra, lépjen a Hitelesítő adatok lapra, és válassza a Hitelesítő adatok létrehozása lehetőséget.
Válassza a Storage hitelesítő adatait.
Válassza ki az Azure Managed Identity hitelesítő adattípusát.
Adja meg a hitelesítő adatok nevét, és adja meg a hozzáférési összekötő erőforrás-azonosítóját a következő formátumban:
/subscriptions/<subscription-id>/resourceGroups/<resource-group>/providers/Microsoft.Databricks/accessConnectors/<connector-name>
(Nem kötelező) Ha a hozzáférési összekötőt felhasználó által hozzárendelt felügyelt identitással hozta létre, adja meg a felügyelt identitás erőforrás-azonosítóját a felhasználó által hozzárendelt felügyelt identitásazonosító mezőben a következő formátumban:
/subscriptions/<subscription-id>/resourceGroups/<resource-group-name>/providers/Microsoft.ManagedIdentity/userAssignedIdentities/<managed-identity-name>
(Nem kötelező) Ha azt szeretné, hogy a felhasználók csak olvasási hozzáféréssel rendelkezzenek a tároló hitelesítő adatait használó külső helyekhez, válassza az Írásvédett lehetőséget. További információ: Tároló hitelesítő adatainak megjelölése írásvédettként.
Kattintson a Létrehozás gombra.
(Nem kötelező) A tároló hitelesítő adatainak kötése adott munkaterületekhez.
Alapértelmezés szerint bármely kiemelt felhasználó használhatja a tár hitelesítő adatait a metaadattárhoz csatolt munkaterületeken. Ha csak bizonyos munkaterületekről szeretné engedélyezni a hozzáférést, lépjen a Munkaterületek lapra, és rendeljen hozzá munkaterületeket. Lásd : (Nem kötelező) Tároló hitelesítő adatainak hozzárendelése adott munkaterületekhez.
Hozzon létre egy külső helyet , amely erre a tárolási hitelesítő adatra hivatkozik.
(Nem kötelező) Tároló hitelesítő adatainak hozzárendelése adott munkaterületekhez
Fontos
Ez a funkció a nyilvános előzetes verzióban érhető el.
Alapértelmezés szerint a tár hitelesítő adatai a metaadattár összes munkaterületéről elérhetők. Ez azt jelenti, hogy ha egy felhasználó jogosultságot (például CREATE EXTERNAL LOCATION
) kapott a tár hitelesítő adataihoz, akkor ezt a jogosultságot a metaadattárhoz csatolt munkaterületről is gyakorolhatja. Ha munkaterületekkel elkülöníti a felhasználói adatokhoz való hozzáférést, akkor előfordulhat, hogy csak bizonyos munkaterületekről szeretné engedélyezni a tárterület hitelesítő adatainak elérését. Ezt a funkciót munkaterület-kötésnek vagy tároló hitelesítő adatok elkülönítésének nevezzük.
A tárolási hitelesítő adatok adott munkaterületekhez való kötésének tipikus használati esete az a forgatókönyv, amelyben a felhőgazdák egy éles felhőbeli fiók hitelesítő adataival konfigurálják a tárolási hitelesítő adatokat, és biztosítani szeretné, hogy az Azure Databricks-felhasználók ezt a hitelesítő adatot csak az éles munkaterületen hozzák létre külső helyek létrehozására.
A munkaterület-kötéssel kapcsolatos további információkért lásd : (Nem kötelező) Külső hely hozzárendelése adott munkaterületekhez és katalógushozzáférés korlátozása adott munkaterületekhez.
Feljegyzés
A munkaterület-kötésekre a tár hitelesítő adataival szembeni jogosultságok gyakorolásakor hivatkozunk. Ha például egy felhasználó egy külső helyet hoz létre egy tároló hitelesítő adataival, a munkaterület-kötés csak a külső hely létrehozásakor lesz bejelölve. A külső hely létrehozása után a tároló hitelesítő adatain konfigurált munkaterület-kötésektől függetlenül fog működni.
Tároló hitelesítő adatainak kötése egy vagy több munkaterülethez
Ha tároló hitelesítő adatokat szeretne hozzárendelni adott munkaterületekhez, használhatja a Catalog Explorert vagy a Databricks parancssori felületét.
Szükséges engedélyek: Metaadattár-rendszergazda vagy tár hitelesítő adatainak tulajdonosa.
Feljegyzés
A metaadattár-rendszergazdák a Katalóguskezelővel láthatják a metaadattárban található összes tárolási hitelesítő adatot– a tár hitelesítő adatai pedig a metaadattárban lévő összes tár hitelesítő adatot láthatják, függetlenül attól, hogy a tár hitelesítő adatai az aktuális munkaterülethez vannak-e rendelve. A munkaterülethez nem rendelt tárolási hitelesítő adatok szürkén jelennek meg.
Katalóguskezelő
Jelentkezzen be a metaadattárhoz csatolt munkaterületre.
Az oldalsávon kattintson a Katalógus gombra .
A Gyorselérési lapon kattintson a Külső adatok > gombra, és lépjen a Hitelesítő adatok lapra.
Válassza ki a tároló hitelesítő adatait, és lépjen a Munkaterületek lapra.
A Munkaterületek lapon törölje a jelet a Minden munkaterület hozzáférése jelölőnégyzetből.
Ha a tároló hitelesítő adatai már egy vagy több munkaterülethez kötődnek, a jelölőnégyzet már nincs bejelölve.
Kattintson a Munkaterületek hozzárendelése gombra, és adja meg vagy keresse meg a hozzárendelni kívánt munkaterületeket.
A hozzáférés visszavonásához lépjen a Munkaterületek lapra, jelölje ki a munkaterületet, és kattintson a Visszavonás gombra. Ha minden munkaterületről engedélyezni szeretné a hozzáférést, jelölje be a Minden munkaterület hozzáféréssel jelölőnégyzetet.
CLI
Két Databricks CLI-parancscsoport és két lépés szükséges a tároló hitelesítő adatainak munkaterülethez való hozzárendeléséhez.
Az alábbi példákban cserélje le <profile-name>
az Azure Databricks-hitelesítési konfigurációs profil nevét. Tartalmaznia kell egy személyes hozzáférési jogkivonat értékét a munkaterület-példány neve és a munkaterület azonosítója mellett, ahol a személyes hozzáférési jogkivonatot létrehozta. Tekintse meg az Azure Databricks személyes hozzáférési jogkivonatának hitelesítését.
storage-credentials
A parancscsoport parancsávalupdate
állítsa a tároló hitelesítőisolation mode
adatait a következőreISOLATED
:databricks storage-credentials update <my-storage-credential> \ --isolation-mode ISOLATED \ --profile <profile-name>
Az alapértelmezett
isolation-mode
beállítás aOPEN
metaadattárhoz csatolt összes munkaterületre igaz.workspace-bindings
A parancscsoport parancsávalupdate-bindings
rendelje hozzá a munkaterületeket a tároló hitelesítő adataihoz:databricks workspace-bindings update-bindings storage-credential <my-storage-credential> \ --json '{ "add": [{"workspace_id": <workspace-id>}...], "remove": [{"workspace_id": <workspace-id>}...] }' --profile <profile-name>
A munkaterület-kötések hozzáadásához vagy
"remove"
eltávolításához használja a"add"
tulajdonságokat és a tulajdonságokat.Feljegyzés
A csak olvasható kötés (
BINDING_TYPE_READ_ONLY
) nem érhető el a tár hitelesítő adataihoz. Ezért nincs ok a tárolási hitelesítő adatok kötésének beállításárabinding_type
.
A tárterület-hitelesítő adatokhoz tartozó munkaterület-hozzárendelések listázásához használja a workspace-bindings
parancscsoport parancsát get-bindings
:
databricks workspace-bindings get-bindings storage-credential <my-storage-credential> \
--profile <profile-name>
Tároló hitelesítő adatainak leválasztása munkaterületről
A Katalóguskezelő vagy a CLI parancscsoport használatával a munkaterület hozzáférésének a katalóguskezelővel vagy a workspace-bindings
PARANCSSOR-paranccsal történő visszavonására vonatkozó utasításokat a tár hitelesítő adatainak egy vagy több munkaterülethez való kötése tartalmazza.
Következő lépések
Megtekintheti, frissítheti, törölheti és engedélyezheti más felhasználók számára a tárolási hitelesítő adatok használatát. Lásd: Tárolási hitelesítő adatok kezelése.
Külső helyeket tárolási hitelesítő adatokkal határozhat meg. Lásd: Külső hely létrehozása a felhőbeli tároló Azure Databrickshez való csatlakoztatásához.