Az adathozzáférés konfigurálásának engedélyezése
Ez a cikk az Azure Databricks rendszergazdái által a felhasználói felületet használó összes SQL-raktár adathozzáférési konfigurációit ismerteti.
Feljegyzés
Ha a munkaterület engedélyezve van a Unity Cataloghoz, akkor nem kell elvégeznie a cikkben szereplő lépéseket. A Unity Catalog alapértelmezés szerint támogatja az SQL-raktárakat.
A Databricks a Unity Catalog-kötetek vagy külső helyek használatát javasolja a felhőobjektum-tárolóhoz való csatlakozáshoz a példányprofilok helyett. A Unity Catalog leegyszerűsíti az adatok biztonságát és szabályozását azáltal, hogy központi helyet biztosít az adatokhoz való hozzáférés felügyeletéhez és naplózásához a fiók több munkaterületén. Lásd : Mi az a Unity Catalog? és javaslatok a külső helyek használatára.
Ha az összes SQL Warehouse-t a REST API használatával szeretné konfigurálni, tekintse meg az SQL Warehouses API-t.
Fontos
A beállítások módosítása újraindítja az összes futó SQL-raktárat.
Az adatokhoz való hozzáférés engedélyezésének általános áttekintéséhez tekintse meg a hozzáférés-vezérlési listákat.
Követelmények
- Azure Databricks-munkaterület rendszergazdájának kell lennie az összes SQL-raktár beállításainak konfigurálásához.
Szolgáltatásnév konfigurálása
Ha szolgáltatásnevek használatával szeretné konfigurálni az SQL-tárolók hozzáférését egy Azure Data Lake Storage Gen2-tárfiókhoz, kövesse az alábbi lépéseket:
Regisztráljon egy Microsoft Entra-azonosítót (korábbi nevén Azure Active Directory-alkalmazást ) és rögzítse a következő tulajdonságokat:
- Alkalmazás (ügyfél) azonosítója: A Microsoft Entra ID-alkalmazást egyedileg azonosító azonosító azonosító.
- Címtár-(bérlői) azonosító: A Microsoft Entra ID-példányt (az Azure Databricks címtár-(bérlői) azonosítóját egyedileg azonosító azonosító.
- Titkos ügyfélkód: Az alkalmazásregisztrációhoz létrehozott ügyfélkód értéke. Az alkalmazás ezt a titkos sztringet használja személyazonosságának igazolására.
A tárfiókban adjon hozzá egy szerepkör-hozzárendelést az előző lépésben regisztrált alkalmazáshoz, hogy hozzáférést biztosítson a tárfiókhoz.
Hozzon létre egy Azure Key Vault által támogatott titkos hatókört vagy egy Databricks-hatókörű titkos hatókört, és rögzítse a hatókörnév tulajdonság értékét:
- Hatókör neve: A létrehozott titkos kulcs hatókörének neve.
Ha az Azure Key Vaultot használja, nyissa meg a Titkos kulcsok szakaszt, és tekintse meg a Titkos kulcs létrehozása az Azure Key Vault által támogatott hatókörben című szakaszt. Ezután az 1. lépésben beszerzett "ügyféltitkot" használva töltse ki a titkos kód "érték" mezőjét. Jegyezze fel az imént választott titkos nevet.
- Titkos kód neve: A létrehozott Azure Key Vault-titkos kód neve.
Ha Databricks-alapú hatókört használ, hozzon létre egy új titkos kulcsot a Databricks parancssori felületével, és használja az 1. lépésben beszerzett ügyféltitkot. Jegyezze fel az ebben a lépésben megadott titkos kulcsot.
- Titkos kulcs: A létrehozott Databricks által támogatott titkos kód kulcsa.
Feljegyzés
Az 1. lépésben beszerzett ügyfélazonosító tárolásához létrehozhat egy további titkos kulcsot is.
Kattintson a felhasználónevére a munkaterület felső sávjában, és válassza a Beállítások lehetőséget a legördülő menüből.
Kattintson a Számítás fülre.
Kattintson a Kezelés gombra az SQL-raktárak mellett.
Az Adatelérési konfiguráció mezőben kattintson a Szolgáltatásnév hozzáadása gombra.
Konfigurálja az Azure Data Lake Storage Gen2-tárfiók tulajdonságait.
Kattintson a Hozzáadás gombra.
Látni fogja, hogy új bejegyzések lettek hozzáadva az Adatelérési konfiguráció szövegmezőhöz.
Kattintson a Mentés gombra.
Az Adatelérési konfiguráció szövegmező bejegyzéseit közvetlenül is szerkesztheti.
Adatelérési tulajdonságok konfigurálása SQL-raktárakhoz
Az adatelérési tulajdonságokkal rendelkező összes raktár konfigurálása:
Kattintson a felhasználónevére a munkaterület felső sávjában, és válassza a Beállítások lehetőséget a legördülő menüből.
Kattintson a Számítás fülre.
Kattintson a Kezelés gombra az SQL-raktárak mellett.
Az Adatelérési konfiguráció szövegmezőben adja meg a metaadattár tulajdonságait tartalmazó kulcs-érték párokat.
Fontos
Ha egy Spark-konfigurációs tulajdonságot egy titkos kód értékére szeretne állítani anélkül, hogy a titkos értéket a Sparknak felfedi, állítsa az értéket a következőre
{{secrets/<secret-scope>/<secret-name>}}
: . Cserélje le<secret-scope>
a titkos kulcs hatókörére és<secret-name>
a titkos kód nevére. Az értéknek a következővel{{secrets/
kell kezdődnie, és azzal kell végződnie}}
. Erről a szintaxisról további információt a Spark konfigurációs tulajdonságában vagy környezeti változójában található titkos kódokra vonatkozó szintaxisban talál.Kattintson a Mentés gombra.
Az adatelérési tulajdonságokat a Databricks Terraform szolgáltató és databricks_sql_global_config is konfigurálhatja.
Támogatott tulajdonságok
Az előtaggal
*
végződő bejegyzés esetében az előtagon belüli összes tulajdonság támogatott.Például azt jelzi,
spark.sql.hive.metastore.*
hogy mindkettőspark.sql.hive.metastore.jars
spark.sql.hive.metastore.version
támogatott és támogatott, és minden más tulajdonság, amely a következővelspark.sql.hive.metastore
kezdődik: .Bizalmas információkat tartalmazó tulajdonságok esetén a bizalmas adatokat titkos kódban tárolhatja, és a tulajdonság értékét a titkos névre állíthatja az alábbi szintaxis használatával:
secrets/<secret-scope>/<secret-name>
Az SQL-raktárak esetében a következő tulajdonságok támogatottak:
spark.sql.hive.metastore.*
spark.sql.warehouse.dir
spark.hadoop.datanucleus.*
spark.hadoop.fs.*
spark.hadoop.hive.*
spark.hadoop.javax.jdo.option.*
spark.hive.*
A tulajdonságok beállításáról további információt a Külső Hive metaadattárban talál.