Megosztás:


Adatelérési konfigurációk

Fontos

Ezek az utasítások az örökölt adathozzáférési mintákra vonatkoznak. A Databricks a Unity Catalog külső helyeinek használatát javasolja az adathozzáféréshez. Lásd: Csatlakozás a felhőobjektum-tárolóhoz a Unity Catalog használatával.

Ez a cikk azt ismerteti, hogyan kezelheti a munkaterületen lévő SQL-raktárak adathozzáférési tulajdonságait.

Fontos

A beállítások módosítása újraindítja az összes futó SQL-raktárat.

Szolgáltatásgazda konfigurálása

Ha szolgáltatásnevek használatával szeretné konfigurálni az SQL-tárolók hozzáférését egy Azure Data Lake Storage-tárfiókhoz, kövesse az alábbi lépéseket:

  1. Regisztráljon egy Microsoft Entra-azonosítót (korábbi nevén Azure Active Directory-alkalmazást ) és rögzítse a következő tulajdonságokat:

    • Alkalmazás (ügyfél) azonosítója: A Microsoft Entra ID-alkalmazást egyedileg azonosító azonosító azonosító.
    • Címtár-(bérlői) azonosító: Egy azonosító, amely egyedileg azonosítja a Microsoft Entra ID példányt (az Azure Databricksben címtár-(bérlői) azonosítóként hivatkozva).
    • Titkos ügyfélkód: Az alkalmazásregisztrációhoz létrehozott ügyfélkód értéke. Az alkalmazás ezt a titkos sztringet használja személyazonosságának igazolására.
  2. A tárfiókban adjon hozzá egy szerepkör-hozzárendelést az előző lépésben regisztrált alkalmazáshoz, hogy hozzáférést biztosítson a tárfiókhoz.

  3. Hozzon létre egy Azure Key Vault-alapú vagy Databricks-hatókörű titkos hatókört, olvassa el a Titkos kulcs hatóköreinek kezelése című témakört, és rögzítse a hatókörnév tulajdonság értékét:

    • Hatókör neve: A létrehozott titkos hatókör neve.
  4. Ha az Azure Key Vaultot használja, hozzon létre egy titkos kulcsot az Azure Key Vaultban az Érték mezőben található ügyfélkód használatával. Jegyezze fel a választott titkos nevet.

    • Titkos kód neve: A létrehozott Azure Key Vault-titkos kód neve.
  5. Ha Databricks-alapú hatókört használ, hozzon létre egy új titkos kulcsot a Databricks parancssori felületével, és használja az 1. lépésben beszerzett ügyféltitkot. Jegyezze fel az ebben a lépésben megadott titkos kulcsot.

    • Titkos kulcs: A létrehozott Databricks által támogatott titkos kód kulcsa.

    Feljegyzés

    Az 1. lépésben beszerzett ügyfélazonosító tárolásához létrehozhat egy további titkos kulcsot is.

  6. Kattintson a felhasználónevére a munkaterület felső sávjában, és válassza a Beállítások lehetőséget a legördülő menüből.

  7. Kattintson a Számítás fülre.

  8. Kattintson a Kezelés gombra az SQL-raktárak mellett.

  9. Az Adatelérési konfiguráció mezőben kattintson a Szolgáltatásnév hozzáadása gombra.

  10. Konfigurálja az Azure Data Lake Storage-tárfiók tulajdonságait.

  11. Kattintson a Hozzáadás gombra.

    ADLS2 tárfiók

    Látni fogja, hogy új bejegyzések lettek hozzáadva az Adatelérési konfiguráció szövegmezőhöz.

  12. Kattintson a Mentés gombra.

Az Adatelérési konfiguráció szövegmező bejegyzéseit közvetlenül is szerkesztheti.

Adatelérési tulajdonságok konfigurálása SQL-raktárakhoz

Az adatelérési tulajdonságokkal rendelkező összes raktár konfigurálása:

  1. Kattintson a felhasználónevére a munkaterület felső sávjában, és válassza a Beállítások lehetőséget a legördülő menüből.

  2. Kattintson a Számítás fülre.

  3. Kattintson a Kezelés gombra az SQL-raktárak mellett.

  4. Az Adatelérési konfiguráció szövegmezőben adja meg a metaadattár tulajdonságait tartalmazó kulcs-érték párokat.

    Fontos

    Ha egy Spark-konfigurációs tulajdonságot egy titkos kód értékére szeretne állítani anélkül, hogy a titkos értéket a Sparknak felfedi, állítsa az értéket a következőre {{secrets/<secret-scope>/<secret-name>}}: . Cserélje le <secret-scope> a titkos kulcs hatókörére és <secret-name> a titkos kód nevére. Az értéknek a következővel {{secrets/ kell kezdődnie, és azzal kell végződnie }}. Erről a szintaxisról további információt a Titkos kódok kezelése című témakörben talál.

  5. Kattintson a Mentés gombra.

Az adatelérési tulajdonságokat a Databricks Terraform provider és a databricks_sql_global_config segítségével is konfigurálhatja.

Támogatott tulajdonságok

  • Az előtaggal *végződő bejegyzés esetében az előtagon belüli összes tulajdonság támogatott.

    Például a spark.sql.hive.metastore.* azt jelzi, hogy a spark.sql.hive.metastore.jars és a spark.sql.hive.metastore.version támogatott, valamint minden más tulajdonság, amely a spark.sql.hive.metastore-tal kezdődik.

  • Bizalmas információkat tartalmazó tulajdonságok esetén a bizalmas adatokat titkos kódban tárolhatja, és a tulajdonság értékét a titkos névre állíthatja az alábbi szintaxis használatával: secrets/<secret-scope>/<secret-name>

Az SQL-raktárak esetében a következő tulajdonságok támogatottak:

  • spark.sql.hive.metastore.*

  • spark.sql.warehouse.dir

  • spark.hadoop.datanucleus.*

  • spark.hadoop.fs.*

  • spark.hadoop.hive.*

  • spark.hadoop.javax.jdo.option.*

  • spark.hive.*

A tulajdonságok beállításáról további információt a Külső Hive metaadattárban talál.