Sdílet prostřednictvím


Konfigurace přístupu k datům

Důležité

Tyto pokyny platí pro starší vzory přístupu k datům. Databricks doporučuje používat externí umístění katalogu Unity pro přístup k datům. VizPřipojení ke cloudovému úložišti objektů pomocí katalogu Unity.

Tento článek popisuje, jak spravovat vlastnosti přístupu k datům pro SQL Warehouse v pracovním prostoru.

Důležité

Změna těchto nastavení restartuje všechny spuštěné služby SQL Warehouse.

Konfigurace službě principal

Pokud chcete nakonfigurovat přístup pro vaše SQL sklady k účtu úložiště Azure Data Lake Storage pomocí služebních identit, postupujte takto:

  1. Zaregistrujte aplikaci Microsoft Entra ID (dříve Azure Active Directory) a poznamenejte si následující vlastnosti:

    • ID aplikace (klienta): ID, které jednoznačně identifikuje aplikaci Microsoft Entra ID.
    • ID adresáře (tenanta): ID, které jednoznačně identifikuje instanci Microsoft Entra ID (označovanou jako ID adresáře (tenanta) v Azure Databricks.
    • Tajný klíč klienta: Hodnota tajného klíče klienta vytvořeného pro tuto registraci aplikace. Aplikace použije tento tajný řetězec k prokázání své identity.
  2. V účtu úložiště přidejte přiřazení role pro aplikaci zaregistrovanou v předchozím kroku, aby získal přístup k účtu úložiště.

  3. Vytvořte obor tajemství podporovaný službou Azure Key Vault nebo obor tajemství určený pro Databricks, viz Správa oborů tajemství, a poznamenejte si hodnotu vlastnosti názvu oboru.

    • Název prostoru: Název vytvořeného tajného prostoru.
  4. Pokud používáte Azure Key Vault, vytvořte ve službě Azure Key Vault tajný klíč pomocí tajného klíče klienta v poli Hodnota. Příklad najdete v kroku 4: Přidání tajného klíče klienta do služby Azure Key Vault. Poznamenejte si název tajného kódu, který jste zvolili.

    • Název tajného kódu: Název vytvořeného tajného klíče služby Azure Key Vault.
  5. Pokud používáte obor založený na Databricks, vytvořte nový tajný kód pomocí rozhraní příkazového řádku Databricks a použijte ho k uložení tajného klíče klienta, který jste získali v kroku 1. Poznamenejte si tajný klíč, který jste zadali v tomto kroku.

    • Tajný klíč: Klíč vytvořeného tajemství podporovaného Databricks.

    Poznámka:

    Volitelně můžete vytvořit další tajný kód pro uložení ID klienta získaného v kroku 1.

  6. Klikněte na své uživatelské jméno v horním panelu pracovního prostoru a v rozevíracím seznamu vyberte Nastavení.

  7. Klikněte na kartu Výpočty .

  8. Klikněte na Spravovat vedle SQL skladů.

  9. V poli Konfigurace přístupu k datům klikněte na tlačítko Přidat služební účet.

  10. Nakonfigurujte vlastnosti účtu úložiště Azure Data Lake Storage.

  11. Klikněte na tlačítko Přidat.

    Účet úložiště ADLS2

    Uvidíte, že nové položky byly přidány do textového pole Konfigurace přístupu k datům.

  12. Klikněte na Uložit.

Položky textového pole Konfigurace přístupu k datům můžete také upravit přímo.

Konfigurace vlastností přístupu k datům pro sql warehouse

Konfigurace všech skladů s vlastnostmi přístupu k datům:

  1. Klikněte na své uživatelské jméno v horním panelu pracovního prostoru a v rozevíracím seznamu vyberte Nastavení.

  2. Klikněte na kartu Výpočty .

  3. Klikněte na Spravovat vedle SQL skladů.

  4. Do textového pole Konfigurace přístupu k datům zadejte páry klíč-hodnota obsahující vlastnosti metastoru.

    Důležité

    Pokud chcete nastavit vlastnost konfigurace Sparku na hodnotu tajemství bez zveřejnění tajné hodnoty Sparku, nastavte hodnotu na {{secrets/<secret-scope>/<secret-name>}}. Nahradit <secret-scope> tajným oborem a <secret-name> tajným názvem. Hodnota musí začínat {{secrets/ a končit .}} Další informace o této syntaxi najdete v tématu Správa tajných kódů.

  5. Klikněte na Uložit.

Vlastnosti přístupu k datům můžete nakonfigurovat také pomocí zprostředkovatele Databricks Terraform a databricks_sql_global_config.

Podporované vlastnosti

  • U položky, která končí *, jsou podporovány všechny vlastnosti v rámci této předpony.

    Například spark.sql.hive.metastore.* označuje, že obě spark.sql.hive.metastore.jars a spark.sql.hive.metastore.version jsou podporovány, a všechny ostatní vlastnosti, které začínají spark.sql.hive.metastore.

  • U vlastností, jejichž hodnoty obsahují citlivé informace, můžete citlivé informace uložit do tajného kódu a nastavit hodnotu vlastnosti na název tajného kódu pomocí následující syntaxe: secrets/<secret-scope>/<secret-name>

Sql Warehouse podporují následující vlastnosti:

  • spark.sql.hive.metastore.*

  • spark.sql.warehouse.dir

  • spark.hadoop.datanucleus.*

  • spark.hadoop.fs.*

  • spark.hadoop.hive.*

  • spark.hadoop.javax.jdo.option.*

  • spark.hive.*

Další informace o tom, jak nastavit tyto vlastnosti, naleznete v tématu Externí metastore Hive.