Konfigurační profily Azure Databricks

Konfigurační profil Azure Databricks ukládá nastavení ověřování do .databrickscfg souboru. Profily konfigurace usnadňují přepínání mezi různými pracovními prostory, prostředími nebo metodami ověřování beze změny kódu.

Nástroje, sady SDK, skripty a aplikace můžou odkazovat na konfigurační profily pro ověřování pomocí Azure Databricks. Všechny nástroje a sady SDK, které implementují sjednocené ověřování, podporují konfigurační profily.

Co je konfigurační profil?

Konfigurační profil je pojmenovaný oddíl v .databrickscfg souboru, který obsahuje následující:

  • Přihlašovací údaje pro ověřování, jako jsou tokeny nebo primární přihlašovací údaje služby
  • Adresa URL pracovního prostoru nebo účtu Azure Databricks
  • Volitelná nastavení specifická pro vaši metodu ověřování

Vytvořte v jednom .databrickscfg souboru několik profilů pro správu připojení k různým pracovním prostorům nebo prostředím, jako je vývoj, příprava a produkční prostředí.

Vytvoření konfiguračního profilu

Vytvořte konfigurační profil pomocí rozhraní příkazového řádku Databricks nebo ručně upravte .databrickscfg soubor.

Vytvoření profilu pomocí rozhraní příkazového řádku

Nejjednodušší způsob, jak vytvořit konfigurační profil pro interaktivní ověřování uživatelů, je rozhraní příkazového řádku Databricks:

databricks auth login --host <workspace-url>

Rozhraní příkazového řádku otevře webový prohlížeč, aby se dokončil proces ověřování. Po přihlášení uloží rozhraní příkazového řádku přihlašovací údaje jako konfigurační profil.

Ruční vytvoření profilu

Ruční vytvoření konfiguračního profilu:

  1. Vytvořte soubor s názvem .databrickscfg v domovském adresáři:

    • Unix, Linux, macOS:~/.databrickscfg
    • Windows:%USERPROFILE%\.databrickscfg
  2. Přidejte profil s následujícím formátem:

    [<profile-name>]
    <field-name> = <field-value>
    

    Vyměňte zástupné symboly:

    • <profile-name>: Jedinečný název, například DEFAULT, DEVELOPMENTnebo PRODUCTION
    • <field-name> and <field-value>: Pole ověřování pro vaši metodu ověřování

Například pro ověřování M2M (machine-to-machine) OAuth soubor vypadá takto:.databrickscfg

[DEFAULT]
host          = https://<workspace-url>
client_id     = <client-id>
client_secret = <client-secret>

Vytvoření více profilů

Definujte ve stejném .databrickscfg souboru více profilů pro správu různých pracovních prostorů nebo prostředí. Každý profil musí mít jedinečný název.

[DEFAULT]
host          = https://production-workspace-url
client_id     = <production-client-id>
client_secret = <production-client-secret>

[DEVELOPMENT]
host          = https://dev-workspace-url
client_id     = <dev-client-id>
client_secret = <dev-client-secret>

[STAGING]
host          = https://staging-workspace-url
client_id     = <staging-client-id>
client_secret = <staging-client-secret>

Kombinování typů ověřování

Definujte více metod ověřování v samostatných profilech v rámci konfiguračního souboru. To je užitečné, když chcete pro různé pracovní postupy nebo nástroje použít jiné přihlašovací údaje. Můžete například použít nativní cloudové ověřování pro interaktivní použití a přihlašovací údaje OAuth pro automatizaci:

[DEFAULT]
host = https://<workspace-url>

[SERVICE_PRINCIPAL]
azure_workspace_resource_id = /subscriptions/<subscription-id>/resourceGroups/<resource-group>/providers/Microsoft.Databricks/workspaces/<workspace-name>
azure_tenant_id             = <tenant-id>
azure_client_id             = <client-id>
azure_client_secret         = <client-secret>

Další informace o typech ověřování a jejich požadovaných polích najdete v tématu Jednotné ověřování Databricks.

Použití konfiguračního profilu

Po vytvoření konfiguračního profilu na něj v nástrojích a kódu na něj odkazujte. Pokud nezadáte název profilu, nástroje Azure Databricks a sady SDK profil automaticky používají DEFAULT .

Pokud chcete použít jiný profil než DEFAULT, zadejte název profilu:

Pomocí rozhraní příkazového řádku Databricks:

databricks workspace list --profile DEVELOPMENT

S proměnnou prostředí:

export DATABRICKS_CONFIG_PROFILE=DEVELOPMENT
databricks workspace list

S využitím sady Python SDK:

from databricks.sdk import WorkspaceClient

# Specify profile in code
w = WorkspaceClient(profile="DEVELOPMENT")

# Or use environment variable DATABRICKS_CONFIG_PROFILE

Osvědčené postupy

  • Pomocí výchozího profilu pro nejběžnější pracovní prostor minimalizujte potřebu zadat názvy profilů.
  • Používejte popisné názvy profilů, například PRODUCTION, DEVELOPMENTnebo STAGING místo obecných názvů.
  • Chraňte .databrickscfg soubor nastavením omezených oprávnění k souborům (jen pro čtení uživatelem).
  • Necommitujte .databrickscfg do správy verzí. Přidejte ho do .gitignore souboru.
  • Používejte služební principy pro produkční úlohy místo osobních přístupových tokenů.
  • Pravidelně obměňujte přihlašovací údaje a odpovídajícím způsobem aktualizujte profily.

Řešení problémů

Pokud profil nejde najít, ověřte následující:

  • Soubor .databrickscfg je ve vašem domovském adresáři.
  • Použijete přesný název profilu.
  • Soubor nemá název .databrickscfg.txt nebo něco podobného.

Pokud ověřování selže, ověřte následující:

  • Vaše přihlašovací údaje jsou aktuální a nevypršela jeho platnost.
  • Adresa host URL je správná.
  • Máte potřebná oprávnění pro operace, které se snažíte provádět.

Otestujte konfigurační profily pomocí rozhraní příkazového řádku Databricks:

# Inspect a specific profile
databricks auth env --profile DEVELOPMENT

# List all profiles
databricks auth profiles

Další informace najdete v tématu Otestování konfiguračních profilů.

Další informace