Sdílet prostřednictvím


Nastavení složek Gitu pro Databricks

Na této stránce se dozvíte, jak nastavit složky Git Databricks pro správu verzí. Po dokončení nastavení proveďte běžné operace Git, jako je klonování, checkout, commit, push, pull a správa větví přímo z uživatelského rozhraní Databricks. Rozdíly ve vašich změnách můžete také zobrazit v průběhu vývoje.

Požadavky

Než začnete, potvrďte následující:

  • Složky Gitu jsou ve vašem pracovním prostoru povolené (ve výchozím nastavení jsou povolené). Viz Povolení nebo zakázání funkce složky Git Databricks.

  • Máte účet poskytovatele Gitu (GitHub, GitLab, Azure DevOps, Bitbucket nebo AWS CodeCommit).

  • Pro privátní úložiště nebo operace zápisu máte osobní přístupový token (PAT) nebo přihlašovací údaje OAuth od svého poskytovatele Gitu. Viz Konfigurovat přihlašovací údaje Git, & připojit vzdálené úložiště k Azure Databricks.

    Poznámka:

    Veřejná vzdálená úložiště můžete klonovat bez přihlašovacích údajů Gitu. Pokud chcete upravit veřejné vzdálené úložiště nebo pracovat s privátními úložišti, nakonfigurujte přihlašovací údaje Gitu s oprávněními k zápisu .

Přidání přihlašovacích údajů Gitu

Konfigurace přihlašovacích údajů Gitu v Databricks:

  1. Klikněte na své uživatelské jméno v horním panelu pracovního prostoru Azure Databricks a vyberte Nastavení.
  2. Klikněte na Propojené účty.
  3. Klikněte na Přidat přihlašovací údaje Gitu.
  4. V rozevírací nabídce vyberte svého poskytovatele Gitu. Někteří poskytovatelé nabízejí propojení účtů OAuth, zatímco jiné vyžadují token PAT (Personal Access Token). Pokud svůj účet propojite pomocí OAuth, dokončete tok ověřování a přeskočte k poslednímu kroku.
  5. Do pole e-mailu poskytovatele Gitu zadejte svůj e-mail .
  6. Vložte váš PAT do pole Token. Pokyny k vytvoření PAT najdete v tématu Konfigurace přihlašovacích údajů Gitu a připojení vzdáleného úložiště k Azure Databricks. Pokud má vaše organizace povolené jednotné přihlašování SAML na GitHubu, povolte váš osobní přístupový token pro jednotné přihlašování.
  7. Klikněte na Uložit.

Přihlašovací údaje Gitu můžete spravovat také pomocí rozhraní DATAbricks Repos API.

Azure DevOps

Integrace Gitu ve výchozím nastavení používá token ID Microsoft Entra, pokud nezadáte token nebo heslo aplikace. Pokud zadáte osobní přístupový token Azure DevOps, použije integrace Gitu místo toho tento token. Viz Připojení k úložišti Azure DevOps pomocí tokenu.

Po aktualizaci hesla Azure se znovu ověřte pomocí Databricks. Jinak může ověření připojení Azure DevOps trvat až 24 hodin.

Pokud nemůžete naklonovat úložiště pomocí Azure DevOps s ověřováním ID Microsoft Entra, přečtěte si téma Problém se zásadami podmíněného přístupu (CAP) pro ID Microsoft Entra.

Více přihlašovacích údajů Gitu na uživatele

Důležité

Tato funkce je ve verzi Public Preview.

Databricks umožňuje každému uživateli ukládat více přihlašovacích údajů Gitu, takže můžete používat různé poskytovatele nebo účty, aniž byste museli přepínat přihlašovací údaje.

Platforma pro zpracování dat Databricks

Výběr přihlašovacích údajů pro složky Gitu

Každá složka Gitu může pro operace Gitu používat konkrétní přihlašovací údaje. Změna přihlašovacích údajů pro složku Git:

  1. Otevřete složku Git a přejděte na kartu Nastavení Gitu .
  2. V části Přihlašovací údaje Gitu vyberte z rozevírací nabídky přihlašovací údaje.
  3. Klikněte na Uložit.

výběr přihlašovacích údajů

Jak fungují výchozí přihlašovací údaje

Každý poskytovatel Gitu podporuje jeden výchozí přihlašovací údaje Gitu pro jednotlivé uživatele. Databricks automaticky používá pro tyto výchozí přihlašovací údaje:

První přihlašovací údaje, které vytvoříte pro zprostředkovatele, se automaticky stanou výchozími. Změna výchozích přihlašovacích údajů:

  1. Přejděte nauživatelské nastavení>propojené účty.
  2. Klikněte na ikonu nabídky kebab. Vedle přihlašovacího údaje, který chcete nastavit jako výchozí.
  3. Vyberte Nastavit jako výchozí.

omezení

  • Úlohy, které pro poskytovatele vyžadují přihlašovací údaje Git jiné než výchozí, musí používat služební hlavní objekt.
  • Servisní principiály můžou mít pouze jeden přihlašovací údaj Gitu.
  • Aplikace Databricks na GitHubu umožňuje pouze jedno propojené přihlašovací údaje.
  • Každý uživatel může mít maximálně 10 přihlašovacích údajů Gitu.

Konfigurace identity commitů v Gitu

Vaše identita potvrzení Gitu určuje, jak se potvrzení provedená z Databricks zobrazují ve vašem poskytovateli Gitu. Při potvrzení prostřednictvím složek Git Databricks vás poskytovatel Gitu musí identifikovat jako autora. Nakonfigurujte svoji e-mailovou adresu tak, aby:

  • Potvrzení se zobrazí v profilu poskytovatele Gitu.
  • Váš profilový obrázek a jméno se zobrazují správně
  • Obdržíte správný kredit za příspěvky.
  • Členové týmu můžou sledovat, kdo provedl každou změnu.

Jak funguje identita potvrzení

Při konfiguraci přihlašovacích údajů Gitu s e-mailovou adresou:

  • E-mail: Stane se e-mailem autora (GIT_AUTHOR_EMAIL a GIT_COMMITTER_EMAIL) pro všechna potvrzení.
  • Uživatelské jméno: Stává se jménem přispěvatele (GIT_AUTHOR_NAME a GIT_COMMITTER_NAME)

Pokud nezadáte e-mailovou adresu, databricks jako e-mail použije vaše uživatelské jméno Gitu. To může zabránit správnému přiřazení commitu ve vašem poskytovateli Git.

Příklad potvrzení v historii Gitu:

commit 480ee5b0214e4d46db2da401a83794c5f5c5d375 (HEAD -> main)
Author: GitHub-username <your.email@example.com>
Date:   Fri Sep 26 00:38:23 2025 -0700

    My commit message

Příklad u poskytovatele Git:

Potvrzení Gitu zobrazující identitu autora s uživatelským jménem a e-mailem

Poznámka:

Pokud jste před dostupností konfigurace e-mailu vytvořili přihlašovací údaje Gitu, vaše pole e-mailu se ve výchozím nastavení nastaví na vaše uživatelské jméno. Aktualizujte e-mailovou adresu na skutečnou, aby bylo možné správně přiřadit potvrzení změn.

Propojené přihlašovací údaje GitHubu

Pokud používáte propojené přihlašovací údaje Gitu prostřednictvím aplikace Databricks GitHub, Databricks automaticky nakonfiguruje vaši e-mailovou adresu a identitu Gitu. Pokud vaše identita není správně nastavená, schvalte požadovaná oprávnění nebo znovu propojte účet GitHubu pro správná oprávnění.

Konfigurace síťového připojení

Složky Gitu vyžadují síťové připojení k vašemu poskytovateli Gitu. Většina konfigurací funguje přes internet bez dalšího nastavení. Pokud ale potřebujete další konfiguraci, pokud máte:

  • Seznamy povolených IP adres u vašeho poskytovatele Gitu
  • Servery Git v místním prostředí (GitHub Enterprise, Bitbucket Server, GitLab – samoobslužná správa)
  • Hostování privátní sítě

Konfigurace seznamů povolených IP adres

Pokud je váš server Git přístupný z internetu, ale používá seznam povolených IP adres, například seznamy povolených adres GitHubu:

  1. Vyhledejte IP adresu NAT řídicí plochy Databricks pro váš region na oblastech Azure Databricks.
  2. Přidejte tuto IP adresu do seznamu povolených IP adres vašeho serveru Git.

Konfigurace privátních serverů Git

Pokud hostujete privátní server Git, přečtěte si téma Nastavení privátního připojení Gitu pro složky Git Azure Databricks (Repos) nebo požádejte o pokyny k nastavení tým účtu Databricks.

Funkce zabezpečení

Složky Gitu pro Databricks zahrnují následující funkce zabezpečení pro ochranu kódu a přihlašovacích údajů:

Šifrování přihlašovacích údajů Gitu

Pomocí služby Azure Key Vault můžete šifrovat tokeny pat Gitu a další přihlašovací údaje Gitu pomocí vlastních šifrovacích klíčů (klíčů spravovaných zákazníkem).

Další informace najdete v tématu Klíče spravované zákazníkem pro šifrování.

Seznam povolených adres URL Gitu

Správci pracovního prostoru můžou omezit, ke kterým vzdáleným úložištím mají uživatelé přístup. To pomáhá zabránit exfiltraci kódu a vynucovat použití schválených úložišť.

Pokud používáte ověřování Microsoft Entra ID s Azure DevOps, výchozí seznam povolených adres URL gitu omezuje na:

  • dev.azure.com
  • visualstudio.com

Pro vlastní CNAME nebo Git URL aliasy nakonfigurujte vlastní seznam povolených a explicitně přidejte tyto adresy URL, abyste s nimi mohli pracovat.

Nastavení seznamu povolených adres URL Gitu

Jak nakonfigurovat seznam povolených:

  1. Klikněte na své uživatelské jméno v horním panelu pracovního prostoru Azure Databricks a vyberte Nastavení.

  2. Klikněte na Vývoj.

  3. Vyberte možnost oprávnění seznamu povolených adres URL Gitu :

    • Zakázáno (bez omezení): Žádné vynucení seznamu povolených.
    • Omezit klonování, potvrzení a odeslání změn do povolených úložišť Git: Omezuje všechny operace pouze na URL, které jsou na povoleném seznamu.
    • Omezit pouze operace Confirm a Push do povolených úložišť Git: Omezují pouze operace zápisu. Klonování a stažení zůstává neomezené.
  4. Klikněte na ikonu Upravit vedleseznamu povolených adres URL Gitu: Prázdný seznam.

  5. Zadejte čárkami oddělený seznam předpon adres URL.

  6. Klikněte na Uložit.

Uložení nového seznamu přepíše existující seznam povolených. Než se změny projeví, může to trvat až 15 minut.

Řízení přístupu

Poznámka:

Řízení přístupu zahrnuje pouze plán Premium .

Nastavením oprávnění můžete určit, kdo má přístup ke složkám Gitu ve vašem pracovním prostoru. Oprávnění platí pro veškerý obsah ve složce Git. Přiřaďte jednu z následujících úrovní oprávnění:

  • NO PERMISSIONS: Žádný přístup ke složce Git
  • CAN READ: Zobrazit pouze soubory
  • CAN RUN: Zobrazení a spuštění souborů
  • CAN EDIT: Zobrazení, spuštění a úprava souborů
  • CAN MANAGE: Úplné řízení včetně sdílení a odstranění

Podrobné informace o oprávněních ke složce Git najdete v tématech ACL složek Gitu.

Protokolování auditu

Když povolíte protokolování auditu, Databricks protokoluje všechny operace se složkami Gitu, včetně:

  • Vytváření, aktualizace nebo odstraňování složek Git
  • Výpis složek Gitu v pracovním prostoru
  • Synchronizace změn mezi složkami Gitu a vzdálenými úložišti

Detekce tajemství

Adresáře Git automaticky prohledávají kód pro odhalené přihlašovací údaje před potvrzením. Upozorní vás, pokud zjistí:

  • ID přístupových klíčů AWS začínající na AKIA
  • Jiné citlivé vzory přihlašovacích údajů

Další kroky

Po nastavení složek Gitu si projděte tato související témata: