Integrace Gitu se složkami Databricks Git

Složky Git Databricks jsou vizuálním klientem Gitu a rozhraním API v Azure Databricks. Podporuje běžné operace Gitu, jako je klonování úložiště, potvrzení a nasdílení změn, vyžádání, správa větví a vizuální porovnání rozdílů při potvrzení.

Ve složkách Gitu můžete vyvíjet kód v poznámkových blocích nebo jiných souborech a dodržovat osvědčené postupy vývoje kódu pro datové vědy a inženýrství pomocí Gitu pro správu verzí, spolupráci a CI/CD.

Důležité

Služba Databricks nahradila funkci Repos integrovanou funkcí složky Git v pracovních prostorech Databricks. Další podrobnosti o této změně najdete v tématu Co se stalo s Úložištěm Databricks?

Tato funkce je ve verzi Public Preview ve všech oblastech.

Poznámka:

Složky Gitu (Úložiště) jsou primárně určené pro vytváření pracovních postupů a pracovních postupů pro spolupráci.

Informace o migraci ze starší verze integrace Gitu najdete v tématu Migrace do složek Git (dříve Repos) ze starší verze Gitu.

Co můžete dělat se složkami Databricks Git?

Složky Gitu databricks poskytují správu zdrojového kódu pro data a projekty AI integrací s poskytovateli Gitu.

Ve složkách Git Databricks můžete pomocí funkcí Gitu:

  • Naklonujte, nasdílíte a načtete je ze vzdáleného úložiště Git.
  • Vytvářejte a spravujte větve pro vývojovou práci, včetně slučování, opětovného vytváření a řešení konfliktů.
  • Vytvářejte poznámkové bloky (včetně poznámkových bloků IPYNB) a upravte je a další soubory.
  • Vizuálně porovnejte rozdíly při potvrzení a vyřešte konflikty při sloučení.

Podrobné pokyny najdete v tématu Spouštění operací Gitu ve složkách Databricks Git (Repos).

Poznámka:

Složky Gitu databricks mají také rozhraní API , které můžete integrovat s kanálem CI/CD. Úložiště Databricks můžete například aktualizovat prostřednictvím kódu programu tak, aby vždy mělo nejnovější verzi kódu. Informace o osvědčených postupech pro vývoj kódu pomocí složek Git Databricks najdete v technikách CI/CD se složkami Git a Databricks Git (Repos).

Informace o typech poznámkových bloků podporovaných v Azure Databricks najdete v tématu Export a import poznámkových bloků Databricks.

Podporovaní poskytovatelé Gitu

Složky Gitu Databricks jsou podporovány integrovaným úložištěm Git. Úložiště může hostovat kterýkoli z poskytovatelů cloudu a podnikových gitů uvedených v následující části.

Poznámka:

Co je poskytovatel Gitu?

Zprostředkovatel Gitu je konkrétní (pojmenovaná) služba, která hostuje model správy zdrojového kódu na základě Gitu. Platformy správy zdrojového kódu založené na Gitu se hostují dvěma způsoby: jako cloudová služba hostovaná vývojovou společností nebo jako místní služba nainstalovaná a spravovaná vaší společností na vlastním hardwaru. Mnoho poskytovatelů Gitu, jako je GitHub, Microsoft, GitLab a Atlassian, poskytuje cloudové služby SaaS i místní služby (někdy označované jako "samoobslužné") služby Git.

Při výběru poskytovatele Gitu během konfigurace musíte znát rozdíly mezi cloudovými (SaaS) a místními poskytovateli Gitu. Místní řešení jsou obvykle hostovaná za podnikovou sítí VPN a nemusí být přístupná z internetu. Místní poskytovatelé Gitu mají obvykle název končící na Server nebo Samoobslužná správa, ale pokud si nejste jistí, obraťte se na správce společnosti nebo si projděte dokumentaci poskytovatele Gitu.

Pokud je váš poskytovatel Gitu cloudový a není uvedený jako podporovaný poskytovatel, vyberte GitHub, protože váš poskytovatel může fungovat, ale není zaručený.

Poznámka:

Pokud jako poskytovatele používáte GitHub a stále si nejste jistí, jestli používáte cloudovou nebo místní verzi, přečtěte si téma o GitHub Enterprise Serveru v dokumentaci GitHubu.

Poskytovatelé Cloud Gitu podporovaní službou Databricks

  • GitHub, GitHub AE a GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab a GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Místní poskytovatelé Gitu podporovaní službou Databricks

  • Server GitHub Enterprise
  • Atlassian BitBucket Server a datové centrum
  • Samoobslužná správa GitLabu
  • Microsoft Azure DevOps Server: Správce pracovního prostoru musí explicitně povolit předpony domény adresy URL pro váš Microsoft Azure DevOps Server, pokud se adresa URL neshoduje dev.azure.com/* nebo visualstudio.com/*. Další podrobnosti najdete v tématu Omezení využití adres URL v seznamu povolených adres URL.

Pokud integrujete místní úložiště Git, které není přístupné z internetu, musí být v síti VPN vaší společnosti nainstalovaný také proxy server pro žádosti o ověření Gitu. Další podrobnosti najdete v tématu Nastavení privátního připojení Gitu pro složky Git Databricks (Repos).

Informace o používání přístupových tokenů u poskytovatele Gitu najdete v tématu Konfigurace přihlašovacích údajů Gitu a připojení vzdáleného úložiště k Azure Databricks.

Prostředky pro integraci Gitu

Použití Databricks CLI 2.0 pro integraci Gitu s Azure Databricks:

Přečtěte si následující referenční dokumentaci:

Další kroky