Megosztás a következőn keresztül:


Git-integráció a Databricks Git-mappákhoz

A Databricks Git-mappák egy vizuális Git-ügyfél és API az Azure Databricksben. Támogatja a gyakori Git-műveleteket, például az adattárak klónozását, a véglegesítést és a leküldést, a lekérést, az ágkezelést és a diffek vizuális összehasonlítását a véglegesítés során.

A Git-mappákban kódokat fejleszthet jegyzetfüzetekben vagy más fájlokban, és követheti az adatelemzési és mérnöki kódfejlesztési ajánlott eljárásokat a Git használatával a verziókövetéshez, az együttműködéshez és a CI/CD-hez.

Feljegyzés

A Git-mappákat (Adattárakat) elsősorban szerzői és együttműködési munkafolyamatokhoz tervezték.

Mit tehet a Databricks Git-mappákkal?

A Databricks Git-mappák a Git-szolgáltatókkal való integrációval biztosítják az adatok és AI-projektek forrásvezérlését.

A Databricks Git-mappákban a Git funkcióival a következő funkciókat használhatja:

  • Klónozhat, leküldhet és lekérhet egy távoli Git-adattárból.
  • Ágak létrehozása és kezelése a fejlesztési munkához, beleértve az egyesítést, az újraegyesítést és az ütközések feloldását.
  • Hozzon létre jegyzetfüzeteket (beleértve az IPYNB-jegyzetfüzeteket), és szerkessze őket és más fájlokat.
  • Vizuálisan hasonlítsa össze a véglegesítéskor jelentkező különbségeket, és oldja fel az egyesítési ütközéseket.

Részletes útmutatást a Git-műveletek futtatása a Databricks Git-mappákon (Adattárakon) című témakörben talál.

Feljegyzés

A Databricks Git-mappákhoz tartozik egy API is, amelyet integrálhat a CI/CD-folyamattal. Például programozott módon frissíthet egy Databricks-adattárat, hogy mindig a kód legújabb verzióját tartalmazza. A Databricks Git-mappák használatával végzett kódfejlesztés ajánlott eljárásairól a Ci/CD Git- és Databricks Git-mappákkal (Adattárak) foglalkozó témakörben olvashat.

Az Azure Databricksben támogatott jegyzetfüzettípusokról további információt a Databricks-jegyzetfüzetek exportálása és importálása című témakörben talál.

Támogatott Git-szolgáltatók

A Databricks Git-mappákról egy integrált Git-adattár készít biztonsági másolatot. Az adattárat az alábbi szakaszban felsorolt felhő- és vállalati Git-szolgáltatók bármelyike üzemeltetheti.

Feljegyzés

Mi az a Git-szolgáltató?

A "Git-szolgáltató" egy adott (névvel ellátott) szolgáltatás, amely a Giten alapuló forráskövetési modellt üzemelteti. A Git-alapú forrásvezérlési platformok kétféleképpen üzemeltethetők: a fejlődő vállalat által üzemeltetett felhőszolgáltatásként, vagy helyszíni szolgáltatásként, amelyet saját vállalata telepített és felügyel saját hardveren. Számos Git-szolgáltató, például a GitHub, a Microsoft, a GitLab és az Atlassian felhőalapú SaaS- és helyszíni (más néven "ön által felügyelt") Git-szolgáltatásokat is biztosít.

Amikor a Git-szolgáltatót választja a konfiguráció során, tisztában kell lennie a felhő (SaaS) és a helyszíni Git-szolgáltatók közötti különbségekkel. A helyszíni megoldások általában egy vállalati VPN mögött futnak, és előfordulhat, hogy nem érhetők el az internetről. A helyszíni Git-szolgáltatók neve általában "Kiszolgáló" vagy "Ön által felügyelt" végződésű, de ha bizonytalan, forduljon a cég rendszergazdáihoz, vagy tekintse át a Git-szolgáltató dokumentációját.

Ha a Git-szolgáltató felhőalapú, és nem támogatott szolgáltatóként szerepel a listán, a "GitHub" lehetőséget választva a szolgáltató működhet, de nem garantált.

Feljegyzés

Ha a "GitHubot" használja szolgáltatóként, és továbbra sem biztos abban, hogy a felhőt vagy a helyszíni verziót használja-e, olvassa el a GitHub-dokumentációban található GitHub Enterprise Serverről szóló témakört.

A Databricks által támogatott felhőalapú Git-szolgáltatók

  • GitHub, GitHub AE és GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab és GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

A Databricks által támogatott helyszíni Git-szolgáltatók

  • GitHub Enterprise Server
  • Atlassian BitBucket Server and Data Center
  • Saját felügyeletű GitLab
  • Microsoft Azure DevOps Server: A munkaterület rendszergazdájának explicit módon engedélyeznie kell a Microsoft Azure DevOps Server URL-tartományelőtagjainak listáját, ha az URL-cím nem egyezik dev.azure.com/* vagy visualstudio.com/*. További részletekért lásd : A használat korlátozása URL-címekre az engedélyezési listában

Ha olyan helyszíni Git-adattárat integrál, amely nem érhető el az internetről, a Git-hitelesítési kérelmek proxyját is telepítenie kell a vállalat VPN-jén belül. További részletekért lásd: Privát Git-kapcsolat beállítása az Azure Databricks Git-mappákhoz (Adattárak).

Ha tudni szeretné, hogyan használhat hozzáférési jogkivonatokat a Git-szolgáltatóval, tekintse meg a Git hitelesítő adatainak konfigurálását és távoli adattár Azure Databrickshez való csatlakoztatását ismertető témakört.

Erőforrások a Git-integrációhoz

Használja a Databricks CLI 2.0-t az Azure Databricks git-integrációjához:

Olvassa el a következő referencia-dokumentumokat:

Következő lépések