Git-integráció a Databricks Git-mappákhoz
A Databricks Git-mappák egy vizuális Git-ügyfél és API az Azure Databricksben. Támogatja a gyakori Git-műveleteket, például az adattárak klónozását, a véglegesítést és a leküldést, a lekérést, az ágkezelést és a diffek vizuális összehasonlítását a véglegesítés során.
A Git-mappákban kódokat fejleszthet jegyzetfüzetekben vagy más fájlokban, és követheti az adatelemzési és mérnöki kódfejlesztési ajánlott eljárásokat a Git használatával a verziókövetéshez, az együttműködéshez és a CI/CD-hez.
Feljegyzés
A Git-mappákat (Adattárakat) elsősorban szerzői és együttműködési munkafolyamatokhoz tervezték.
Mit tehet a Databricks Git-mappákkal?
A Databricks Git-mappák a Git-szolgáltatókkal való integrációval biztosítják az adatok és AI-projektek forrásvezérlését.
A Databricks Git-mappákban a Git funkcióival a következő funkciókat használhatja:
- Klónozhat, leküldhet és lekérhet egy távoli Git-adattárból.
- Ágak létrehozása és kezelése a fejlesztési munkához, beleértve az egyesítést, az újraegyesítést és az ütközések feloldását.
- Hozzon létre jegyzetfüzeteket (beleértve az IPYNB-jegyzetfüzeteket), és szerkessze őket és más fájlokat.
- Vizuálisan hasonlítsa össze a véglegesítéskor jelentkező különbségeket, és oldja fel az egyesítési ütközéseket.
Részletes útmutatást a Git-műveletek futtatása a Databricks Git-mappákon (Adattárakon) című témakörben talál.
Feljegyzés
A Databricks Git-mappákhoz tartozik egy API is, amelyet integrálhat a CI/CD-folyamattal. Például programozott módon frissíthet egy Databricks-adattárat, hogy mindig a kód legújabb verzióját tartalmazza. A Databricks Git-mappák használatával végzett kódfejlesztés ajánlott eljárásairól a Ci/CD Git- és Databricks Git-mappákkal (Adattárak) foglalkozó témakörben olvashat.
Az Azure Databricksben támogatott jegyzetfüzettípusokról további információt a Databricks-jegyzetfüzetek exportálása és importálása című témakörben talál.
Támogatott Git-szolgáltatók
A Databricks Git-mappákról egy integrált Git-adattár készít biztonsági másolatot. Az adattárat az alábbi szakaszban felsorolt felhő- és vállalati Git-szolgáltatók bármelyike üzemeltetheti.
Feljegyzés
Mi az a Git-szolgáltató?
A "Git-szolgáltató" egy adott (névvel ellátott) szolgáltatás, amely a Giten alapuló forráskövetési modellt üzemelteti. A Git-alapú forrásvezérlési platformok kétféleképpen üzemeltethetők: a fejlődő vállalat által üzemeltetett felhőszolgáltatásként, vagy helyszíni szolgáltatásként, amelyet saját vállalata telepített és felügyel saját hardveren. Számos Git-szolgáltató, például a GitHub, a Microsoft, a GitLab és az Atlassian felhőalapú SaaS- és helyszíni (más néven "ön által felügyelt") Git-szolgáltatásokat is biztosít.
Amikor a Git-szolgáltatót választja a konfiguráció során, tisztában kell lennie a felhő (SaaS) és a helyszíni Git-szolgáltatók közötti különbségekkel. A helyszíni megoldások általában egy vállalati VPN mögött futnak, és előfordulhat, hogy nem érhetők el az internetről. A helyszíni Git-szolgáltatók neve általában "Kiszolgáló" vagy "Ön által felügyelt" végződésű, de ha bizonytalan, forduljon a cég rendszergazdáihoz, vagy tekintse át a Git-szolgáltató dokumentációját.
Ha a Git-szolgáltató felhőalapú, és nem támogatott szolgáltatóként szerepel a listán, a "GitHub" lehetőséget választva a szolgáltató működhet, de nem garantált.
Feljegyzés
Ha a "GitHubot" használja szolgáltatóként, és továbbra sem biztos abban, hogy a felhőt vagy a helyszíni verziót használja-e, olvassa el a GitHub-dokumentációban található GitHub Enterprise Serverről szóló témakört.
A Databricks által támogatott felhőalapú Git-szolgáltatók
- GitHub, GitHub AE és GitHub Enterprise Cloud
- Atlassian BitBucket Cloud
- GitLab és GitLab EE
- Microsoft Azure DevOps (Azure Repos)
A Databricks által támogatott helyszíni Git-szolgáltatók
- GitHub Enterprise Server
- Atlassian BitBucket Server and Data Center
- Saját felügyeletű GitLab
- Microsoft Azure DevOps Server: A munkaterület rendszergazdájának explicit módon engedélyeznie kell a Microsoft Azure DevOps Server URL-tartományelőtagjainak listáját, ha az URL-cím nem egyezik
dev.azure.com/*
vagyvisualstudio.com/*
. További részletekért lásd : A használat korlátozása URL-címekre az engedélyezési listában
Ha olyan helyszíni Git-adattárat integrál, amely nem érhető el az internetről, a Git-hitelesítési kérelmek proxyját is telepítenie kell a vállalat VPN-jén belül. További részletekért lásd: Privát Git-kapcsolat beállítása az Azure Databricks Git-mappákhoz (Adattárak).
Ha tudni szeretné, hogyan használhat hozzáférési jogkivonatokat a Git-szolgáltatóval, tekintse meg a Git hitelesítő adatainak konfigurálását és távoli adattár Azure Databrickshez való csatlakoztatását ismertető témakört.
Erőforrások a Git-integrációhoz
Használja a Databricks CLI 2.0-t az Azure Databricks git-integrációjához:
Olvassa el a következő referencia-dokumentumokat: