Git-integrering med Databricks Repos
Databricks Repos är en visuell Git-klient i Databricks. Den stöder vanliga Git-åtgärder som kloning av en lagringsplats, incheckning och push-överföring, borttagning, grenhantering och visuell jämförelse av diff vid incheckning.
I Lagringsplatser kan du utveckla kod i notebook-filer eller andra filer och följa metodtips för utveckling av datavetenskaps- och teknikkod med git för versionskontroll, samarbete och CI/CD.
Vad kan du göra med Databricks Repos?
Databricks Repos ger källkontroll för data- och AI-projekt genom att integrera med Git-leverantörer.
I Databricks Repos kan du använda Git-funktioner för att:
- Klona, push-överföra till och hämta från en fjärransluten Git-lagringsplats.
- Skapa och hantera grenar för utvecklingsarbete.
- Skapa notebook-filer och redigera notebook-filer och andra filer.
- Jämför skillnader visuellt vid incheckning.
Stegvisa instruktioner finns i Klona en Git-lagringsplats & för andra vanliga Git-åtgärder. Databricks Repos har också ett API som du kan integrera med din CI/CD-pipeline. Du kan till exempel programmässigt uppdatera en Databricks-lagringsplats så att den alltid har den senaste versionen av koden. Information om metodtips för kodutveckling med databricks-lagringsplatser finns i CI/CD-arbetsflöden med Git-integrering och Databricks Repos.
För följande uppgifter ska du arbeta i git-providern:
- Skapa en pull-begäran.
- Lös sammanslagningskonflikter.
- Sammanfoga eller ta bort grenar.
- Ombasering av en gren.
Git-leverantörer som stöds
Azure Databricks stöder följande Git-leverantörer:
- GitHub och GitHub AE
- Bitbucket Cloud
- GitLab
- Azure DevOps
Se Hämta en Git-åtkomsttoken & för att ansluta en fjärransluten lagringsplats till Azure Databricks.
Databricks Repos stöder även Bitbucket Server, GitHub Enterprise Server och självhanterad GitLab-integrering, om servern är tillgänglig via Internet. Om du vill integrera med en privat Git-serverinstans som inte är internettillgänglig kan du kontakta din Databricks-representant.
Stöd för godtyckliga filer i Databricks Repos finns i Databricks Runtime 8.4 och senare. Se Vad är arbetsytefiler?.