Integracja usługi Git z folderami Git usługi Databricks

Foldery Usługi Git usługi Databricks to wizualny klient i interfejs API usługi Git w usłudze Azure Databricks. Obsługuje ona typowe operacje git, takie jak klonowanie repozytorium, zatwierdzanie i wypychanie, ściąganie, zarządzanie gałęziami i wizualne porównywanie różnic podczas zatwierdzania.

W folderach Git można opracowywać kod w notesach lub innych plikach oraz postępować zgodnie z najlepszymi rozwiązaniami dotyczącymi opracowywania kodu nauki o danych i inżynierii przy użyciu usługi Git na potrzeby kontroli wersji, współpracy i ciągłej integracji/ciągłego wdrażania.

Ważne

Usługa Databricks zastąpiła funkcję "Repozytoria" zintegrowaną funkcją folderu Git w obszarach roboczych usługi Databricks. Aby uzyskać więcej informacji na temat tej zmiany, przeczytaj Co się stało z repozytoriami usługi Databricks?

Ta funkcja jest dostępna w publicznej wersji zapoznawczej we wszystkich regionach.

Uwaga

Foldery Git (Repos) są przeznaczone głównie do tworzenia i współpracy przepływów pracy.

Aby uzyskać informacje na temat migracji ze starszej integracji z usługą Git, zobacz Migrowanie do folderów Git (dawniej Repozytoria) ze starszej wersji usługi Git.

Co można zrobić z folderami Git usługi Databricks?

Foldery Git usługi Databricks zapewniają kontrolę źródła dla projektów danych i sztucznej inteligencji dzięki integracji z dostawcami usługi Git.

W folderach Usługi Git usługi Databricks można używać funkcji git do:

  • Klonowanie, wypychanie i ściąganie z zdalnego repozytorium Git.
  • Tworzenie gałęzi i zarządzanie nimi na potrzeby prac programistycznych, w tym scalanie, ponowne łączenie i rozwiązywanie konfliktów.
  • Twórz notesy (w tym notesy IPYNB) i edytuj je i inne pliki.
  • Wizualnie porównuje różnice podczas zatwierdzania i rozwiązywania konfliktów scalania.

Aby uzyskać instrukcje krok po kroku, zobacz Uruchamianie operacji git w folderach Git usługi Databricks (Repos).

Uwaga

Foldery Usługi Git usługi Databricks mają również interfejs API , który można zintegrować z potokiem ciągłej integracji/ciągłego wdrażania. Można na przykład programowo zaktualizować repozytorium usługi Databricks, tak aby zawsze miał najnowszą wersję kodu. Aby uzyskać informacje o najlepszych rozwiązaniach dotyczących tworzenia kodu przy użyciu folderów Git usługi Databricks, zobacz Techniki ciągłej integracji/ciągłego wdrażania z folderami Git i Databricks Git (Repos).

Aby uzyskać informacje na temat rodzajów notesów obsługiwanych w usłudze Azure Databricks, zobacz Eksportowanie i importowanie notesów usługi Databricks.

Obsługiwani dostawcy usługi Git

Foldery Git usługi Databricks są wspierane przez zintegrowane repozytorium Git. Repozytorium może być hostowane przez dowolnego dostawcę usług Git w chmurze i przedsiębiorstwie wymienionych w poniższej sekcji.

Uwaga

Co to jest "dostawca Git"?

"Dostawca Git" to konkretna (nazwana) usługa, która hostuje model kontroli źródła na podstawie usługi Git. Platformy kontroli źródła oparte na usłudze Git są hostowane na dwa sposoby: jako usługa w chmurze hostowana przez firmę dewelopera lub jako usługa lokalna zainstalowana i zarządzana przez własną firmę na własnym sprzęcie. Wielu dostawców usługi Git, takich jak GitHub, Microsoft, GitLab i Atlassian, zapewnia zarówno oparte na chmurze usługi SaaS, jak i lokalne (czasami nazywane "samoobsługowymi") usługami Git.

Podczas wybierania dostawcy usługi Git podczas konfigurowania należy pamiętać o różnicach między dostawcami usług Git (SaaS) i lokalnymi dostawcami usługi Git. Rozwiązania lokalne są zwykle hostowane za firmową siecią VPN i mogą nie być dostępne z Internetu. Zazwyczaj lokalni dostawcy usługi Git mają nazwę kończącą się ciągiem "Serwer" lub "Self-Managed", ale jeśli nie masz pewności, skontaktuj się z administratorami firmy lub przejrzyj dokumentację dostawcy usługi Git.

Jeśli dostawca usługi Git jest oparty na chmurze i nie jest wymieniony jako obsługiwany dostawca, wybranie pozycji "GitHub" może działać, ale nie jest gwarantowane.

Uwaga

Jeśli używasz usługi "GitHub" jako dostawcy i nadal nie masz pewności, czy używasz chmury lub wersji lokalnej, zobacz Informacje o serwerze GitHub Enterprise Server w dokumentacji usługi GitHub.

Dostawcy usługi Git w chmurze obsługiwani przez usługę Databricks

  • GitHub, GitHub AE i GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab i GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Lokalni dostawcy usługi Git obsługiwani przez usługę Databricks

  • Serwer GitHub Enterprise
  • Atlassian BitBucket Server i Centrum danych
  • Samodzielne zarządzanie usługą GitLab
  • Microsoft Azure DevOps Server: Administrator obszaru roboczego musi jawnie dodać prefiksy domeny adresu URL dla serwera Microsoft Azure DevOps Server, jeśli adres URL nie jest zgodny dev.azure.com/* z adresem URL lub visualstudio.com/*. Aby uzyskać więcej informacji, zobacz Ograniczanie użycia do adresów URL na liście dozwolonych

Jeśli integrujesz lokalne repozytorium Git, które nie jest dostępne z Internetu, serwer proxy dla żądań uwierzytelniania Git musi być również zainstalowany w sieci VPN firmy. Aby uzyskać więcej informacji, zobacz Konfigurowanie prywatnej łączności git dla folderów Git usługi Databricks (Repos).

Aby dowiedzieć się, jak używać tokenów dostępu u dostawcy usługi Git, zobacz Konfigurowanie poświadczeń usługi Git i łączenie repozytorium zdalnego z usługą Azure Databricks.

Zasoby na potrzeby integracji z usługą Git

Użyj interfejsu wiersza polecenia usługi Databricks 2.0 na potrzeby integracji usługi Git z usługą Azure Databricks:

Przeczytaj następujące dokumenty referencyjne:

Następne kroki