Databricks Repos와 Git 통합

Databricks Repos는 Databricks의 시각적 Git 클라이언트입니다. 커밋할 때 리포지토리 복제, 커밋 및 푸시, 끌어오기, 분기 관리 및 차이의 시각적 비교와 같은 일반적인 Git 작업을 지원합니다.

Repos 내에서 Notebook 또는 다른 파일에서 코드를 개발하고 버전 제어, 협업 및 CI/CD에 Git을 사용하여 데이터 과학 및 엔지니어링 코드 개발 모범 사례를 따를 수 있습니다.

Databricks Repos로 무엇을 할 수 있나요?

Databricks Repos는 Git 공급자와 통합하여 데이터 및 AI 프로젝트에 대한 소스 제어를 제공합니다.

Databricks Repos에서 Git 기능을 사용하여 다음을 수행할 수 있습니다.

  • 원격 Git 리포지토리를 복제, 푸시 및 끌어옵니다.
  • 개발 작업을 위한 분기를 만들고 관리합니다.
  • Notebook을 만들고 Notebook 및 기타 파일을 편집합니다.
  • 커밋 시 차이점을 시각적으로 비교합니다.

단계별 지침은 Git 리포지토리 & 복제 다른 일반적인 Git 작업을 참조하세요. Databricks Repos에는 CI/CD 파이프라인과 통합할 수 있는 API도 있습니다. 예를 들어 Databricks 리포지토리를 프로그래밍 방식으로 업데이트하여 항상 최신 버전의 코드를 사용할 수 있습니다. Databricks Repos를 사용한 코드 개발 모범 사례에 대한 자세한 내용은 Git 통합 및 Databricks Repos를 사용하는 CI/CD 워크플로를 참조하세요.

다음 작업의 경우 Git 공급자에서 작업합니다.

  • 끌어오기 요청 만듭니다.
  • 병합 충돌을 해결합니다.
  • 분기를 병합하거나 삭제합니다.
  • 분기를 다시 지정합니다.

지원되는 Git 공급자

Azure Databricks는 다음 Git 공급자를 지원합니다.

  • GitHub 및 GitHub AE
  • Bitbucket Cloud
  • GitLab
  • Azure DevOps

Azure Databricks에 원격 리포지토리를 연결하는 Git 액세스 토큰 & 가져오기를 참조하세요.

Databricks Repos는 서버에 인터넷에 액세스할 수 있는 경우 Bitbucket Server, GitHub Enterprise Server 및 GitLab 자체 관리형 통합도 지원합니다. 인터넷에 액세스할 수 없는 프라이빗 Git 서버 인스턴스와 통합하려면 Databricks 담당자에게 문의하세요.

Databricks Repos 임의 파일은 Databricks Runtime 8.4 이상에서 지원됩니다. 작업 영역 파일이란?을 참조하세요.

다음 단계

Databricks Repos 설정