共用方式為


Azure Databricks Git 資料夾概念

Azure Databricks Git 資料夾是視覺化 Git 用戶端和 API,可將 Git 存放庫整合到您的工作區內。 使用 Git 資料夾在筆記本和檔案中開發程式碼,同時遵循使用 Git 進行版本控制、協作和 CI/CD 的軟體開發最佳實務。 Git 資料夾支援常見的 Git 操作,例如克隆儲存庫、提交和推送、拉取、分支管理以及提交時視覺化比較差異。

本頁涵蓋:

Git 資料夾功能

Azure Databricks Git 資料夾會藉由與 Git 提供者整合,為資料和 AI 專案提供原始檔控制。

使用 Azure Databricks 工作區中的 Git 功能來:

  • 從遠端 Git 存放庫複製、推送及接收。
  • 建立和管理開發工作的分支,包括合併、重訂基底和解決衝突。
  • 建立筆記本,包括 IPYNB 筆記本,並編輯它們和其他檔案。
  • 在提交時以視覺化方式比較差異,並解決合併衝突。

如需逐步指示,請參閱 在 Databricks Git 資料夾上執行 Git 作業

Git 資料夾 API

Azure Databricks Git 資料夾具有可與您的 CI/CD 管線整合的 API 。 例如,以程式設計方式更新工作區 Git 資料夾,使其一律擁有最新版本的程式碼。 如需使用 Azure Databricks Git 資料夾進行程式碼開發最佳做法的相關資訊,請參閱 使用 Databricks Git 資料夾的 CI/CD

Git 提供者

Git 平台提供商是託管基於 Git 的原始檔控制系統的服務。 這些平台有兩種主要形式:由供應商託管的雲端服務,或您的組織在自己的硬體上安裝和管理的內部部署服務。 許多提供者,包括 GitHub、Microsoft、GitLab 和 Atlassian,都提供雲端 SaaS 和內部部署 (通常稱為「自我管理」) 選項。

Azure Databricks Git 資料夾會使用整合式 Git 存放庫。 下列各節中列出的任何雲端或企業 Git 提供者都可以裝載存放庫。

在設定期間選取 Git 提供者時,請確定您瞭解雲端 (SaaS) 與內部部署系統之間的差異。 組織通常在 VPN 後面託管自我管理的提供者,這可能會使他們無法從公共網路存取。 這些版本的名稱中通常包含「伺服器」或「自我管理」。 如果您不確定您的組織使用哪一個,請查看提供者的文件或詢問您的公司管理員。

如果您的雲端 Git 提供者未出現在支援的提供者清單中,選擇 GitHub 可能會作為後援,但無法保證這樣做。

備註

如果您使用 GitHub 作為提供者,但仍不確定您使用的是雲端版本還是內部部署版本,請參閱 GitHub 文件中的 關於 GitHub Enterprise Server

支援的雲端 Git 提供者

Azure Databricks Git 資料夾會與下列雲端式 Git 提供者整合:

  • GitHub、GitHub Advanced Enterprise 和 GitHub Enterprise Cloud
  • Atlassian Bitbucket 雲端
  • GitLab 和 GitLab 企業版
  • Microsoft Azure DevOps (Azure Repos)

支援的內部部署 Git 提供者

Azure Databricks Git 資料夾會與下列內部部署 Git 提供者整合:

  • GitHub Enterprise 伺服器
  • Atlassian Bitbucket 伺服器和資料中心
  • GitLab 自我管理版
  • Microsoft Azure DevOps Server:如果 URL 不相符dev.azure.com/*visualstudio.com/*,工作區管理員必須明確將 Microsoft Azure DevOps Server 的 URL 網域前置詞列入允許清單。 請參閱 Git URL 允許清單

如果您要整合無法從網際網路存取的內部部署 Git 存放庫,您也必須在公司的 VPN 內安裝 Git 驗證要求的 Proxy。 請參閱 為 Azure Databricks Git 資料夾(Repos)設定私人 Git 連接

若要瞭解如何搭配 Git 提供者使用存取權杖,請參閱 設定 Git 認證,& 將遠端存放庫連線至 Azure Databricks

後續步驟