共用方式為


Git 與 Databricks 資料夾的整合

Databricks Git 資料夾是 Azure Databricks 中的視覺化 Git 用戶端和 API。 它會整合 Azure Databricks 工作區內的 Git 存放庫,並支援常見的 Git 作業,例如複製存放庫、認可和推送、提取、分支管理,以及認可時差異的視覺比較。

在 Git 資料夾,您可以在筆記本或其他檔案開發程式碼,並使用 Git 進行版本控制、共同作業和 CI/CD,遵循資料科學和工程程式碼開發最佳做法。

注意

Git 資料夾主要是針對撰寫和共同作業工作流程所設計。

您可以用 Databricks Git 資料夾做什麼?

Databricks Git 資料夾藉由與 Git 提供者整合,為數據和 AI 專案提供原始檔控制。

在 Databricks Git 資料夾中,您可以使用 Azure Databricks 工作區中的 Git 功能來:

  • 從遠端 Git 存放庫複製、推送及接收。
  • 建立和管理開發工作的分支,包括合併、重訂基底和解決衝突。
  • 建立筆記本 (包括 IPYNB 筆記本),以及編輯筆記本和其他檔案。
  • 在提交時以視覺化方式比較差異,並解決合併衝突。

如需逐步指示,請參閱在 Databricks Git 資料夾執行 Git 作業 (Repos)

注意

Databricks Git 資料夾也提供一個 API,您可以將它與 CI/CD 管線進行整合。 例如,您可以透過程序設計方式更新工作區 Git 資料夾,使其一律具有最新版本的程式代碼。 如需使用 Databricks Git 資料夾進行程式代碼開發最佳做法的詳細資訊,請參閱 CI/CD 與 Databricks Git 資料夾 (Repos)

如需 Azure Databricks 所支援筆記本類型的詳細資訊,請參閱 匯入和匯出 Databricks 筆記本

支援的 Git 提供者

Azure Databricks Git 資料夾是由整合式 Git 存放庫所支援。 存放庫可由下一節所列的任何雲端和企業 Git 提供者裝載。

注意

「Git 供應商」是什麼?

「Git 供應商」是採用 Git 託管原始檔控制模型的特定 (具名) 服務。 Git 型原始檔控制平台以兩種方式託管:由開發公司託管的雲端服務,或由公司自行在硬體安裝和管理的內部部署服務。 許多 Git 提供者,例如 GitHub、Microsoft、GitLab 和 Atlassian 都提供雲端式 SaaS 和內部部署(有時稱為「自我管理」)Git 服務。

在設定期間選擇 Git 提供者時,您必須瞭解雲端 (SaaS) 與內部部署 Git 提供者之間的差異。 內部部署解決方案通常託管在公司 VPN 後方,可能無法從網際網路存取。 通常,內部部署 Git 提供者的名稱結尾為「伺服器」或「自我管理」,但如果您不確定,請連絡公司系統管理員或檢閱 Git 提供者的檔。

如果您的 Git 供應商是雲端型且未列為支援的供應商,選擇「GitHub」作為供應商可能有效,但不保證。

注意

如果您使用「GitHub」為供應商,而且依舊不確定是使用雲端或內部部署版本,請參閱 GitHub 文件中的關於 GitHub Enterprise 伺服器

Databricks 支援的雲端 Git 提供者

  • GitHub、GitHub AE 和 GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab 和 GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Databricks 支援的本地部署 Git 提供者

  • GitHub Enterprise Server
  • Atlassian BitBucket Server 與資料中心
  • GitLab 自我管理
  • Microsoft Azure DevOps Server:如果 URL 不符合 dev.azure.com/*visualstudio.com/*,工作區管理員必須明確允許列出 Microsoft Azure DevOps Server 的 URL 網域前綴。 如需詳細資訊,請參閱 限制使用允許清單中的URL

如果您要整合無法從因特網存取的內部部署 Git 存放庫,則也必須在公司的 VPN 內安裝 Git 驗證要求的 Proxy。 如需更多詳細資訊,請參閱 為 Azure Databricks Git 資料夾(Repos)設定專用 Git 連線

若要瞭解如何搭配 Git 提供者使用存取權杖,請參閱 設定 Git 認證,& 將遠端存放庫連線至 Azure Databricks

Git 整合的資源

為 Git 與 Azure Databricks 整合使用 Databricks CLI 2.0:

閱讀下列參考文件:

下一步