Integrasi Git dengan folder Databricks Git

Folder Databricks Git adalah klien Git visual dan API di Azure Databricks. Ini mendukung operasi Git umum seperti mengkloning repositori, menerapkan dan mendorong, menarik, manajemen cabang, dan perbandingan visual perbedaan saat berkomitmen.

Dalam folder Git Anda dapat mengembangkan kode di notebook atau file lain dan mengikuti praktik terbaik pengembangan kode ilmu data dan rekayasa menggunakan Git untuk kontrol versi, kolaborasi, dan CI/CD.

Penting

Databricks telah mengganti fitur "Repos" dengan fungsionalitas folder Git terintegrasi dalam ruang kerja Databricks. Untuk detail selengkapnya tentang perubahan ini, baca Apa yang terjadi pada Repositori Databricks?

Fitur ini ada di Pratinjau Umum di semua wilayah.

Catatan

Folder Git (Repos) terutama dirancang untuk penulisan dan alur kerja kolaboratif.

Untuk informasi tentang migrasi dari integrasi Git warisan, lihat Migrasi ke folder Git (sebelumnya Repositori) dari Git warisan.

Apa yang dapat Anda lakukan dengan folder Databricks Git?

Folder Databricks Git menyediakan kontrol sumber untuk data dan proyek AI dengan mengintegrasikan dengan penyedia Git.

Di folder Databricks Git, Anda dapat menggunakan fungsionalitas Git untuk:

  • Kloning, dorong ke, dan tarik dari repositori Git jarak jauh.
  • Membuat dan mengelola cabang untuk pekerjaan pengembangan, termasuk menggabungkan, merebasing, dan menyelesaikan konflik.
  • Buat buku catatan (termasuk buku catatan IPYNB) dan edit dan file lainnya.
  • Bandingkan perbedaan secara visual setelah penerapan dan atasi konflik penggabungan.

Untuk instruksi langkah demi langkah, lihat Menjalankan operasi Git pada folder Git Databricks (Repos).

Catatan

Folder Databricks Git juga memiliki API yang dapat Anda integrasikan dengan alur CI/CD Anda. Misalnya, Anda dapat memperbarui repositori Databricks secara terprogram sehingga selalu memiliki versi kode terbaru. Untuk informasi tentang praktik terbaik untuk pengembangan kode menggunakan folder Databricks Git, lihat teknik CI/CD dengan folder Git dan Databricks Git (Repos).

Untuk informasi tentang jenis notebook yang didukung di Azure Databricks, lihat Mengekspor dan mengimpor buku catatan Databricks.

Penyedia Git yang didukung

Folder Git Databricks didukung oleh repositori Git terintegrasi. Repositori dapat dihosting oleh salah satu penyedia Git cloud dan perusahaan yang tercantum di bagian berikut.

Catatan

Apa itu "penyedia Git"?

"Penyedia Git" adalah layanan spesifik (bernama) yang menghosting model kontrol sumber berdasarkan Git. Platform kontrol sumber berbasis Git dihosting dengan dua cara: sebagai layanan cloud yang dihosting oleh perusahaan yang mengembangkan, atau sebagai layanan lokal yang diinstal dan dikelola oleh perusahaan Anda sendiri pada perangkat kerasnya sendiri. Banyak penyedia Git seperti GitHub, Microsoft, GitLab, dan Atlassian menyediakan layanan Git SaaS dan lokal berbasis cloud (terkadang disebut layanan Git "dikelola sendiri").

Saat memilih penyedia Git Anda selama konfigurasi, Anda harus mengetahui perbedaan antara penyedia Cloud (SaaS) dan Git lokal. Solusi lokal biasanya dihosting di belakang VPN perusahaan dan mungkin tidak dapat diakses dari internet. Biasanya, penyedia Git lokal memiliki nama yang berakhiran "Server" atau "Dikelola Sendiri", tetapi jika Anda tidak yakin, hubungi admin perusahaan Anda atau tinjau dokumentasi penyedia Git.

Jika penyedia Git Anda berbasis cloud dan tidak terdaftar sebagai penyedia yang didukung, memilih "GitHub" karena penyedia Anda mungkin berfungsi tetapi tidak dijamin.

Catatan

Jika Anda menggunakan "GitHub" sebagai penyedia dan masih tidak pasti jika Anda menggunakan versi cloud atau lokal, lihat Tentang GitHub Enterprise Server di dokumen GitHub.

Penyedia Cloud Git yang didukung oleh Databricks

  • GitHub, GitHub AE, dan GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab dan GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Penyedia Git lokal yang didukung oleh Databricks

  • GitHub Enterprise Server
  • Server dan Pusat Data BitBucket Atlassian
  • GitLab Dikelola Sendiri
  • Microsoft Azure DevOps Server: Admin ruang kerja harus secara eksplisit mengizinkan awalan domain URL untuk Microsoft Azure DevOps Server Anda jika URL tidak cocok dev.azure.com/* atau visualstudio.com/*. Untuk detail selengkapnya, lihat Membatasi penggunaan ke URL dalam daftar izinkan

Jika Anda mengintegrasikan repositori Git lokal yang tidak dapat diakses dari internet, proksi untuk permintaan autentikasi Git juga harus diinstal dalam VPN perusahaan Anda. Untuk detail selengkapnya, lihat Menyiapkan konektivitas Git privat untuk folder Git Databricks (Repos).

Untuk mempelajari cara menggunakan token akses dengan penyedia Git Anda, lihat Mengonfigurasi kredensial Git & menyambungkan repositori jarak jauh ke Azure Databricks.

Sumber daya untuk integrasi Git

Gunakan Databricks CLI 2.0 untuk integrasi Git dengan Azure Databricks:

Baca dokumen referensi berikut:

Langkah berikutnya