Bagikan melalui


Integrasi Git untuk folder Git di Databricks

Fitur folder Git pada Databricks adalah klien Git visual dan API di Azure Databricks. Ini mengintegrasikan repositori Git dalam ruang kerja Azure Databricks Anda dan mendukung operasi Git umum seperti mengkloning repositori, komit dan dorong, menarik, manajemen cabang, dan perbandingan visual dari perbedaan saat melakukan commit.

Dalam folder Git Anda dapat mengembangkan kode di notebook atau file lain dan mengikuti praktik terbaik pengembangan kode ilmu data dan rekayasa menggunakan Git untuk kontrol versi, kolaborasi, dan CI/CD.

Catatan

Folder Git terutama dirancang untuk penulisan dan alur kerja kolaboratif.

Apa yang dapat Anda lakukan dengan folder Databricks Git?

Folder Databricks Git menyediakan kontrol sumber untuk data dan proyek AI dengan mengintegrasikan dengan penyedia Git.

Di folder Databricks Git, Anda dapat menggunakan fungsionalitas Git dari ruang kerja Azure Databricks Anda untuk:

  • Kloning, dorong ke, dan tarik dari repositori Git jarak jauh.
  • Membuat dan mengelola cabang untuk pekerjaan pengembangan, termasuk menggabungkan, melakukan rebase, dan menyelesaikan konflik.
  • Buat buku catatan (termasuk buku catatan IPYNB) dan edit dan file lainnya.
  • Bandingkan perbedaan secara visual setelah penerapan dan atasi konflik penggabungan.

Untuk instruksi langkah demi langkah, lihat Menjalankan operasi Git pada folder Git Databricks (Repos).

Catatan

Folder Databricks Git juga memiliki API yang dapat Anda integrasikan dengan alur CI/CD Anda. Misalnya, Anda dapat memperbarui folder Git ruang kerja secara terprogram sehingga selalu memiliki versi kode terbaru. Untuk informasi tentang praktik terbaik untuk pengembangan kode menggunakan folder Databricks Git, lihat CI/CD dengan folder Databricks Git (Repos).

Untuk informasi tentang jenis notebook yang didukung di Azure Databricks, lihat Mengimpor dan mengekspor notebook Databricks.

Penyedia Git yang didukung

Folder-folder Git dalam Azure Databricks didukung oleh repositori Git yang terintegrasi. Repositori dapat dihosting oleh salah satu penyedia Git cloud dan perusahaan yang tercantum di bagian berikut.

Catatan

Apa itu "penyedia Git"?

"Penyedia Git" adalah layanan spesifik (bernama) yang menghosting model kontrol sumber berdasarkan Git. Platform kontrol sumber berbasis Git dihosting dengan dua cara: sebagai layanan cloud yang dihosting oleh perusahaan yang mengembangkan, atau sebagai layanan lokal yang diinstal dan dikelola oleh perusahaan Anda sendiri pada perangkat kerasnya sendiri. Banyak penyedia Git seperti GitHub, Microsoft, GitLab, dan Atlassian menyediakan layanan Git SaaS dan lokal berbasis cloud (terkadang disebut layanan Git "dikelola sendiri").

Saat memilih penyedia Git Anda selama konfigurasi, Anda harus mengetahui perbedaan antara penyedia Cloud (SaaS) dan Git lokal. Solusi lokal biasanya dihosting di belakang VPN perusahaan dan mungkin tidak dapat diakses dari internet. Biasanya, penyedia Git lokal memiliki nama yang berakhiran "Server" atau "Dikelola Sendiri", tetapi jika Anda tidak yakin, hubungi admin perusahaan Anda atau tinjau dokumentasi penyedia Git.

Jika penyedia Git Anda berbasis cloud dan tidak terdaftar sebagai penyedia yang didukung, memilih "GitHub" karena penyedia Anda mungkin berfungsi tetapi tidak dijamin.

Catatan

Jika Anda menggunakan "GitHub" sebagai penyedia dan masih tidak pasti jika Anda menggunakan versi cloud atau lokal, lihat Tentang GitHub Enterprise Server di dokumen GitHub.

Penyedia Cloud Git yang didukung oleh Databricks

  • GitHub, GitHub AE, dan GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab dan GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Penyedia Git lokal yang didukung oleh Databricks

  • GitHub Enterprise Server
  • Server dan Pusat Data BitBucket Atlassian
  • GitLab Dikelola Sendiri
  • Microsoft Azure DevOps Server: Admin ruang kerja harus secara eksplisit memasukkan prefiks domain URL ke dalam daftar izin untuk Microsoft Azure DevOps Server Anda jika URL tidak sesuai dengan dev.azure.com/* atau visualstudio.com/*. Untuk detail selengkapnya, lihat Membatasi penggunaan ke URL dalam daftar yang diizinkan

Jika Anda mengintegrasikan repositori Git lokal yang tidak dapat diakses dari internet, proksi untuk permintaan autentikasi Git juga harus diinstal dalam VPN perusahaan Anda. Untuk detail selengkapnya, lihat Menyiapkan konektivitas Git privat untuk folder Git Azure Databricks (Repos).

Untuk mempelajari cara menggunakan token akses dengan penyedia Git Anda, lihat Mengonfigurasi kredensial Git & menyambungkan repositori jarak jauh ke Azure Databricks.

Sumber daya untuk integrasi Git

Gunakan Databricks CLI 2.0 untuk integrasi Git dengan Azure Databricks:

Baca dokumen referensi berikut:

Langkah berikutnya