Bagikan melalui


Kontrol versi Git untuk notebook (warisan)

Penting

Dukungan integrasi Git notebook warisan dihapus pada 31 Januari 2024. Databricks merekomendasikan agar Anda menggunakan folder Databricks Git untuk menyinkronkan pekerjaan Anda di Databricks dengan repositori Git jarak jauh.

Artikel ini menjelaskan cara menyiapkan kontrol versi Git untuk notebook (fitur warisan). Anda juga dapat menggunakan Databricks CLI atau Workspace API untuk mengimpor dan mengekspor notebook dan untuk melakukan operasi Git di lingkungan pengembangan lokal Anda.

Mengaktifkan dan menonaktifkan pembuatan versi Git

Secara default, kontrol versi diaktifkan. Untuk mengalihkan pengaturan ini:

  1. Buka Pengaturan>Pengaturan Ruang Kerja.
  2. Di bagian Tingkat Lanjut , batal pilih tombol Penerapan Versi Git Notebook.

Mengonfigurasi kontrol versi

Untuk mengonfigurasi kontrol versi, buat kredensial akses di penyedia Git Anda, lalu tambahkan kredensial tersebut ke Azure Databricks.

Bekerja dengan versi buku catatan

Anda bekerja dengan versi buku catatan di panel riwayat. Buka panel riwayat dengan mengklik ikon riwayat versi bilah sisi kanan.

Riwayat versi

Catatan

Anda tidak dapat memodifikasi buku catatan saat panel riwayat terbuka.

  1. Klik ikon riwayat versi di bilah samping kanan. Bilah status Git menampilkan Git: Tidak ditautkan.

    Bilah status Git

  2. Klik Git: Tidak tertaut.

    Dialog Preferensi Git tampil. Pertama kali Anda membuka buku catatan Anda, Status adalah Tidak ada tautan, karena buku catatan tidak GitHub.

    Preferensi git - tautkan buku catatan baru

  3. Di bidang Status, klik Link.

  4. Di bidang Link, tempel URL repositori GitHub.

  5. Klik turun-bawah Cabang dan pilih cabang atau ketik nama cabang baru.

  6. Di bidang Jalur di folder Git, tentukan di mana di repositori untuk menyimpan file Anda.

    Notebook Python memiliki ekstensi file default yang disarankan .py. Jika Anda menggunakan .ipynb, buku catatan Anda akan menyimpan dalam format buku catatan iPython. Jika file sudah ada di GitHub, Anda dapat langsung menyalin dan menempelkan URL file.

  7. Pilih Simpan untuk menyelesaikan link notebook Anda. Jika file ini sebelumnya tidak ada, minta dengan opsi Simpan file ini ke repo GitHub Anda akan ditampilkan.

  8. Ketik sebuah pesan dan klik Simpan.

Menyimpan buku catatan untuk GitHub

Meskipun perubahan yang Anda buat pada buku catatan Anda disimpan secara otomatis ke riwayat versi Azure Databricks, perubahan tidak secara otomatis bertahan pada GitHub.

  1. Klik ikon riwayat versi di bilah samping kanan untuk membuka panel riwayat.

    Panel riwayat - simpan sekarang

  2. Klik Simpan Sekarang untuk menyimpan buku catatan Anda ke GitHub. Dialog Simpan Versi Buku Catatan muncul.

  3. Secara opsional, masukkan pesan untuk menjelaskan perubahan Anda.

  4. Pastikan Juga komit ke Git dipilih.

    Simpan versi

  5. Klik Simpan.

Mengembalikan atau memperbarui buku catatan ke versi dari GitHub

Setelah Anda menautkan buku catatan, Azure Databricks menyinkronkan riwayat Anda dengan Git setiap kali Anda membuka kembali panel riwayat. Versi yang disinkronkan ke Git memiliki hash komit sebagai bagian dari entri.

  1. Klik ikon riwayat versi di bilah samping kanan untuk membuka panel riwayat.

    Panel riwayat

  2. Pilih entri di panel riwayat. Azure Databricks menampilkan versi itu.

  3. Klik Pulihkan versi ini.

  4. Klik Konfirmasi untuk mengonfirmasi bahwa Anda ingin memulihkan versi tersebut.

  1. Klik ikon riwayat versi di bilah samping kanan untuk membuka panel riwayat.

  2. Bilah status Git menampilkan Git: Sinkron.

    Panel riwayat - gambar simpan sekarang

  3. Klik Git: Disinkronkan.

    Preferensi git - batalkan tautan buku catatan

  4. Dalam dialog Preferensi Git, klik Batalkan tautan.

  5. Klik Simpan.

  6. Klik Konfirmasi untuk mengonfirmasi bahwa Anda ingin membatalkan tautan notebook dari kontrol versi.

Menggunakan cabang

Anda dapat bekerja di cabang repositori mana pun dan membuat cabang baru di dalam Azure Databricks.

Membuat cabang

  1. Klik ikon riwayat versi di bilah samping kanan untuk membuka panel riwayat.

  2. Klik bilah status Git untuk membuka panel GitHub.

  3. Klik turun-bawah Cabang.

  4. Masukkan nama cabang.

    Buat cabang

  5. Pilih opsi Buat Cabang di bagian bawah turun-bawah. Cabang induk ditunjukkan. Anda selalu bercabang dari cabang yang Anda pilih saat ini.

Membuat permintaan pull

  1. Klik ikon riwayat versi di bilah samping kanan untuk membuka panel riwayat.

  2. Klik bilah status Git untuk membuka panel GitHub.

    Preferensi git - buat permintaan pull

  3. Klik Buat PR. GitHub terbuka ke halaman permintaan tarik untuk cabang.

Menentukan ulang dasar cabang

Anda juga dapat menentukan ulang dasar cabang Anda di dalam Azure Databricks. Tautan Menentukan ulang dasar ditampilkan jika penerapan baru tersedia di cabang induk. Hanya pembentukan dasar ulang di atas cabang default repositori induk yang didukung.

Rebase

Misalnya, asumsikan bahwa Anda sedang mengerjakan databricks/reference-apps. Anda membayarnya ke akun Anda sendiri (misalnya, brkyvz) dan mulai mengerjakan cabang yang disebut my-branch. Jika pembaruan baru ditekan ke databricks:master, maka Rebase tombol ditampilkan, dan Anda akan dapat menarik perubahan ke cabang brkyvz:my-branchAnda.

Rebasing bekerja sedikit berbeda di Azure Databricks. Asumsikan struktur cabang berikut:

Struktur cabang sebelum rebase

Setelah rebase, struktur cabang terlihat seperti:

Struktur cabang setelah rebase

Apa yang berbeda di sini adalah bahwa Commits C5 dan C6 tidak berlaku di atas C4. Mereka muncul sebagai perubahan lokal di buku catatan Anda. Konflik penggabungan muncul sebagai berikut:

Gabungkan konflik

Anda kemudian dapat berkomitmen untuk GitHub sekali lagi menggunakan tombol Simpan Sekarang.

Apa yang terjadi jika seseorang bercabang dari cabang saya yang baru saja saya tentukan ulang dasarnya?

Jika cabang Anda (misalnya, branch-a) adalah basis untuk cabang lain (branch-b), dan Anda menentukan ulang dasar, Anda tidak perlu khawatir! Setelah pengguna juga menentukan ulang dasar branch-b, semuanya akan berhasil. Praktik terbaik dalam situasi ini adalah menggunakan cabang terpisah untuk buku catatan terpisah.

Praktik terbaik untuk tinjauan kode

Azure Databricks mendukung percabangan Git.

  • Anda dapat menautkan buku catatan ke cabang mana pun di repositori. Azure Databricks merekomendasikan penggunaan cabang terpisah untuk setiap buku catatan.
  • Selama pengembangan, Anda dapat menautkan buku catatan ke garpu repositori atau ke cabang non-default di repositori utama. Untuk mengintegrasikan perubahan di hulu, Anda dapat menggunakan tautan Buat PR dalam dialog Preferensi Git di Azure Databricks untuk membuat permintaan tarik GitHub. Tautan Buat PR hanya ditampilkan jika Anda tidak mengerjakan cabang default repositori induk.

Pemecahan Masalah

Jika Anda menerima kesalahan yang terkait menyinkronkan riwayat GitHub, verifikasi hal berikut:

  • Anda hanya dapat menautkan notebook ke repositori Git berinisial yang tidak kosong. Uji URL di browser web.
  • Token akses pribadi GitHub harus aktif.
  • Untuk menggunakan repositori GitHub privat, Anda harus memiliki izin untuk membaca repositori.
  • Jika buku catatan ditautkan ke cabang GitHub yang diganti namanya, perubahan tidak secara otomatis tercermin di Azure Databricks. Anda harus menautkan ulang notebook ke cabang secara manual.

Bermigrasi ke folder Databricks Git

Pengguna yang perlu bermigrasi ke folder Databricks Git dari kontrol versi Git warisan dapat menggunakan panduan berikut: