Bagikan melalui


Kontrol dan penyebaran sumber buku catatan

Artikel ini menjelaskan cara menggunakan integrasi Git dan alur penyebaran dengan notebook di Microsoft Fabric. Anda mempelajari cara menyambungkan repositori, mengelola kode sumber buku catatan, dan menyebarkan buku catatan di seluruh lingkungan.

Sebelum Anda mulai

  • Sambungkan ruang kerja Anda ke Git sebelum Anda menyelesaikan langkah-langkah kontrol sumber buku catatan. Untuk instruksi penyiapan, lihat Mulai menggunakan integrasi Git.
  • Buat aturan penyebaran notebook pada tahap target (misalnya, Pengujian atau Produksi), bukan pada Pengembangan.
  • Untuk membuat aturan penyebaran, Anda harus menjadi pemilik item.

Integrasi Notebook Git

Notebook Fabric mendukung integrasi Git dengan Azure DevOps untuk kontrol sumber. Anda dapat membuat versi perubahan pada notebook, berkolaborasi dengan menggunakan cabang, dan secara langsung mengelola pembaruan siklus hidup notebook di Fabric.

Saat Anda meng-commit buku catatan beserta dependensi yang terlampir (misalnya, lingkungan), menyinkronkan ke ruang kerja lain akan mempertahankan pengikatan ini. Fabric secara otomatis mengikat notebook ke sumber daya yang sesuai di ruang kerja baru.

Untuk mendukung perilaku ini, Fabric menyimpan pengidentifikasi logis untuk sumber daya terlampir dalam metadata notebook. Akibatnya, diff Git dapat menampilkan pembaruan metadata dari ID fisik ke ID logis.

Catatan

Pembaruan metadata yang terkait dengan ID logis dan pengikatan otomatis dapat muncul dalam tampilan Git diff bahkan ketika kode buku catatan tidak berubah.

Menyiapkan sambungan

Dari pengaturan ruang kerja, siapkan koneksi ke repositori Anda untuk menerapkan dan menyinkronkan perubahan. Untuk instruksi penyiapan, lihat Mulai menggunakan integrasi Git. Setelah Anda menyambungkan, item Anda, termasuk buku catatan, muncul di panel Kontrol sumber .

Cuplikan layar panel kontrol sumber ruang kerja.

Setelah Anda menerapkan instans notebook ke repositori Git, Anda bisa melihat struktur folder notebook di repositori.

Anda sekarang dapat melakukan operasi Git, seperti Membuat permintaan pull.

Representasi notebook pada Git

Teks berikut ini memperlihatkan struktur file untuk item buku catatan di repositori Git:

.
├── Notebook_1.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.py
│   └── notebook-settings.json (Optional)
└── Readme.md
.
├── Notebook_2.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.sql
│   └── notebook-settings.json (Optional)
└── Readme.md

Saat Anda melakukan commit item notebook, Fabric menyimpannya sebagai berkas kode sumber, bukan berkas standar .ipynb. Misalnya, notebook PySpark disimpan sebagai notebook-content.py. Format ini lebih mudah ditinjau dalam tampilan Git diffs.

File sumber menyimpan metadata notebook (termasuk default lakehouse dan lingkungan terlampir), sel markdown, dan sel kode sebagai bagian terpisah. Fabric menggunakan struktur ini untuk merekonstruksi buku catatan saat Anda melakukan sinkron ulang ke ruang kerja.

Output dari sel notebook tidak disertakan saat menyinkronkan ke Git.

Cuplikan layar berikut menunjukkan format sumber di repositori Git:

Cuplikan layar format konten repositori Git notebook.

Catatan

Pertahankan buku catatan dan lingkungan dependennya di ruang kerja yang sama, dan versi item buku catatan dan lingkungan di Git. Fabric melakukan pemetaan hubungan ini saat Anda menyinkronkan data ke ruang kerja baru.

ID lakehouse default tetap berada dalam metadata notebook saat Anda menyinkronkan dari repositori ke ruang kerja Fabric. Jika diperlukan, ikat buku catatan secara manual ke elemen lakehouse baru. Untuk informasi selengkapnya, lihat Integrasi Lakehouse Git.

Pengaturan Notebook Git

Panel pengaturan Git memungkinkan Anda mengontrol bagaimana notebook berinteraksi dengan pengendalian sumber daya, termasuk opsi untuk pengaitan Git dan mengelola file-folder Sumber Daya mana yang disertakan dalam komit.

Catatan

Jangan edit di repositori notebook-settings.json Git untuk mengontrol pengikatan otomatis Git atau sumber daya. Kelola pengaturan ini melalui halaman pengaturan buku catatan sebagai gantinya.

Pengikatan Otomatis Lakehouse di Git

Pengikatan Otomatis Lakehouse memungkinkan Fabric menetapkan lakehouse default yang tepat untuk setiap ruang kerja yang terhubung dengan Git. Ini mengurangi pengikatan ulang manual saat Anda memindahkan buku catatan di seluruh ruang kerja pengembangan, pengujian, dan produksi.

Aktifkan fitur ini dari pengaturan Notebook. Setelah Anda mengaktifkannya, Fabric membuat notebook-settings.json di repositori dan mengelola file ini secara otomatis. Jangan edit file ini secara manual.

Cuplikan layar notebook git-binding.

Catatan

Integrasi Notebook Git mendukung mempertahankan hubungan pengikatan yang berkelanjutan antara notebook dan lakehouse yang terhubung saat menyinkronkan antar ruang kerja. Saat menyinkronkan buku catatan ke ruang kerja lain, Anda dapat memilih apakah buku catatan tersebut mengikat ke lakehouse di ruang kerja sumber atau lakehouse di ruang kerja baru. Untuk notebook yang sudah di-versi di Git, ID fisik lakehouse yang terpasang dalam metadata notebook diganti dengan ID logis. Perubahan ini mungkin muncul dalam tampilan Diff Git.

Dukungan Folder Sumber Daya Notebook di Git

Catatan

Folder Sumber Daya Lingkungan dan integrasi dengan alur penyebaran dan API publik saat ini tidak didukung.

Folder 'Resources' bawaan dapat di-commit ke Git sehingga skrip dan file konfigurasi diberi versi dengan notebook.

Fitur ini bersifat opsional dan nonaktif secara default. Aktifkan dari pengaturan Notebook di bagian Pengaturan Git. Setelah Anda mengaktifkannya, file di folder Sumber Daya akan disertakan dalam commit. Karena penerapan memiliki batas 50 MB , gunakan .gitignore aturan file atau Git untuk mengecualikan file atau folder besar atau sementara.

Cuplikan layar sumber daya notebook dalam konfigurasi git.

Catatan

Hanya .gitignore di dalam folder akar sumber daya bawaan yang berfungsi.

Setelah Anda mengonfigurasi aturan Git dan menerapkan perubahan, Fabric menyimpan aturan di fs-settings.json repositori. Fabric menghasilkan dan mengelola file ini agar konfigurasi repositori tetap konsisten. Kami juga tidak menyarankan untuk mengedit file ini secara langsung di repositori Git.

Cuplikan layar struktur sumber daya notebook dalam konfigurasi git.

Notebook dalam alur penyebaran

Gunakan alur penyebaran untuk mempromosikan perubahan buku catatan di seluruh tahap seperti Pengembangan, Pengujian, dan Produksi. Validasi pembaruan pada tahap sebelumnya sebelum Anda mempromosikannya ke produksi.

Penyebaran notebook mendukung pengikatan otomatis untuk lakehouse default dan lingkungan terlampir saat item dependen berada di ruang kerja yang sama. Selama penyebaran, Fabric dapat mengikat kembali dependensi ini ke item yang sesuai di ruang kerja target. Perubahan metadata dapat muncul dalam tampilan diff.

Jika Anda memerlukan lakehouse default untuk tahap target spesifik, atur aturan penyebaran untuk menggantikan pengikatan otomatis.

UI alur penyebaran baru saat ini digunakan dalam artikel ini. Anda dapat beralih ke UI lama dengan menonaktifkan alur Penyebaran Baru.

Catatan

Masalah yang diketahui: status sel yang dibekukan di notebook tidak dipertahankan selama peluncuran.

Gunakan langkah-langkah berikut untuk menyebarkan buku catatan melalui alur penyebaran.

  1. Buat alur penyebaran, atau buka alur yang sudah ada. Untuk informasi selengkapnya, lihat Mulai menggunakan alur penyebaran.

  2. Tetapkan ruang kerja ke tahap-tahap yang berbeda sesuai dengan sasaran penempatan Anda.

  3. Pilih, tampilkan, dan bandingkan item, termasuk buku catatan, di antara tahapan. Lencana yang disorot menunjukkan jumlah item yang diubah antara tahap sebelumnya dan tahap saat ini.

    Cuplikan layar notebook dalam proses penyebaran.

  4. Pilih Sebarkan untuk mempromosikan buku catatan di seluruh tahap Pengembangan, Pengujian, dan Produksi .

    Cuplikan layar pilih item dan sebarkan.

  5. Di jendela Sebarkan ke tahap ini , tinjau item baru dan yang diubah. Untuk melanjutkan penyebaran meskipun satu atau beberapa item gagal, pilih Lanjutkan penyebaran jika satu atau beberapa item gagal.

    Setelah Anda meninjau dan mengonfirmasi pilihan, pilih Sebarkan.

    Cuplikan layar penyebaran konten pop-up.png.

  6. (Opsional.) Untuk membuat aturan penyebaran, pilih Aturan penyebaran pada item tahap target di alur (misalnya, Pengujian atau Produksi).

    Untuk perilaku dan batasan aturan umum, lihat Membuat aturan penyebaran.

    Cuplikan layar entri aturan penyebaran.

  7. Konfigurasikan aturan lakehouse default untuk setiap penyebaran notebook.

    Aturan ini mengontrol lakehouse mana yang disambungkan oleh notebook pada tahap sasaran setelah penyebaran.

    Di panel Atur aturan penyebaran , pilih petak peta Lakehouse default .

    Gunakan menu dropdown Dari dan Ke untuk memetakan lakehouse default pada tahap asal ke lakehouse default pada tahap tujuan.

    • Sama dengan sumber lakehouse: Pertahankan pengaturan lakehouse default yang sama dengan tahap asal.
    • N/A (tidak ada lakehouse default): Hapus pengaturan lakehouse default di tahap target.
    • Lainnya: Ganti lakehouse default tahap sumber dengan lakehouse yang berbeda pada tahap target.

    Jika Anda memilih Lainnya di menu dropdown Tujuan, berikan detail lakehouse target.

    • Lakehouse ID
    • Nama Lakehouse
    • ID ruang kerja Lakehouse

    Cuplikan layar set default lakehouse.

    Catatan

    ID Lakehouse diperlukan saat Anda mengonfigurasi aturan ini. Anda bisa mendapatkan ID lakehouse dari URL item. Aturan penyebaran lebih diprioritaskan daripada pengikatan otomatis. Jika aturan penyebaran dikonfigurasi, aturan tersebut akan mengambil alih lakehouse yang terikat otomatis.

  8. Pantau status penyebaran dari Riwayat penyebaran.