Cara menggunakan notebook Microsoft Fabric

Notebook Microsoft Fabric adalah item kode utama untuk mengembangkan pekerjaan Apache Spark dan eksperimen pembelajaran mesin. Ini adalah permukaan interaktif berbasis web yang digunakan oleh ilmuwan data dan insinyur data untuk menulis kode yang mendapat manfaat dari visualisasi yang kaya dan teks Markdown. Teknisi data menulis kode untuk penyerapan data, persiapan data, dan transformasi data. Ilmuwan data juga menggunakan notebook untuk membangun solusi pembelajaran mesin, termasuk membuat eksperimen dan model, pelacakan model, dan penyebaran.

Dengan notebook Fabric, Anda dapat:

  • Mulai dengan upaya penyiapan nol.
  • Jelajahi dan proses data dengan mudah dengan pengalaman kode rendah yang intuitif.
  • Menjaga keamanan data dengan fitur keamanan bawaan perusahaan.
  • Menganalisis data di seluruh format mentah (CSV, txt, JSON, dll.), format file yang diproses (parquet, Delta Lake, dll.), menggunakan kemampuan Spark yang kuat.
  • Menjadi produktif dengan kemampuan penulisan dan visualisasi data bawaan yang ditingkatkan.

Artikel ini menjelaskan cara menggunakan notebook dalam ilmu data dan pengalaman rekayasa data.

Membuat buku catatan

Anda bisa membuat buku catatan baru atau mengimpor buku catatan yang sudah ada.

Buat notebook baru

Seperti proses pembuatan item Fabric standar lainnya, Anda dapat dengan mudah membuat notebook baru dari beranda Fabric Rekayasa Data, ruang kerja Opsi baru, atau Create Hub.

Mengimpor buku catatan yang sudah ada

Anda dapat mengimpor satu atau beberapa buku catatan yang sudah ada dari komputer lokal Anda ke ruang kerja Fabric dari Rekayasa Data atau beranda Ilmu Data. Notebook Fabric mengenali file .ipynb Jupyter Notebook standar, dan file sumber seperti .py, .scala, dan .sql, dan membuat item notebook baru yang sesuai.

Cuplikan layar memperlihatkan tempat menemukan opsi buku catatan di menu Baru.

Mengekspor buku catatan

Anda bisa mengekspor buku catatan Anda ke format standar lainnya. Notebook Synapse dapat diekspor ke dalam:

  • File notebook standar (.ipynb) yang digunakan untuk notebook Jupyter.
  • File HTML (.html) yang dapat dibuka dari browser secara langsung.
  • File Python (.py).
  • File Lateks (.tex).

Cuplikan layar memperlihatkan tempat untuk mengekspor buku catatan.

Menyimpan buku catatan

Di Fabric, notebook akan disimpan secara default secara otomatis setelah Anda membuka dan mengeditnya; Anda tidak perlu khawatir kehilangan perubahan kode. Anda juga dapat menggunakan Simpan salinan untuk mengkloning salinan lain di ruang kerja saat ini atau ke ruang kerja lain.

Cuplikan layar memperlihatkan tempat menyimpan salinan.

Jika Anda lebih suka menyimpan buku catatan secara manual, Anda bisa beralih ke opsi Simpan manual untuk memiliki cabang lokal item buku catatan Anda, lalu gunakan Simpan atau CTRL+s untuk menyimpan perubahan Anda.

Cuplikan layar memperlihatkan tempat untuk beralih penyimpanan manual.

Anda juga dapat beralih ke mode simpan manual dengan memilih Edit opsi ->Simpan ->Manual. Untuk mengaktifkan cabang lokal buku catatan Anda lalu simpan secara manual, pilih Simpan atau gunakan pintasan keyboard Ctrl+s.

Koneksi lakehouse dan notebook

Notebook Fabric sekarang mendukung interaksi dekat dengan lakehouse; Anda dapat dengan mudah menambahkan lakehouse baru atau yang sudah ada dari penjelajah Lakehouse.

Anda dapat menavigasi ke berbagai lakehouse di penjelajah Lakehouse dan menetapkan satu lakehouse sebagai default dengan menyematkannya. Default Anda kemudian dipasang ke direktori kerja runtime, dan Anda dapat membaca atau menulis ke lakehouse default menggunakan jalur lokal.

Cuplikan layar memperlihatkan tempat menyematkan lakehouse default.

Catatan

Anda harus memulai ulang sesi setelah menyematkan lakehouse baru atau mengganti nama lakehouse default.

Menambahkan atau menghapus lakehouse

Memilih ikon X di samping nama lakehouse akan menghapusnya dari tab buku catatan, tetapi item lakehouse masih ada di ruang kerja.

Pilih Tambahkan lakehouse untuk menambahkan lebih banyak lakehouse ke buku catatan, baik dengan menambahkan yang sudah ada atau membuat lakehouse baru.

Menjelajahi file lakehouse

Subfolder dan file di bawah bagian Tabel dan File dari tampilan Lake muncul di area konten antara daftar lakehouse dan konten buku catatan. Pilih folder yang berbeda di bagian Tabel dan File untuk menyegarkan area konten.

Operasi folder dan file

Jika Anda memilih file (.csv, .parquet, .txt, .jpg, .png, dll.) dengan klik kanan mouse, Anda dapat menggunakan Spark atau Pandas API untuk memuat data. Sel kode baru dihasilkan dan disisipkan di bawah sel fokus.

Anda dapat dengan mudah menyalin jalur dengan format yang berbeda dari file atau folder tertentu dan menggunakan jalur yang sesuai dalam kode Anda.

Cuplikan layar memperlihatkan menu konteks file di lakehouse.

Sumber daya buku catatan

Penjelajah sumber daya notebook menyediakan sistem file seperti Unix untuk membantu Anda mengelola folder dan file Anda. Ini menawarkan ruang sistem file yang dapat ditulis di mana Anda dapat menyimpan file berukuran kecil, seperti modul kode, model semantik, dan gambar. Anda dapat dengan mudah mengaksesnya dengan kode di notebook seolah-olah Anda bekerja dengan sistem file lokal Anda.

GIF animasi sumber daya notebook.

Folder bawaan ini adalah folder sistem yang telah ditentukan sebelumnya untuk setiap instans notebook. Ini mempertahankan penyimpanan hingga 500MB untuk menyimpan dependensi notebook saat ini. Ini adalah kemampuan utama sumber daya notebook:

  • Anda dapat menggunakan operasi umum seperti membuat/menghapus, mengunggah/mengunduh, menyeret/menghilangkan, mengganti nama, menduplikasi, dan mencari melalui UI.
  • Anda dapat menggunakan jalur relatif seperti builtin/YourData.txt untuk eksplorasi cepat. Metode ini mssparkutils.nbResPath membantu Anda menyusun jalur lengkap.
  • Anda dapat dengan mudah memindahkan data yang divalidasi ke lakehouse melalui opsi Tulis ke lakehouse . Fabric telah menyematkan cuplikan kode kaya untuk jenis file umum untuk membantu Anda memulai dengan cepat.
  • Sumber daya ini juga tersedia untuk digunakan dalam kasus eksekusi buku catatan referensi melalui mssparkutils.notebook.run().

Catatan

  • Saat ini, Fabric mendukung pengunggahan jenis file tertentu melalui UI, termasuk, .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg, dan file .xlsx . Anda dapat menulis ke folder bawaan dengan jenis file yang tidak ada dalam daftar melalui kode, namun, notebook Fabric tidak mendukung pembuatan cuplikan kode pada jenis file yang tidak didukung.
  • Setiap ukuran file harus kurang dari 50MB, dan folder bawaan memungkinkan hingga 100 instans file/folder secara total.
  • Saat menggunakan mssparkutils.notebook.run(), gunakan mssparkutils.nbResPath perintah untuk mengakses sumber daya notebook target. Jalur relatif "bawaan/" akan selalu menunjuk ke folder bawaan buku catatan akar.

Berkolaborasi dalam buku catatan

Notebook Fabric adalah item kolaboratif yang mendukung beberapa pengguna mengedit notebook yang sama.

Saat Anda membuka buku catatan, Anda memasukkan mode pengeditan bersama secara default, dan setiap pengeditan buku catatan disimpan secara otomatis. Jika kolega Anda membuka buku catatan yang sama secara bersamaan, Anda akan melihat profilnya, menjalankan output, indikator kursor, indikator pilihan, dan mengedit jejak. Dengan menggunakan fitur kolaborasi, Anda dapat dengan mudah menyelesaikan pemrograman pasangan, penelusuran kesalahan jarak jauh, dan skenario bimbingan belajar.

Cuplikan layar memperlihatkan sel kode dengan pengeditan pengguna lain.

Berbagi notebook

Berbagi buku catatan adalah cara mudah bagi Anda untuk berkolaborasi dengan anggota tim. Peran ruang kerja yang diotorisasi dapat menampilkan atau mengedit/menjalankan buku catatan secara default. Anda bisa berbagi buku catatan dengan izin tertentu yang diberikan.

  1. Pilih Bagikan pada toolbar buku catatan.

    Cuplikan layar memperlihatkan tempat untuk memilih Bagikan.

  2. Pilih kategori orang yang sesuai yang bisa menampilkan buku catatan ini. Anda bisa memilih Bagikan, Edit, atau Jalankan izin untuk penerima.

    Cuplikan layar memperlihatkan tempat untuk memilih izin.

  3. Setelah Anda memilih Terapkan, Anda bisa mengirim buku catatan secara langsung atau menyalin tautan ke orang lain. Penerima kemudian dapat membuka buku catatan dengan tampilan terkait yang diberikan oleh tingkat izin mereka.

    Cuplikan layar memperlihatkan tempat untuk membuat dan mengirim tautan.

  4. Untuk mengelola izin buku catatan Anda lebih lanjut, pilih Daftar>item Ruang Kerja Opsi lainnya, lalu pilih Kelola izin. Dari layar tersebut, Anda bisa memperbarui akses dan izin buku catatan yang sudah ada.

    Cuplikan layar memperlihatkan tempat mengelola izin di ruang kerja.

Mengomentari sel kode

Mengomentari adalah fitur berguna lainnya untuk skenario kolaboratif. Saat ini, Fabric mendukung penambahan komentar tingkat sel.

  1. Pilih tombol Komentar pada toolbar buku catatan atau indikator komentar sel untuk membuka panel Komentar .

    Cuplikan layar memperlihatkan tempat untuk memilih Komentar.

  2. Pilih kode di sel kode, pilih Baru di panel Komentar , tambahkan komentar, lalu pilih Posting komentar untuk disimpan.

    Cuplikan layar memperlihatkan tempat untuk memilih Baru.

  3. Jika Anda membutuhkannya, temukan opsi Edit komentar, Atasi utas, dan Hapus utas dengan memilih opsi Lainnya di samping komentar Anda.

Menandai orang lain dalam komentar

"Penandaan" mengacu pada menyebutkan dan memberi tahu pengguna dalam utas komentar, meningkatkan kolaborasi secara efisien pada spesifikasi.

  1. Pilih bagian kode dalam sel dan utas komentar baru.

  2. Masukkan nama pengguna dan pilih nama yang benar di daftar saran jika Anda ingin menyebutkan seseorang untuk diskusi tentang bagian tertentu.

  3. Bagikan wawasan Anda dan Posting .

  4. Pemberitahuan Email akan dipicu, dan pengguna mengklik tautan Buka Komentar untuk menemukan sel ini dengan cepat.

  5. Selain itu, otorisasi dan konfigurasikan izin untuk pengguna saat menandai seseorang yang tidak memiliki akses, memastikan bahwa aset kode Anda dikelola dengan baik.

GIF animasi memberi tag pada orang lain dalam komentar.

Catatan

Untuk item komentar, pengguna yang ditandai tidak akan menerima pemberitahuan Email lagi jika Anda memperbarui komentar dalam waktu satu jam. Tetapi akan mengirim pemberitahuan Email ke pengguna baru yang ditandai.

Beralih mode buku catatan

Notebook Fabric mendukung dua mode yang dapat Anda alihkan dengan mudah antara: Mode pengeditan dan Mode tampilan .

Cuplikan layar memperlihatkan di mana mode pengalihan.

  • Mode pengeditan: Anda bisa mengedit dan menjalankan sel dan berkolaborasi dengan orang lain di buku catatan.
  • Mode tampilan: Anda hanya bisa menampilkan konten sel, output, dan komentar buku catatan. Semua operasi yang membuat perubahan pada buku catatan dinonaktifkan.