Bagikan melalui


Mengelola format buku catatan

Halaman ini menjelaskan format buku catatan default dalam Azure Databricks, cara mengubah format buku catatan Anda, dan cara mengelola penerapan output jika buku catatan Anda berada di folder yang dikontrol sumber.

Secara default, notebook dalam Databricks dibuat dalam format .ipynb (IPython atau Jupyter). Anda juga dapat memilih untuk menggunakan format sumber sebagai gantinya.

Anda masih bisa mengimpor dan mengekspor buku catatan dalam berbagai format. Lihat Mengimpor dan mengekspor buku catatan Databricks.

Format buku catatan

Databricks mendukung pembuatan dan pengeditan notebook dalam dua format: IPYNB (default) dan sumber.

Anda dapat mengelola file sumber, termasuk notebook, menggunakan folder Git . Hanya jenis aset Databricks tertentu yang didukung dalam folder Git. Format ini memengaruhi bagaimana notebook berkomitmen untuk repositori jarak jauh, seperti yang dijelaskan dalam tabel di bawah ini.

Format sumber notebook Deskripsi
sumber Format dasar yang hanya mengambil kode sumber, dengan akhiran yang menandakan bahasa kode, seperti .py, .scala, .r dan .sql.
IPYNB (Jupyter) Format kaya yang menangkap kode sumber, lingkungan notebook, definisi visualisasi, widget notebook, dan output opsional. Notebook IPYNB dapat berisi kode dalam bahasa apa pun yang didukung oleh notebook Databricks (meskipun bagian py dari .ipynb). Dengan menggunakan format IPYNB, Anda dapat secara opsional mengontrol output buku catatan bersama dengan buku catatan.

Format IPYNB juga mendukung pengalaman tampilan yang lebih baik untuk notebook Databricks di repositori Git jarak jauh. Jika Anda menggunakan GitHub atau GitLab, Anda dapat mengaktifkan fitur yang memberikan tampilan perbedaan yang lebih baik dari buku catatan Anda dalam pull request, sehingga lebih mudah untuk melihat dan meninjau perubahan kode pada buku catatan.

Untuk mempelajari selengkapnya tentang dukungan GitHub untuk diff kaya pada notebook IPYNB, lihat Pratinjau Fitur: Diff Kaya pada Jupyter Notebook. Untuk mempelajari selengkapnya tentang dukungan GitLab untuk diff notebook IPYNB, lihat file Jupyter Notebook.

Untuk membedakan notebook format sumber dari file Python, Scala, dan SQL reguler, Azure Databricks menambahkan komentar "Databricks notebook source" ke bagian atas buku catatan Python, Scala, dan SQL. Komentar ini memastikan bahwa Azure Databricks mengurai file dengan benar sebagai buku catatan daripada file skrip.

Mengubah pengaturan format buku catatan default

Buku catatan IPYNB adalah format default saat membuat buku catatan baru di Azure Databricks.

Untuk mengubah default ke format sumber Azure Databricks, masuk ke ruang kerja Azure Databricks Anda, klik profil Anda di kanan atas halaman, lalu klik Settings dan navigasikan ke Developer. Ubah format default buku catatan di bawah judul Pengaturan Editor.

Mengubah format buku catatan default di pengaturan pengembang profil Anda

Mengonversi format buku catatan

Anda bisa mengonversi buku catatan yang sudah ada ke format lain melalui antarmuka pengguna Azure Databricks.

Untuk mengonversi buku catatan yang sudah ada ke format lain:

  1. Buka buku catatan di ruang kerja Anda.

  2. Pilih File dari menu ruang kerja, pilih Format buku catatan, dan pilih format yang Anda inginkan. Anda dapat memilih Jupyter (.ipynb) (Disarankan) atau Sumber (.scala, .py, .sql, .r). Format buku catatan saat ini berwarna abu-abu dan memiliki tanda centang di sampingnya.

    Menu file ruang kerja, diperluas, memperlihatkan opsi format buku catatan.

Untuk informasi selengkapnya tentang jenis notebook yang didukung di Azure Databricks, lihat Mempor dan mengekspor notebook Databricks.

Mengelola penerapan output buku catatan IPYNB

Output adalah hasil menjalankan notebook di platform Databricks, termasuk tampilan tabel dan visualisasi. Untuk notebook IPYNB di folder yang dikontrol sumber, Anda dapat mengelola bagaimana output buku catatan berkomitmen pada repositori jarak jauh.

Izinkan mengkomitmenkan output buku catatan.ipynb

Hasil keluaran hanya dapat dikomitmenkan jika administrator ruang kerja telah mengaktifkan fitur ini. Secara default, pengaturan administratif untuk folder Git tidak mengizinkan output .ipynb notebook diunggah. Jika Anda memiliki hak istimewa administrator untuk ruang kerja, Anda dapat mengubah pengaturan ini:

  1. Buka pengaturan Admin>Pengatelan ruang kerja di konsol administrator Azure Databricks.

  2. Di bawah folder Git, pilih Izinkan folder Git mengekspor output IPYNB lalu pilih Izinkan: output IPYNB dapat diaktifkan.

    Konsol Admin: Memungkinkan folder Git untuk mengekspor output IPYNB.

Penting

Jika output disertakan, maka visualisasi dan konfigurasi dasbor juga akan disertakan dalam buku catatan yang Anda buat.

Mengontrol penerapan artefak output notebook IPYNB

Saat Anda menerapkan file .ipynb, Databricks membuat file konfigurasi yang memungkinkan Anda mengontrol bagaimana Anda menerapkan output: .databricks/commit_outputs.

  1. Jika Anda memiliki file buku catatan tetapi tidak ada file konfigurasi di repositori jarak jauh Anda, buka dialog Status Git .

  2. Dalam dialog pemberitahuan, pilih Buat file konfigurasi commit_outputs.

    Komit Notebook UI: Buat tombol file commit_outputs.

Anda juga dapat membuat file konfigurasi dari menu File . Menu File memiliki kontrol untuk memperbarui file konfigurasi secara otomatis di mana Anda dapat menentukan penyertaan atau pengecualian output untuk notebook IPYNB tertentu.

  1. Di File, pilih Komit keluaran buku catatan.

    editor buku catatan : Menerapkan status dan kontrol output notebook.

  2. Dalam kotak dialog, konfirmasikan pilihan Anda untuk mengonfirmasi hasil buku catatan.

    kotak dialog Terapkan output buku catatan.