Mengimpor dan mengekspor buku catatan Databricks

Halaman ini menjelaskan cara mengimpor dan mengekspor buku catatan dalam Azure Databricks dan format buku catatan yang didukung Azure Databricks.

Format buku catatan yang didukung

Databricks dapat mengimpor dan mengekspor buku catatan dalam format berikut:

  • File sumber: File yang hanya berisi pernyataan kode sumber dengan ekstensi .scala, .py, .sql atau .r.
  • HTML: Buku catatan Azure Databricks dengan ekstensi .html.
  • Arsip Databricks .dbc.
  • Buku catatan IPython: Buku Catatan Jupyter dengan ekstensi .ipynb.
  • RMarkdown: Dokumen R Markdown dengan ekstensi .Rmd.

Mengimpor buku catatan

Anda dapat mengimpor buku catatan eksternal dari URL atau file. Anda juga dapat mengimpor arsip ZIP notebook ekspor secara massal dari ruang kerja Azure Databricks.

  1. Klik ikon Buku Catatan.Ruang kerja di bar samping. Lakukan salah satu hal berikut ini:
    • Klik kanan pada folder dan pilih Impor.
    • Untuk mengimpor buku catatan di tingkat atas folder ruang kerja saat ini, klik menu kebab di kanan atas dan pilih Impor.
  2. Tentukan URL atau telusuri ke file yang berisi format eksternal yang didukung atau arsip ZIP buku catatan yang diekspor dari ruang kerja Azure Databricks.
  3. Klik Impor.
    • Jika Anda memilih satu buku catatan, buku catatan tersebut diekspor di folder saat ini.
    • Jika Anda memilih arsip DBC atau ZIP, struktur foldernya dibuat ulang di folder saat ini dan setiap buku catatan akan diimpor.

Mengonversi file ke buku catatan

Aset di ruang kerja diidentifikasi sebagai buku catatan jika memiliki .ipynb ekstensi, atau berisi string Databricks notebook source dalam komentar di baris pertama dan memiliki salah satu ekstensi berikut: .py, , .r.scala, .sql. Setiap tulis atau ganti nama buku catatan atau file yang mengubah kondisi ini, juga mengubah jenis buku catatan atau file. Misalnya, jika Anda memiliki file myfile.txt yang memiliki # Databricks notebook source sebagai baris pertama, mengganti nama file tersebut untuk myfile.py menutupinya menjadi buku catatan.

Catatan

Mengonversi antara jenis file dan buku catatan bisa memiliki hasil yang tidak terduga, karena notebook memiliki IPYNB atau format sumber tertentu. Lihat format Notebook.

Untuk mengonversi skrip Python, SQL, Scala, dan R menjadi buku catatan sel tunggal, tambahkan komentar ke sel pertama file:

Python

# Databricks notebook source

SQL

-- Databricks notebook source

Scala

// Databricks notebook source

R

# Databricks notebook source

Untuk menentukan sel dalam skrip, gunakan komentar khusus yang ditunjukkan di bawah ini. Saat Anda mengimpor skrip ke Databricks, sel dibuat sebagaimana ditandai oleh garis COMMAND.

Python

# COMMAND ----------

SQL

-- COMMAND ----------

Scala

// COMMAND ----------

R

# COMMAND ----------

Mengekspor buku catatan

Catatan

Saat Anda mengekspor buku catatan sebagai HTML, buku catatan IPython (.ipynb), atau arsip (DBC), dan Anda belum menghapus output perintah, output disertakan dalam ekspor.

Untuk mengekspor buku catatan:

  1. Dengan buku catatan terbuka, klik File di toolbar buku catatan, lalu klik Ekspor....
  2. Pilih jenis file ekspor dari menu dropdown.
  3. Jika Anda memilih notebook IPython, HTML, atau arsip DBC sebagai jenis file ekspor, Anda dapat memilih untuk menyertakan output sel atau tidak dengan memilih atau menghapus Sertakan output.
  4. Klik Ekspor.

Untuk mengekspor semua buku catatan di folder ruang kerja sebagai arsip ZIP:

  1. Klik ikon Buku Catatan.Ruang kerja di bar samping.

  2. Klik kanan folder dan pilih Unduh sebagai.

  3. Pilih format unduhan:

    • Arsip DBC (hanya buku catatan): Ekspor arsip Databricks, format biner yang menyertakan metadata dan output perintah notebook.
    • Zip - Sumber (buku catatan + file saja): Mengekspor arsip ZIP file sumber buku catatan, yang dapat diimpor ke ruang kerja Azure Databricks, digunakan dalam alur CI/CD, atau ditampilkan sebagai file sumber dalam bahasa default setiap buku catatan. Output perintah notebook tidak disertakan.
    • Zip - HTML (khusus buku catatan): Ekspor arsip ZIP buku catatan dalam format HTML. Setiap file HTML buku catatan dapat diimpor ke ruang kerja Azure Databricks atau ditampilkan sebagai HTML. Output perintah notebook disertakan.