Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Gunakan tugas buku catatan untuk menyebarkan buku catatan Databricks.
Mengonfigurasi tugas buku catatan
Sebelum memulai, Anda harus memiliki buku catatan Anda di lokasi yang dapat diakses oleh pengguna yang mengonfigurasi pekerjaan.
Catatan
UI pekerjaan menampilkan opsi secara dinamis berdasarkan pengaturan lain yang dikonfigurasi.
Untuk memulai alur mengonfigurasi tugas Notebook:
- Navigasi ke tab Tugas di antarmuka pengguna Pekerjaan.
- Klik Tambahkan tugas.
- Masukkan nama ke dalam bidang Nama tugas .
- Di dalam menu drop-down tipe , pilih
Notebook.
Mengonfigurasi sumber
Di menu drop-down Source, pilih lokasi untuk skrip Python menggunakan salah satu opsi berikut.
Ruang kerja
Gunakan Ruang Kerja untuk mengonfigurasi buku catatan yang disimpan di ruang kerja dengan menyelesaikan langkah-langkah berikut:
- Klik kolom Jalur. Dialog Pilih Buku Catatan muncul.
- Telusuri ke buku catatan, klik untuk menyoroti file, dan klik Konfirmasi.
Catatan
Anda bisa menggunakan opsi ini untuk mengonfigurasi tugas untuk buku catatan yang disimpan di folder Databricks Git. Databricks merekomendasikan penggunaan opsi penyedia Git dan repositori Git jarak jauh untuk pengaturan versi aset yang dijadwalkan dengan pekerjaan.
Penyedia Git
Gunakan penyedia Git untuk mengonfigurasi notebook di repositori Git jarak jauh.
Opsi yang ditampilkan oleh UI bergantung pada apakah Anda telah mengonfigurasi penyedia Git di tempat lain atau belum. Hanya satu repositori Git jarak jauh yang dapat digunakan untuk semua tugas dalam pekerjaan. Lihat Penggunaan Git dengan Tugas Lakeflow.
Penting
Notebook yang dibuat oleh Pekerjaan Lakeflow yang berjalan dari repositori Git jarak jauh bersifat sementara dan tidak dapat diandalkan untuk melacak eksekusi, eksperimen, atau model MLflow. Saat membuat notebook dari sebuah pekerjaan, gunakan eksperimen MLflow di ruang kerja (alih-alih eksperimen MLflow di notebook) dan panggil dalam notebook ruang kerja sebelum menjalankan kode pelacakan MLflow apa pun. Untuk detail selengkapnya, lihat Mencegah kehilangan data dalam eksperimen MLflow.
Bidang Jalur muncul setelah Anda mengonfigurasi referensi git.
Masukkan jalur relatif untuk buku catatan Anda, seperti etl/bronze/ingest.py.
Penting
Saat Anda memasukkan jalur relatif, jangan mulai dengan / atau ./. Misalnya, jika jalur absolut untuk buku catatan yang ingin Anda akses adalah
Mengonfigurasi pustaka komputasi dan pustaka yang bergantung
- Gunakan Komputasi untuk memilih atau mengonfigurasi kluster yang mendukung logika di buku catatan Anda.
- Jika Anda menggunakan
Serverlesscompute, instal pustaka langsung di dalam notebook dengan menggunakan panel Lingkungan atau%pip install. Lihat Mengonfigurasi lingkungan tanpa server. - Untuk semua konfigurasi komputasi lainnya, klik + Tambahkan di bawah Pustaka Dependen. Jendela dialog Tambahkan Pustaka Dependen muncul.
- Anda dapat memilih pustaka yang sudah ada atau mengunggah pustaka baru.
- Anda hanya dapat menggunakan pustaka yang disimpan di lokasi yang didukung oleh konfigurasi komputasi Anda. Lihat dukungan pustaka Python.
- Setiap Sumber Pustaka memiliki alur yang berbeda untuk memilih atau mengunggah pustaka. Lihat Menginstal pustaka.
Menyelesaikan konfigurasi pekerjaan
- (Opsional) Konfigurasikan parameter sebagai pasangan kunci-nilai yang dapat diakses di buku catatan menggunakan
dbutils.widgets. Lihat Mengonfigurasi parameter tugas. - Klik Simpan tugas.
Batasan
Total output sel notebook (output gabungan dari semua sel buku catatan) tunduk pada batas ukuran 30MB. Selain itu, output sel individual tunduk pada batas ukuran 8MB. Jika total output sel melebihi ukuran 30MB, atau jika output sel individual lebih besar dari 8MB, eksekusi dibatalkan dan ditandai sebagai gagal.
Jika Anda memerlukan bantuan untuk menemukan sel di dekat atau di luar batas, jalankan notebook terhadap kluster tujuan umum dan gunakan teknik penyimpanan otomatis notebook ini.