Bagikan melalui


Tutorial: Membuat dan menyebarkan bundel di ruang kerja

Untuk membantu Anda mulai menggunakan Bundel Aset Databricks di ruang kerja, tutorial ini membimbing Anda membuat bundel dengan tugas, menyebarkannya, dan menjalankan tugas di bundel - semuanya dilakukan dari ruang kerja.

Untuk persyaratan penggunaan bundel di ruang kerja, lihat Bundel Aset Databricks di persyaratan ruang kerja.

Untuk informasi selengkapnya tentang bundel, lihat Apa itu Bundel Aset Databricks?.

Membuat bundel

Pertama, buat bundel di ruang kerja Databricks:

  1. Navigasikan ke folder Git tempat Anda ingin membuat bundel.

    Petunjuk / Saran

    Jika sebelumnya Anda telah membuka folder Git di editor di ruang kerja, Anda dapat menggunakan menu konteks penulisan browser ruang kerja untuk menavigasi dengan cepat ke folder Git. Lihat Konteks penulisan.

  2. Klik tombol Buat , lalu klik Bundel aset. Atau, klik kanan pada folder Git atau kebab terkait di pohon ruang kerja dan klik Buat>Bundel Aset:

    Membuat bundel aset

  3. Dalam dialog Buat bundel aset , beri nama bundel aset, seperti bundel yang benar-benar mengagumkan. Nama bundel hanya dapat berisi huruf, angka, tanda hubung, dan garis bawah. Pilih Proyek kosong lalu klik Buat dan sebarkan .

    Membuat dialog bundel aset baru

Ini membuat bundel awal di folder Git, yang mencakup .gitignore file konfigurasi Git dan file Bundel databricks.yml Aset Databricks yang diperlukan. File databricks.yml berisi konfigurasi utama untuk bundel. Untuk detailnya, lihat Konfigurasi Bundel Aset Databricks.

Bundel aset baru

Menambahkan buku catatan

Selanjutnya, tambahkan buku catatan ke bundel Anda. Buku catatan dalam contoh berikut mencetak "Halo Dunia!".

  1. Klik petak Tambah buku catatan proyek bundel . Atau, klik ikon kebab untuk bundel dalam daftar isi, lalu klik Buat>Buku Catatan.

  2. Ganti nama buku catatan menjadi helloworld.

  3. Atur bahasa buku catatan ke Python dan tempelkan yang berikut ini ke dalam sel buku catatan:

    print("Hello World!")
    

Menentukan pekerjaan

Sekarang tentukan pekerjaan yang menjalankan notebook.

  1. Klik ikon penyebaran untuk bundel untuk beralih ke panel Penyebaran .

    Ikon panel penerapan

  2. Di bagian Bundel sumber daya , klik Tambahkan, lalu Definisi pekerjaan baru.

    Membuat definisi pekerjaan

  3. Ketik run-notebook ke dalam bidang Nama pekerjaan dari dialog Tambahkan pekerjaan ke bundel yang sudah ada . Klik Tambahkan dan sebarkan.

  4. Dialog Konfirmasi Deploy to dev muncul dengan informasi tentang sumber daya pekerjaan yang akan dibuat di ruang kerja target dev. Klik Sebarkan.

  5. Navigasi kembali ke file bundel dengan mengklik ikon folder di atas ikon penyebaran. Sumber daya run-notebook.job.yml pekerjaan dibuat dengan YAML dasar untuk pekerjaan tersebut dan beberapa contoh tugas pekerjaan YAML tambahan yang dikomentari.

  6. Tambahkan tugas buku catatan ke definisi pekerjaan. Ganti contoh YAML dalam run-notebook.job.yml file dengan yang berikut ini:

    resources:
      jobs:
        run_notebook:
          name: run-notebook
          queue:
            enabled: true
          tasks:
            - task_key: my-notebook-task
              notebook_task:
                notebook_path: ../helloworld.ipynb
    

    YAML konfigurasi tugas buku catatan pekerjaan

Untuk detail tentang menentukan pekerjaan di YAML, lihat pekerjaan. Untuk sintaks YAML untuk jenis tugas pekerjaan lain yang didukung, lihat Menambahkan tugas ke pekerjaan di Bundel Aset Databricks.

Menyebarkan bundel

Selanjutnya, sebarkan bundel dan jalankan pekerjaan yang berisi helloworld tugas buku catatan.

  1. Di panel Penyebaran untuk bundel di bawah Target, klik menu dropdown untuk memilih dev ruang kerja target jika belum dipilih. Ruang kerja target didefinisikan dalam targets pemetaan bundel databricks.yml. Lihat Jenis Penyebaran Bundel Aset Databricks.

    Pilih penyebaran target

  2. Klik tombol Sebarkan . Bundel divalidasi dan detail validasi muncul dalam dialog.

  3. Tinjau detail penyebaran dalam dialog konfirmasi Penyebaran ke dev ini, lalu klik Sebarkan.

    Sebarkan ke dialog dev

    Penting

    Menyebarkan bundel dan menjalankan kode sumber daya bundel dengan hak akses pengguna saat ini. Pastikan Anda mempercayai kode dalam paket, termasuk YAML, yang dapat mengandung pengaturan konfigurasi untuk menjalankan perintah.

Status penyebaran ditampilkan pada jendela output Proyek.

Jalankan pekerjaan

Sumber daya bundel yang disebarkan tercantum di bawah Sumber daya Bundel. Klik ikon putar yang terkait dengan sumber daya tugas untuk menjalankannya.

Mencantumkan sumber daya yang disebarkan

Navigasi ke Jalankan Pekerjaan dari bilah navigasi kiri untuk melihat jalannya bundel. Nama pekerjaan bundel yang dijalankan diawali dengan sebuah awalan, misalnya [dev someone] run-notebook.

Langkah selanjutnya