Mengelola lingkungan dasar ruang kerja

Halaman ini menjelaskan cara membuat dan mengelola lingkungan dasar ruang kerja di seluruh ruang kerja. Lingkungan dasar ruang kerja memungkinkan admin ruang kerja membuat dan mengelola lingkungan bawaan yang di-cache untuk notebook tanpa server.

Permissions

  • Hanya admin ruang kerja yang dapat membuat dan mengelola lingkungan dasar ruang kerja.
  • Semua pengguna ruang kerja memiliki akses ke lingkungan dasar ruang kerja.
  • Semua pengguna ruang kerja dapat membuat spesifikasi lingkungan tanpa server kustom.

Cara kerja lingkungan dasar ruang kerja di Azure Databricks

Dalam Azure Databricks, lingkungan dasar adalah spesifikasi YAML yang dapat dibagikan yang menentukan versi lingkungan serverless dan serangkaian dependensi Python tambahan untuk notebook tanpa server. Admin ruang kerja membuat dan mengelola lingkungan dasar sehingga pengguna dapat dengan cepat memulai dari lingkungan yang konsisten dan di-cache dan secara opsional menambahkan pustaka mereka sendiri.

Menggunakan lingkungan dasar ruang kerja

Pengguna dapat memilih lingkungan dasar ruang kerja dari dropdown Lingkungan dasar di panel sisi Lingkungan . Lingkungan dasar ruang kerja muncul di menu dropdown bersama opsi lain seperti Standar, AI, dan Kustom.

Saat lingkungan dasar ruang kerja dipilih, lingkungan cache bawaan dimuat dengan cepat, mengurangi waktu mulai untuk buku catatan dan pekerjaan. Untuk pekerjaan, menggunakan lingkungan dasar ruang kerja meningkatkan performa karena dependensi sudah di-cache.

Untuk petunjuk tentang mengonfigurasi lingkungan dasar di notebook, lihat Memilih lingkungan dasar. Untuk petunjuk tentang menggunakan lingkungan dasar terkelola dalam pekerjaan, lihat Lingkungan dasar terkelola dalam pekerjaan.

Membuat dan mengekspor spesifikasi lingkungan

Cara paling sederhana untuk membuat spesifikasi YAML yang valid adalah dengan membangun lingkungan di panel sisi Lingkungan dan kemudian menggunakan tombol Ekspor lingkungan untuk mengunduh file YAML.

  1. Buka buku catatan dan sambungkan ke komputasi tanpa server.
  2. Klik tombol LingkunganEnvironment icon. di panel samping buku catatan.
  3. Di bawah Lingkungan dasar, pilih Standar atau gunakan Lainnya untuk memilih versi lingkungan tertentu. Databricks merekomendasikan penggunaan versi lingkungan tanpa server terbaru yang didukung oleh ruang kerja Anda.
  4. Di bidang Dependensi , tambahkan dependensi apa pun yang Anda inginkan untuk dimiliki lingkungan dasar. Klik Tambahkan dependensi setelah Anda memasukkan setiap dependensi. Untuk instruksi selengkapnya tentang menambahkan dependensi, lihat Menambahkan dependensi ke buku catatan.
  5. Klik Terapkan di bagian bawah panel lingkungan untuk memastikan spesifikasi valid.
  6. Klik ikon menu kebab di bagian bawah panel lingkungan lalu klik Ekspor lingkungan.
  7. Beri nama file YAML dan tambahkan ke folder Ruang Kerja atau volume Katalog Unity.

Contoh spesifikasi lingkungan

Contoh YAML berikut didasarkan pada spesifikasi lingkungan proyek MLflow. Ini mendefinisikan lingkungan dasar dengan beberapa dependensi pustaka:

environment_version: '5'
dependencies:
  - --index-url https://pypi.org/simple
  - -r "/Workspace/Shared/requirements.txt"
  - my-library==6.1
  - /Workspace/Shared/Path/To/simplejson-3.19.3-py3-none-any.whl
  - git+https://github.com/databricks/databricks-cli

Menambahkan lingkungan dasar ke ruang kerja Anda

Untuk menambahkan spesifikasi lingkungan sebagai lingkungan dasar ke ruang kerja:

  1. Di ruang kerja, buka Pengaturan.
  2. Di bawah Admin ruang kerja, pilih Komputasi.
  3. Di samping Lingkungan dasar untuk komputasi tanpa server, klik Kelola.
  4. Klik Buat lingkungan baru.
  5. Beri nama lingkungan dasar Anda. Ini adalah nama yang akan dilihat pengguna di menu dropdown Lingkungan dasar .
  6. Pilih file YAML spesifikasi lingkungan menggunakan penjelajah file. Anda dapat menelusuri file ruang kerja atau volume Katalog Unity.
  7. Klik Buat.

Lingkungan dasar akan mulai dibangun. Periksa kolom Status dalam daftar lingkungan dasar. Ini akan berubah menjadi Siap digunakan ketika sudah siap.

Mengembangkan untuk komputasi GPU tanpa server (AI Runtime)

Penting

Fitur ini ada di Beta. Admin ruang kerja dapat mengontrol akses ke fitur ini dari halaman Pratinjau . Lihat Kelola pratinjau Azure Databricks.

Saat membuat lingkungan dasar, Anda dapat secara opsional mengaktifkan kotak centang Bangun untuk Komputasi GPU Tanpa Server untuk mempersiapkan lingkungan bagi beban kerja GPU. Ini membuat versi lingkungan dasar yang kompatibel dengan GPU yang muncul di tab GPU .

Halaman manajemen lingkungan dasar memiliki dua tab:

  • CPU: Mencantumkan lingkungan dasar untuk komputasi tanpa server (beban kerja non-GPU).
  • GPU: Mencantumkan lingkungan dasar untuk Runtime AI. Tab ini juga memperlihatkan baris lingkungan AI yang sesuai dengan lingkungan dasar AI. Untuk informasi selengkapnya, lihat Lingkungan AI Databricks.

Standar Terbaru mengacu pada versi lingkungan dasar standar stabil terbaru yang disediakan oleh Databricks.

Nota

Catatan penggunaan yang terkait dengan membangun dan menyegarkan lingkungan dasar memiliki kolom yang billing_origin_product diatur ke BASE_ENVIRONMENTS. Selain itu, ID lingkungan dasar tertentu diisi di usage_metadata.base_environment_id kolom .

Mengatur lingkungan dasar default ruang kerja

Secara default, notebook tanpa server di ruang kerja tidak menggunakan lingkungan dasar. Admin ruang kerja dapat memilih lingkungan dasar untuk diterapkan ke semua buku catatan baru secara default.

  1. Di ruang kerja, buka Pengaturan.
  2. Di bawah Admin ruang kerja, pilih Komputasi.
  3. Di samping Lingkungan dasar untuk komputasi tanpa server, klik Kelola.
  4. Klik ikon bintang di samping lingkungan dasar untuk mengaturnya sebagai default.

Semua notebook tanpa server baru sekarang akan default ke lingkungan dasar yang dipilih.

Memperbarui lingkungan dasar

Anda mungkin ingin mengedit file lingkungan dasar untuk memperbarui nomor versi atau menambahkan atau menghapus dependensi. Untuk mengubah versi lingkungan atau dependensi, edit file YAML sumber secara langsung.

Dalam daftar lingkungan dasar, klik jalur file YAML lingkungan dasar yang ingin Anda perbarui. Ini membuka file di tab baru. Anda dapat meninjau atau memperbarui konten file di sana. Perubahan disimpan secara otomatis.

Setelah membuat pembaruan pada spesifikasi YAML, Anda harus memperbarui lingkungan dasar agar notebook dan job mengambil pengaturan terbaru.

  1. Di samping lingkungan dasar yang ingin Anda refresh, klik ikon menu kebab ikon menu Kebab. lalu pilih Refresh.
  2. Klik tombol Konfirmasi.

Sesi baru sekarang menggunakan lingkungan dasar yang diperbarui. Sesi buku catatan yang ada harus dimulai ulang untuk mendapatkan pembaruan.

Keterbatasan

Lingkungan dasar memiliki batasan berikut:

  • Lingkungan dasar dalam pekerjaan hanya didukung untuk buku catatan, skrip Python, dan jenis tugas roda Python. Jenis tugas lain tidak didukung. Dukungan untuk lingkungan kerja dasar dalam tugas sedang dalam tahap Beta.
  • Alur Deklaratif Lakeflow Spark tidak mendukung lingkungan dasar.
  • Hanya dependensi Python dalam daftar dependensi yang diinstal saat runtime.
  • Lingkungan tanpa server versi 1 tidak didukung. Gunakan versi 2 atau yang lebih tinggi.
  • Lingkungan dasar tersedia untuk semua pengguna ruang kerja.
  • Ruang kerja dibatasi pada 10 lingkungan dasar.