Bagikan melalui


Pustaka ruang kerja (warisan)

Penting

Dokumentasi ini telah dihentikan dan mungkin tidak diperbarui. Produk, layanan, atau teknologi yang disebutkan dalam konten ini tidak lagi didukung. Lihat Pustaka kluster.

Catatan

Pustaka ruang kerja tidak digunakan lagi dan tidak boleh digunakan. Namun, menyimpan pustaka karena file ruang kerja berbeda dari pustaka ruang kerja dan masih didukung sepenuhnya. Anda dapat menginstal pustaka yang disimpan sebagai file ruang kerja langsung ke tugas komputasi atau pekerjaan.

Pustaka ruang kerja berfungsi sebagai repositori lokal tempat Anda membuat pustaka yang diinstal kluster. Pustaka ruang kerja mungkin merupakan kode kustom yang dibuat oleh organisasi Anda, atau mungkin merupakan versi tertentu dari pustaka sumber terbuka yang telah distandardisasi oleh organisasi Anda.

Anda harus memasang pustaka ruang kerja di kluster sebelum dapat digunakan di buku catatan atau pekerjaan. Lihat Menginstal pustaka ruang kerja ke kluster.

Pustaka ruang kerja di folder Bersama tersedia untuk semua pengguna di ruang kerja, sementara pustaka ruang kerja di folder pengguna hanya tersedia untuk pengguna tersebut.

Penting

Pustaka dapat diinstal dari DBFS saat menggunakan Databricks Runtime 14.3 LTS dan di bawahnya. Namun, setiap pengguna ruang kerja dapat memodifikasi file pustaka yang disimpan di DBFS. Untuk meningkatkan keamanan pustaka di ruang kerja Azure Databricks, menyimpan file pustaka di akar DBFS tidak digunakan lagi dan dinonaktifkan secara default di Databricks Runtime 15.1 ke atas. Lihat Menyimpan pustaka di akar DBFS tidak digunakan lagi dan dinonaktifkan secara default.

Sebagai gantinya, Databricks merekomendasikan untuk mengunggah semua pustaka, termasuk pustaka Python, file JAR, dan konektor Spark, ke file ruang kerja atau volume Katalog Unity, atau menggunakan repositori paket pustaka. Jika beban kerja Anda tidak mendukung pola ini, Anda juga dapat menggunakan pustaka yang disimpan di penyimpanan objek cloud.

Bagaimana pustaka ruang kerja berbeda dari pustaka yang disimpan dengan file ruang kerja?

Istilah "pustaka ruang kerja" mengacu pada pustaka apa pun yang terdaftar ke ruang kerja. Pustaka ruang kerja muncul bersama buku catatan dan file ruang kerja dan mengikuti aturan ACL untuk direktori yang berisinya.

Istilah "file ruang kerja" mengacu pada file arbitrer apa pun yang disimpan di ruang kerja. Anda dapat menyimpan paket Python .whl sebagai file ruang kerja lalu mendaftarkannya sebagai pustaka ruang kerja. Lihat Apa itu file ruang kerja?.

Anda dapat mengunggah pustaka sebagai file ruang kerja. Lihat Penggunaan dasar file ruang kerja.

Meskipun Anda dapat mengunggah banyak jenis file ke file ruang kerja, hanya file Python .whl yang dapat diinstal menggunakan file ruang kerja. Lihat Pustaka cakupan kluster.

Di Databricks Runtime 13.3 LTS ke atas, Anda dapat menggunakan %pip untuk menginstal file roda Python yang disimpan sebagai file ruang kerja. Lihat Menginstal paket yang disimpan sebagai file ruang kerja dengan %pip.

Membuat pustaka ruang kerja

Peringatan

Fungsionalitas ini tidak lagi tersedia. Lihat Pembuatan dan penginstalan pustaka ruang kerja tidak lagi tersedia.

  1. Klik kanan folder ruang kerja saat ini tempat Anda ingin menyimpan pustaka.
  2. Pilih Buat > Pustaka. Dialog Buat Pustaka muncul.
  3. Pilih Sumber Pustaka dan ikuti prosedur yang sesuai:

Mengunggah file Jar, telur Python, atau roda Python

Catatan

Menginstal file telur Python tidak digunakan lagi dan akan dihapus dalam rilis Databricks Runtime di masa mendatang.

Penting

Pustaka dapat diinstal dari DBFS saat menggunakan Databricks Runtime 14.3 LTS dan di bawahnya. Namun, setiap pengguna ruang kerja dapat memodifikasi file pustaka yang disimpan di DBFS. Untuk meningkatkan keamanan pustaka di ruang kerja Azure Databricks, menyimpan file pustaka di akar DBFS tidak digunakan lagi dan dinonaktifkan secara default di Databricks Runtime 15.1 ke atas. Lihat Menyimpan pustaka di akar DBFS tidak digunakan lagi dan dinonaktifkan secara default.

Sebagai gantinya, Databricks merekomendasikan untuk mengunggah semua pustaka, termasuk pustaka Python, file JAR, dan konektor Spark, ke file ruang kerja atau volume Katalog Unity, atau menggunakan repositori paket pustaka. Jika beban kerja Anda tidak mendukung pola ini, Anda juga dapat menggunakan pustaka yang disimpan di penyimpanan objek cloud.

  1. Dalam daftar tombol Sumber Pustaka, pilih Unggah.
  2. Pilih Jar, Python Egg, atau Python Whl.
  3. Secara opsional masukkan nama pustaka.
  4. Seret Jar, Telur, atau Whl Anda ke kotak jatuh atau klik kotak jatuh dan navigasikan ke file. File diunggah ke dbfs:/FileStore/jars.
  5. Klik Buat. Layar status pustaka ditampilkan.

Mereferensikan file JAR, telur Python, atau roda Python yang diunggah

Anda dapat membuat pustaka ruang kerja baru dengan merujuk file JAR, telur Python, atau roda Python yang disimpan di akar DBFS, pada penyimpanan objek, atau dengan file ruang kerja. Mengikuti alur kerja ini mendaftarkan penunjuk ke pustaka tanpa mengunggah atau memindahkan file.

Dengan Databricks Runtime 13.2 ke atas, Anda juga dapat mereferensikan volume di Unity Catalog. Kemampuan ini ada di Pratinjau Umum.

Untuk mode akses bersama, Anda harus menambahkan JAR ke allowlist. Lihat Izinkan pustaka dan skrip init pada komputasi bersama.

  1. Pilih Jalur file/ADLS di daftar tombol Sumber Pustaka.
  2. Pilih Jar, Python Egg, atau Python Whl.
  3. Secara opsional masukkan nama pustaka.
  4. Tentukan jalur ke pustaka, seperti contoh berikut:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Klik Buat. Layar status pustaka ditampilkan.

Untuk informasi selengkapnya tentang bekerja dengan pustaka di penyimpanan objek, lihat Menginstal pustaka dari penyimpanan objek.

Untuk informasi selengkapnya tentang file ruang kerja, lihat Bekerja dengan file di Azure Databricks.

Menginstal pustaka ruang kerja ke kluster

Catatan

Azure Databricks memproses semua pustaka ruang kerja dalam urutan pemasangannya pada kluster. Anda mungkin perlu memperhatikan urutan penginstalan pada kluster jika ada dependensi antar pustaka.

Penting

Pustaka dapat diinstal dari DBFS saat menggunakan Databricks Runtime 14.3 LTS dan di bawahnya. Namun, setiap pengguna ruang kerja dapat memodifikasi file pustaka yang disimpan di DBFS. Untuk meningkatkan keamanan pustaka di ruang kerja Azure Databricks, menyimpan file pustaka di akar DBFS tidak digunakan lagi dan dinonaktifkan secara default di Databricks Runtime 15.1 ke atas. Lihat Menyimpan pustaka di akar DBFS tidak digunakan lagi dan dinonaktifkan secara default.

Sebagai gantinya, Databricks merekomendasikan untuk mengunggah semua pustaka, termasuk pustaka Python, file JAR, dan konektor Spark, ke file ruang kerja atau volume Katalog Unity, atau menggunakan repositori paket pustaka. Jika beban kerja Anda tidak mendukung pola ini, Anda juga dapat menggunakan pustaka yang disimpan di penyimpanan objek cloud.

Dalam mode akses pengguna tunggal, identitas prinsipal yang ditetapkan (pengguna atau perwakilan layanan) digunakan. Dalam mode akses bersama, pustaka menggunakan identitas pengguna yang menginstal pustaka. Mode akses bersama tanpa isolasi tidak mendukung volume, tetapi menggunakan penetapan identitas yang sama dengan mode akses bersama.

Untuk melihat semua opsi untuk menginstal pustaka pada kluster, lihat Pustaka kluster.

Untuk memasang pustaka yang sudah ada di ruang kerja, Anda bisa mulai dari UI kluster atau UI pustaka:

Kluster

  1. Di bar samping, klik Komputasiikon komputasi.
  2. Klik nama kluster.
  3. Klik tab Pustaka.
  4. Klik Instal Baru.
  5. Di daftar tombol Sumber Pustaka, pilih Pustaka Ruang Kerja.
  6. Pilih pustaka ruang kerja.
  7. Klik Pasang.

Pustaka

  1. Buka folder yang berisi pustaka.
  2. Klik nama pustaka.
  3. Pilih kotak centang di samping kluster tempat Anda ingin memasang pustaka dan klik Pasang. Hanya kluster yang berjalan yang muncul dalam daftar.

Menampilkan detail pustaka ruang kerja

Catatan

Folder ruang kerja memberikan kemudahan untuk menemukan pustaka ruang kerja dan mengelola ACL.

  1. Buka folder ruang kerja yang berisi pustaka.
  2. Klik nama pustaka.

Halaman detail pustaka menampilkan kluster yang sedang berjalan dan status penginstalan pustaka. Jika pustaka dipasang, halaman berisi tautan ke host paket. Jika pustaka diunggah, halaman akan menampilkan tautan ke file paket yang diunggah.

Memindahkan pustaka ruang kerja

Catatan

Folder ruang kerja memberikan kemudahan untuk menemukan pustaka ruang kerja dan mengelola ACL. Memindahkan pustaka ruang kerja tidak memindahkan file, tetapi dapat mengubah pengguna mana yang memiliki akses ke pustaka ruang kerja.

  1. Buka folder ruang kerja yang berisi pustaka.
  2. Klik kanan nama pustaka dan pilih Pindahkan. Browser folder ditampilkan.
  3. Klik folder tujuan.
  4. Klik Pindahkan.

Menghapus tampilan ruang kerja

Penting

Sebelum menghapus pustaka ruang kerja, Anda harus menghapus penginstalan dari semua kluster.

Untuk menghapus ruang kerja:

  1. Pindahkan pustaka ke folder Sampah.
  2. Hapus pustaka secara permanen di folder Sampah atau kosongkan folder Sampah.