Mengonfigurasi repositori paket Python default

Penting

Konfigurasi repositori paket Python default untuk Alur Deklaratif Lakeflow Spark sedang dalam fase Pratinjau Umum. Admin ruang kerja dapat mengontrol akses ke fitur ini dari halaman Pratinjau .

Admin ruang kerja dapat mengonfigurasi repositori paket privat atau terautentikasi dalam ruang kerja sebagai konfigurasi pip default untuk notebook, pekerjaan, dan Lakeflow Spark Declarative Pipelines.

Jika ruang kerja dikonfigurasi dengan repositori paket Python default, pengguna di ruang kerja akan dapat menginstal paket dari repositori Python internal tanpa perlu menentukan nilai index-url atau extra-index-url secara eksplisit. Namun, jika nilai-nilai ini ditentukan dalam kode atau di buku catatan, nilai tersebut lebih diutamakan daripada default ruang kerja.

Konfigurasi ini memanfaatkan rahasia Databricks untuk menyimpan dan mengelola URL dan kredensial repositori dengan aman. Admin ruang kerja dapat mengonfigurasi penyiapan menggunakan halaman pengaturan admin ruang kerja atau menggunakan cakupan rahasia yang telah ditentukan sebelumnya dan perintah rahasia Databricks CLI atau REST API.

Menyiapkan dependensi default untuk ruang kerja

Admin ruang kerja dapat menambahkan atau menghapus repositori paket Python default menggunakan halaman pengaturan admin ruang kerja.

  1. Sebagai administrator ruang kerja, masuk ke ruang kerja Databricks.
  2. Klik nama pengguna Anda di bilah atas ruang kerja Databricks dan pilih Pengaturan .
  3. Klik pada tab Komputasi.
  4. Di samping Repositori Paket Default, klik Kelola.
  5. (Opsional) Menambahkan atau menghapus URL indeks, URL indeks tambahan, atau sertifikat SSL kustom.
  6. Klik Simpan untuk menyimpan perubahan.

Nota

Modifikasi atau penghapusan pada rahasia diterapkan secara berbeda tergantung pada jenis beban kerja. Untuk buku catatan dan pekerjaan tanpa server, perubahan diterapkan setelah memasang ulang sumber daya komputasi ke buku catatan atau menjalankan ulang pekerjaan. Untuk notebook dan pekerjaan klasik, perubahan diterapkan setelah sumber daya komputasi dimulai ulang. Untuk Pipeline Deklaratif Lakeflow Spark, perubahan diterapkan ke pelaksanaan pipeline baru.

Penyiapan menggunakan CLI rahasia atau REST API

Untuk mengonfigurasi repositori paket Python default menggunakan CLI atau REST API, buat cakupan rahasia yang telah ditentukan dan konfigurasikan izin akses, lalu tambahkan rahasia repositori paket.

Nama cakupan rahasia yang telah ditentukan sebelumnya

Administrator ruang kerja dapat mengatur URL indeks pip default atau URL indeks tambahan bersama dengan token autentikasi dan rahasia dalam cakupan rahasia yang ditunjuk di bawah kunci yang telah ditentukan sebelumnya:

  • Nama cakupan rahasia: databricks-package-management
  • Kunci rahasia untuk url indeks: pip-index-url
  • Kunci rahasia untuk url indeks ekstra: pip-extra-index-urls
  • Kunci rahasia untuk konten sertifikasi SSL: pip-cert

Buat lingkup rahasia

Cakupan rahasia dapat dibuat menggunakan perintah Databricks CLI secrets atau REST API . Setelah membuat cakupan rahasia, konfigurasikan daftar kontrol akses untuk memberi semua pengguna ruang kerja akses baca. Ini memastikan bahwa repositori tetap aman dan tidak dapat diubah oleh pengguna individu. Cakupan rahasia harus menggunakan nama cakupan rahasia yang sudah ditentukan sebelumnya databricks-package-management.

databricks secrets create-scope databricks-package-management
databricks secrets put-acl databricks-package-management admins MANAGE
databricks secrets put-acl databricks-package-management users READ

Menambahkan rahasia repositori paket Python

Tambahkan detail repositori paket Python menggunakan nama kunci rahasia yang telah ditentukan sebelumnya, dengan ketiga bidang bersifat opsional.

# Add index URL.
databricks secrets put-secret --json '{"scope": "databricks-package-management", "key": "pip-index-url", "string_value":"<index-url-value>"}'

# Add extra index URLs. If you have multiple extra index URLs, separate them using white space.
databricks secrets put-secret --json '{"scope": "databricks-package-management", "key": "pip-extra-index-urls", "string_value":"<extra-index-url-1 extra-index-url-2>"}'

# Add cert content. If you want to pip configure a custom SSL certificate, put the cert file content here.
databricks secrets put-secret --json '{"scope": "databricks-package-management", "key": "pip-cert", "string_value":"<cert-content>"}'

Nota

Jika repositori Anda memerlukan autentikasi, gunakan salah satu format berikut untuk URL indeks:

  • Nama pengguna dan kata sandi: https://<username>:<password>@<index_url>
  • Token: https://<token>@<index_url>

Mengubah atau menghapus rahasia repositori PyPI privat

Untuk mengubah rahasia repositori PyPI, gunakan put-secret perintah . Untuk menghapus rahasia repositori PyPI, gunakan delete-secret seperti yang ditunjukkan di bawah ini:

# delete secret
databricks secrets delete-secret databricks-package-management pip-index-url

databricks secrets delete-secret databricks-package-management pip-extra-index-urls

databricks secrets delete-secret databricks-package-management pip-cert

# delete scope
databricks secrets delete-scope databricks-package-management