Bagikan melalui


Mulai ulang proses Python di Azure Databricks

Anda dapat memulai ulang proses Python secara terprogram di Azure Databricks untuk memastikan bahwa pustaka yang diinstal atau ditingkatkan secara lokal berfungsi dengan benar di kernel Python untuk SparkSession Anda saat ini.

Saat Anda memulai ulang proses Python, Anda kehilangan informasi status Python. Databricks merekomendasikan untuk menginstal semua pustaka cakupan sesi di awal notebook dan berjalan dbutils.library.restartPython() untuk membersihkan proses Python sebelum melanjutkan.

Anda bisa menggunakan proses ini di buku catatan interaktif atau untuk tugas Python yang dijadwalkan dengan alur kerja.

Apa itu dbutils.library.restartPython?

Fungsi pembantu dbutils.library.restartPython() adalah cara yang disarankan untuk memulai ulang proses Python dalam buku catatan Databricks.

Catatan

Sebagian besar fungsi dalam dbutils.library submodul tidak digunakan lagi. Databricks sangat merekomendasikan penggunaan %pip untuk mengelola semua penginstalan pustaka dengan cakupan buku catatan. Lihat Pustaka Python dengan cakupan buku catatan.

Kapan Anda harus memulai ulang proses Python Anda?

Ada baiknya untuk memulai ulang proses Python Anda kapan saja Anda melakukan penginstalan lokal yang mencakup salah satu hal berikut:

  • Menentukan versi paket yang disertakan dalam Databricks Runtime.
  • Menginstal versi kustom paket yang disertakan dalam Databricks Runtime.
  • Memperbarui pustaka secara eksplisit ke versi terbaru menggunakan %pip install <library-name> --upgrade.
  • Mengonfigurasi lingkungan kustom dari file lokal requirements.txt .
  • Menginstal pustaka yang memerlukan perubahan versi pustaka dependen yang disertakan dalam Databricks Runtime.