分享方式:


在 Azure Databricks 上重新啟動 Python 程式

您可以透過程序設計方式在 Azure Databricks 上重新啟動 Python 程式,以確保本機安裝或升級的連結庫在目前 SparkSession 的 Python 核心中正常運作。

當您重新啟動 Python 程式時,會遺失 Python 狀態資訊。 Databricks 建議在筆記本開頭安裝所有會話範圍的連結庫,並在繼續之前先執行 dbutils.library.restartPython() 以清除 Python 程式。

您可以在互動式筆記本中,或使用工作排程的 Python 工作使用此程式。

什麼是 dbutils.library.restartPython

協助程式函 dbutils.library.restartPython() 式是重新啟動 Databricks 筆記本中 Python 程式的建議方式。

注意

子模組中的 dbutils.library 大部分函式已被取代。 Databricks 強烈建議使用 %pip 來管理所有筆記本範圍的連結庫安裝。 請參閱 筆記本範圍的 Python 連結庫

何時應該重新啟動 Python 程式?

當您執行包含下列任一項的本機安裝時,重新啟動 Python 程式是個好主意:

  • 指定 Databricks Runtime 中包含的套件版本。
  • 安裝 Databricks Runtime 中包含的套件自定義版本。
  • 使用 %pip install <library-name> --upgrade明確地將連結庫更新為最新版本。
  • 從本機 requirements.txt 檔案設定自定義環境。
  • 安裝需要變更 Databricks Runtime 中包含的相依連結庫版本的連結庫。