在 Azure Databricks 上重新啟動 Python 程式
您可以透過程序設計方式在 Azure Databricks 上重新啟動 Python 程式,以確保本機安裝或升級的連結庫在目前 SparkSession 的 Python 核心中正常運作。
當您重新啟動 Python 程式時,會遺失 Python 狀態資訊。 Databricks 建議在筆記本開頭安裝所有會話範圍的連結庫,並在繼續之前先執行 dbutils.library.restartPython()
以清除 Python 程式。
您可以在互動式筆記本中,或使用工作排程的 Python 工作使用此程式。
什麼是 dbutils.library.restartPython
?
協助程式函 dbutils.library.restartPython()
式是重新啟動 Databricks 筆記本中 Python 程式的建議方式。
注意
子模組中的 dbutils.library
大部分函式已被取代。 Databricks 強烈建議使用 %pip
來管理所有筆記本範圍的連結庫安裝。 請參閱 筆記本範圍的 Python 連結庫。
何時應該重新啟動 Python 程式?
當您執行包含下列任一項的本機安裝時,重新啟動 Python 程式是個好主意:
- 指定 Databricks Runtime 中包含的套件版本。
- 安裝 Databricks Runtime 中包含的套件自定義版本。
- 使用
%pip install <library-name> --upgrade
明確地將連結庫更新為最新版本。 - 從本機
requirements.txt
檔案設定自定義環境。 - 安裝需要變更 Databricks Runtime 中包含的相依連結庫版本的連結庫。