Condividi tramite


Riavviare il processo Python in Azure Databricks

È possibile riavviare a livello di codice il processo Python in Azure Databricks per assicurarsi che le librerie installate o aggiornate in locale funzionino correttamente nel kernel Python per sparkSession corrente.

Quando si riavvia il processo Python, si perdono le informazioni sullo stato python. Databricks consiglia di installare tutte le librerie con ambito sessione all'inizio di un notebook ed eseguire dbutils.library.restartPython() per pulire il processo Python prima di procedere.

È possibile usare questo processo in notebook interattivi o per le attività Python pianificate con i flussi di lavoro.

Che cos'è dbutils.library.restartPython?

La funzione dbutils.library.restartPython() helper è il modo consigliato per riavviare il processo Python in un notebook di Databricks.

Nota

La maggior parte delle funzioni nel dbutils.library sottomodulo è deprecata. Databricks consiglia vivamente di usare %pip per gestire tutte le installazioni della libreria con ambito notebook. Vedere Librerie Python con ambito notebook.

Quando è necessario riavviare il processo Python?

È consigliabile riavviare il processo Python ogni volta che si esegue un'installazione locale che include uno dei seguenti elementi:

  • Specifica di una versione di un pacchetto incluso in Databricks Runtime.
  • Installazione di una versione personalizzata di un pacchetto incluso in Databricks Runtime.
  • Aggiornamento esplicito di una libreria alla versione più recente usando %pip install <library-name> --upgrade.
  • Configurazione di un ambiente personalizzato da un file locale requirements.txt .
  • Installazione di una libreria che richiede la modifica delle versioni delle librerie dipendenti incluse in Databricks Runtime.