Sdílet prostřednictvím


Restartování procesu Pythonu v Azure Databricks

Proces Pythonu v Azure Databricks můžete restartovat prostřednictvím kódu programu, abyste zajistili, že místně nainstalované nebo upgradované knihovny fungují správně v jádru Pythonu pro vaši aktuální SparkSession.

Při restartování procesu Pythonu ztratíte informace o stavu Pythonu. Databricks doporučuje nainstalovat všechny knihovny v oboru relace na začátku poznámkového bloku a spustit dbutils.library.restartPython() , aby se proces Pythonu před pokračováním vyčistil.

Tento proces můžete použít v interaktivních poznámkových blocích nebo pro úlohy Pythonu naplánované s úlohami.

Co je dbutils.library.restartPython?

Pomocná funkce dbutils.library.restartPython() je doporučeným způsobem restartování procesu Pythonu v poznámkovém bloku Databricks.

Poznámka:

Většina funkcí v dílčím dbutils.library modulu je zastaralá. Databricks důrazně doporučuje používat %pip ke správě všech instalací knihoven v oboru poznámkových bloků. Další informace najdete v tématu Knihovny Pythonu v rámci poznámkových bloků

Kdy byste měli proces Pythonu restartovat?

Kdykoli provedete místní instalaci, která zahrnuje některou z následujících možností, je vhodné restartovat proces Pythonu:

  • Určení verze balíčku zahrnutého v Databricks Runtime
  • Instalace vlastní verze balíčku zahrnutého v Databricks Runtime
  • Explicitní aktualizace knihovny na nejnovější verzi pomocí %pip install <library-name> --upgrade.
  • Konfigurace vlastního prostředí z místního requirements.txt souboru
  • Instalace knihovny, která vyžaduje změnu verzí závislých knihoven, které jsou součástí Databricks Runtime.