Sdílet prostřednictvím


Restartování procesu Pythonu v Azure Databricks

Proces Pythonu můžete v Azure Databricks programově restartovat, abyste zajistili správné fungování místně nainstalovaných nebo upgradovaných knihoven v jádru Pythonu pro vaši aktuální sparksession.

Při restartování procesu Pythonu ztratíte informace o stavu Pythonu. Databricks doporučuje, abyste na začátku poznámkového bloku nainstalovali všechny knihovny v rozsahu relací a spustili spuštění dbutils.library.restartPython() , aby se proces Pythonu vyčistil, než budete pokračovat.

Tento proces můžete použít v interaktivních poznámkových blocích nebo pro úlohy Pythonu naplánované pomocí pracovních postupů.

Co je dbutils.library.restartPython?

Pomocná funkce dbutils.library.restartPython() představuje doporučený způsob restartování procesu Pythonu v poznámkovém bloku Databricks.

Poznámka

Většina funkcí v dílčím dbutils.library modulu je zastaralá. Databricks důrazně doporučuje použít ke %pip správě všech instalací knihoven v rozsahu poznámkových bloků. Viz Knihovny Pythonu v rámci poznámkových bloků.

Kdy byste měli proces Pythonu restartovat?

Proces Pythonu je vhodné restartovat vždy, když provedete místní instalaci, která zahrnuje některou z následujících možností:

  • Určení verze balíčku, který je součástí Databricks Runtime.
  • Instalace vlastní verze balíčku, který je součástí Databricks Runtime.
  • Explicitní aktualizace knihovny na nejnovější verzi pomocí %pip install <library-name> --upgrade.
  • Konfigurace vlastního prostředí z místního requirements.txt souboru
  • Instalace knihovny, která vyžaduje změnu verzí závislých knihoven, které jsou součástí Databricks Runtime.