Restartování procesu Pythonu v Azure Databricks
Proces Pythonu v Azure Databricks můžete restartovat prostřednictvím kódu programu, abyste zajistili, že místně nainstalované nebo upgradované knihovny fungují správně v jádru Pythonu pro vaši aktuální SparkSession.
Při restartování procesu Pythonu ztratíte informace o stavu Pythonu. Databricks doporučuje nainstalovat všechny knihovny v oboru relace na začátku poznámkového bloku a spustit dbutils.library.restartPython()
, aby se proces Pythonu před pokračováním vyčistil.
Tento proces můžete použít v interaktivních poznámkových blocích nebo pro úlohy Pythonu naplánované s úlohami.
Co je dbutils.library.restartPython
?
Pomocná funkce dbutils.library.restartPython()
je doporučeným způsobem restartování procesu Pythonu v poznámkovém bloku Databricks.
Poznámka:
Většina funkcí v dílčím dbutils.library
modulu je zastaralá. Databricks důrazně doporučuje používat %pip
ke správě všech instalací knihoven v oboru poznámkových bloků. Další informace najdete v tématu Knihovny Pythonu v rámci poznámkových bloků
Kdy byste měli proces Pythonu restartovat?
Kdykoli provedete místní instalaci, která zahrnuje některou z následujících možností, je vhodné restartovat proces Pythonu:
- Určení verze balíčku zahrnutého v Databricks Runtime
- Instalace vlastní verze balíčku zahrnutého v Databricks Runtime
- Explicitní aktualizace knihovny na nejnovější verzi pomocí
%pip install <library-name> --upgrade
. - Konfigurace vlastního prostředí z místního
requirements.txt
souboru - Instalace knihovny, která vyžaduje změnu verzí závislých knihoven, které jsou součástí Databricks Runtime.