Restartování procesu Pythonu v Azure Databricks
Proces Pythonu můžete v Azure Databricks programově restartovat, abyste zajistili správné fungování místně nainstalovaných nebo upgradovaných knihoven v jádru Pythonu pro vaši aktuální sparksession.
Při restartování procesu Pythonu ztratíte informace o stavu Pythonu. Databricks doporučuje, abyste na začátku poznámkového bloku nainstalovali všechny knihovny v rozsahu relací a spustili spuštění dbutils.library.restartPython()
, aby se proces Pythonu vyčistil, než budete pokračovat.
Tento proces můžete použít v interaktivních poznámkových blocích nebo pro úlohy Pythonu naplánované pomocí pracovních postupů.
Co je dbutils.library.restartPython
?
Pomocná funkce dbutils.library.restartPython()
představuje doporučený způsob restartování procesu Pythonu v poznámkovém bloku Databricks.
Poznámka
Většina funkcí v dílčím dbutils.library
modulu je zastaralá. Databricks důrazně doporučuje použít ke %pip
správě všech instalací knihoven v rozsahu poznámkových bloků. Viz Knihovny Pythonu v rámci poznámkových bloků.
Kdy byste měli proces Pythonu restartovat?
Proces Pythonu je vhodné restartovat vždy, když provedete místní instalaci, která zahrnuje některou z následujících možností:
- Určení verze balíčku, který je součástí Databricks Runtime.
- Instalace vlastní verze balíčku, který je součástí Databricks Runtime.
- Explicitní aktualizace knihovny na nejnovější verzi pomocí
%pip install <library-name> --upgrade
. - Konfigurace vlastního prostředí z místního
requirements.txt
souboru - Instalace knihovny, která vyžaduje změnu verzí závislých knihoven, které jsou součástí Databricks Runtime.