Sdílet prostřednictvím


Co jsou inicializační skripty?

Inicializační skript (inicializační skript) je skript prostředí, který se spouští při spouštění každého uzlu clusteru před spuštěním ovladače Apache Spark nebo exekutoru JVM. Tento článek obsahuje doporučení pro inicializační skripty a informace o konfiguraci, pokud je musíte použít.

Doporučení pro inicializační skripty

Databricks doporučuje používat integrované funkce platformy místo inicializačních skriptů, kdykoli je to možné. Rozšířené použití inicializačních skriptů může zpomalit migraci na nové verze Databricks Runtime a zabránit přijetí některých optimalizací Databricks.

Důležité

Pokud potřebujete migrovat z inicializačních skriptů ve službě DBFS, přečtěte si téma Migrace inicializačních skriptů z DBFS.

Následující funkce Databricks řeší některé běžné případy použití inicializačních skriptů:

Pokud musíte použít inicializační skripty:

  • Správa inicializačních skriptů pomocí výpočetních zásad nebo inicializačních skriptů s oborem clusteru místo globálních inicializačních skriptů Viz typy inicializačních skriptů.
  • Spravujte instalaci knihovny pro produkční a interaktivní prostředí pomocí zásad výpočtu. Neinstalujte knihovny pomocí inicializačních skriptů. Podívejte se na zásady výpočetních prostředků.
  • Pro všechny úlohy používejte standardní režim přístupu (dříve sdílený režim přístupu). Režim vyhrazeného přístupu (dříve režim přístupu jednoho uživatele) používejte pouze v případě, že standardní režim přístupu nepodporuje požadované funkce.
  • Pro všechny pracovní zátěže používejte nové verze Databricks Runtime a Unity Catalog.

Následující tabulka poskytuje doporučení uspořádaná podle verze Databricks Runtime a aktivace katalogu Unity.

Prostředí Doporučení
Databricks Runtime 13.3 LTS a novější s katalogem Unity Uložte v Katalogu Unity inicializační skripty ve svazcích .
Databricks Runtime 11.3 LTS a novější bez katalogu Unity Ukládejte inicializační skripty jako soubory pracovního prostoru. (Limit velikosti souboru je 500 MB).
Databricks Runtime 10.4 LTS a níže Ukládejte inicializační skripty pomocí cloudového úložiště objektů.

Jaké typy inicializačních skriptů Azure Databricks podporuje?

Azure Databricks podporuje dva druhy inicializačních skriptů: skripty s rozsahem clusteru a globální, ale doporučuje se používat inicializační skripty, které mají rozsah clusteru.

  • Rozsah clusteru: spuštěno na každém clusteru, které jsou nakonfigurovány pomocí skriptu. Toto je doporučený způsob spuštění inicializačního skriptu. Viz skripty pro inicializaci na úrovni clusteru.
  • Globální: spusťte na všech clusterech v pracovním prostoru nakonfigurovaném pomocí vyhrazeného přístupového režimu nebo bezizolačního sdíleného přístupového režimu. Tyto inicializační skripty můžou způsobit neočekávané problémy, jako jsou konflikty knihoven. Globální inicializační skripty můžou vytvářet jenom uživatelé správce pracovního prostoru. Viz globální inicializační skripty.

Kdykoli změníte jakýkoli typ inicializačního skriptu, musíte restartovat všechny clustery ovlivněné skriptem.

Globální inicializační skripty se spouštějí před inicializačními skripty s rozsahem clusteru.

Důležité

Starší globální a starší inicializační skripty pojmenované clusterem se spouštějí před jinými inicializačními skripty. Tyto inicializační skripty jsou ukončené, ale mohou být stále přítomny v pracovních prostorech vytvořených před 21. únorem 2023. Viz inicializační skripty pojmenované clusterem (starší verze) a globální inicializační skripty (starší verze).

Kde lze inicializační skripty nainstalovat?

Inicializační skripty můžete ukládat a konfigurovat ze souborů pracovního prostoru, svazků katalogu Unity a cloudového úložiště objektů, ale inicializační skripty nejsou podporovány ve všech konfiguracích clusteru a ne všechny soubory se dají odkazovat ze skriptů inicializace. Doporučení prostředí pro inicializační skripty najdete v tématu Doporučení pro inicializační skripty.

Následující tabulka uvádí podporu inicializačních skriptů na základě zdrojového umístění a režimu přístupu ke clusteru. Uvedená verze Databricks Runtime je minimální verze potřebná k použití kombinace. Informace o režimech přístupu ke clusteru najdete v tématu Režimy přístupu.

Poznámka:

Standardní režim přístupu vyžaduje, aby správce přidal inicializační skripty do allowlist. Viz Knihovny povolených seznamů a inicializační skripty na výpočetních prostředcích pomocí standardního režimu přístupu (dříve režimu sdíleného přístupu).

Standardní režim přístupu Režim s jedním přístupem Režim sdíleného přístupu bez izolace
Soubory pracovního prostoru Nepodporováno Všechny podporované verze Databricks Runtime.
Ve verzích nižších než 11.3 LTS nejsou podporované inicializační skripty, které odkazují na jiné soubory pracovního prostoru.
Všechny podporované verze Databricks Runtime.
Objemy 13.3 LTS a vyšší 13.3 LTS a vyšší Nepodporováno
Cloudové úložiště 13.3 LTS a vyšší Všechny podporované verze Databricks Runtime Všechny podporované verze Databricks Runtime

Migrace inicializačních skriptů z DBFS

Varování

Inicializační skripty v systému souborů DBFS dosáhly konce životnosti a už se nedají použít. Před spuštěním výpočetních prostředků musíte migrovat inicializační skripty do podporovaného umístění. Ukládejte inicializační skripty na svazcích katalogu Unity, jako soubory pracovního prostoru nebo v cloudovém úložišti objektů.

Uživatelé, kteří potřebují migrovat inicializační skripty z DBFS, můžou použít následující příručky. Ujistěte se, že jste pro konfiguraci identifikovali správný cíl. Viz Doporučení pro inicializační skripty.