Nastavení a použití proměnných prostředí s inicializačními skripty

Inicializační skripty mají přístup ke všem proměnným prostředí, které jsou přítomné v clusteru. Azure Databricks nastaví mnoho výchozích proměnných, které můžou být užitečné v logice inicializačních skriptů.

Proměnné prostředí nastavené v konfiguraci Sparku jsou k dispozici pro inicializační skripty. Viz proměnné prostředí.

Jaké proměnné prostředí jsou ve výchozím nastavení zpřístupněny inicializačnímu skriptu?

Clusterové a globální inicializační skripty podporují následující proměnné prostředí:

  • DB_CLUSTER_ID: ID clusteru, na kterém je skript spuštěný. Podívejte se na rozhraní API clusterů.
  • DB_CONTAINER_IP: privátní IP adresa kontejneru, ve kterém běží Spark. Inicializační skript se spustí uvnitř tohoto kontejneru. Podívejte se na rozhraní API clusterů.
  • DB_IS_DRIVER: Zda skript běží na uzlu ovladače.
  • DB_DRIVER_IP: IP adresa uzlu ovladače.
  • DB_INSTANCE_TYPE: typ instance hostitelského virtuálního počítače.
  • DB_CLUSTER_NAME: název clusteru, na který se skript spouští.
  • DB_IS_JOB_CLUSTER: Zda byl cluster vytvořen pro spuštění úlohy. Viz Vytvoření úlohy.

Pokud například chcete spustit část skriptu pouze na uzlu ovladače, můžete napsat skript jako:

echo $DB_IS_DRIVER
if [[ $DB_IS_DRIVER = "TRUE" ]]; then
  <run this part only on driver>
else
  <run this part only on workers>
fi
<run this part on both driver and workers>

Použití tajných kódů v inicializačních skriptech

Pokud odkazujete na tajný klíč, můžete použít libovolný platný název proměnné. Přístup k tajným kódům odkazovaným v proměnných prostředí je určen oprávněními uživatele, který cluster nakonfiguroval. Tajné kódy uložené v proměnných prostředí jsou přístupné všem uživatelům clusteru, ale jsou redactovány ze zobrazení prostého textu.

Viz Odkaz na tajný klíč v proměnné prostředí.