Utiliser des scripts d'initialisation globaux

Important

Les scripts d’initialisation globaux ne s’exécutent que sur les clusters configurés avec un(e) utilisateur(-trice) unique ou un mode d’accès partagé sans isolation. Databricks recommande donc de configurer tous les scripts d’initialisation en tant que scripts d’initialisation à l’échelle du cluster et de les gérer dans votre espace de travail à l’aide de stratégies de cluster.

Un script init global s’exécute sur chaque cluster créé dans votre espace de travail. Les scripts init globaux sont utiles lorsque vous souhaitez appliquer des configurations de bibliothèques ou des mesures de sécurité à l’échelle de l’organisation. Seuls les administrateurs d’espaces de travail peuvent créer des scripts init globaux. Vous pouvez les créer à l’aide de l’interface utilisateur ou de l’API REST.

Important

Étant donné que les scripts d'initialisation globaux s'exécutent sur tous les clusters, tenez compte des impacts potentiels tels que les suivants :

  • Il est facile d’ajouter des bibliothèques ou d’apporter d’autres modifications qui ont des effets inattendus. Dans la mesure du possible, utilisez à la place des scripts init associés aux clusters de l’étendue.
  • Tout utilisateur qui crée un cluster et active la remise des journaux de cluster peut afficher les sorties stderr et stdout des scripts init globaux. Vous devez vous assurer que vos scripts init globaux n’affichent pas d’informations sensibles en sortie.

Vous pouvez dépanner les scripts d'initialisation globaux en configurant la remise des journaux de cluster et en examinant le journal des scripts d'initialisation. Voir Journalisation du script d'initialisation.

Remarque

Les scripts init globaux ne s’exécutent pas sur des clusters de service de modèle.

Ajouter un script init global à l’aide de l’interface utilisateur

Pour configurer des scripts init globaux avec les paramètres d’administration :

  1. Accédez aux paramètres d’administration, puis cliquez sur l’onglet Calcul.

  2. À côté de Scripts d’initialisation globaux, cliquez sur Gérer.

  3. Cliquez sur + Ajouter.

  4. Nommez le script et entrez-le en tapant, en collant ou en faisant glisser un fichier texte dans le champ Script.

    Notes

    Le script init ne peut pas avoir une taille supérieure à 64 Ko. Si un script dépasse cette taille, un message d’erreur s’affiche lorsque vous essayez de l’enregistrer.

  5. Si vous avez plusieurs scripts init globaux configurés pour votre espace de travail, définissez l’ordre dans lequel le nouveau script devra s’exécuter.

  6. Si vous souhaitez que le script soit activé pour tous les clusters nouveaux et redémarrés après l’enregistrement, basculez sur Activé.

    Important

    Lorsque vous ajoutez un script init global ou apportez des modifications au nom, à l’ordre d’exécution ou à l’activation des scripts init, ces modifications ne prennent pas effet tant que vous ne redémarrez pas le cluster.

  7. Cliquez sur Add.

Ajouter un script init global avec Terraform

Vous pouvez ajouter un script init global en utilisant le fournisseur Databricks Terraform et databricks_global_init_script.

Modifier un script init global à l’aide de l’interface utilisateur

  1. Accédez aux paramètres d’administration, puis cliquez sur l’onglet Calcul.
  2. À côté de Scripts d’initialisation globaux, cliquez sur Gérer.
  3. Cliquez sur un script.
  4. Modifiez le script.
  5. Cliquez sur Confirmer.

Configurer un script init global à l’aide de l’API

Les administrateurs d’espace de travail peuvent ajouter, supprimer, réorganiser et obtenir des informations sur les scripts init globaux de votre espace de travail à l’aide de l’API des scripts init globaux.