Bibliothèques d’espace de travail (héritées)
Important
Cette documentation a été mise hors service et peut ne pas être mise à jour. Les produits, services ou technologies mentionnés dans ce contenu ne sont plus pris en charge. Consultez Bibliothèques de clusters.
Remarque
Les bibliothèques d’espace de travail ont été déconseillées et ne doivent pas être utilisées. Toutefois, le stockage des bibliothèques en tant que fichiers d’espace de travail est distinct des bibliothèques d’espace de travail, et est toujours entièrement pris en charge. Vous pouvez installer des bibliothèques stockées en tant que fichiers d’espace de travail directement sur des tâches de travail ou de calcul.
Les bibliothèques d’espace de travail servent de référentiel local à partir duquel vous créez des bibliothèques installées sur le cluster. Une bibliothèque d’espace de travail peut être du code personnalisé créé par votre organisation ou une version particulière d’une bibliothèque open source que votre organisation utilise comme standard.
Vous devez installer une bibliothèque d’espace de travail sur un cluster avant de pouvoir l’utiliser dans un notebook ou un travail. Consultez la section Installer une bibliothèque d’espaces de travail sur un cluster.
Les bibliothèques d’espace de travail dans le dossier Partagé sont accessibles à tous les utilisateurs d’un espace de travail, tandis que les bibliothèques d’espace de travail dans un dossier utilisateur ne sont accessibles qu’à cet utilisateur.
Important
Vous pouvez également installer les bibliothèques à partir de DBFS lors de l’utilisation de Databricks Runtime 14.3 LTS et versions antérieures. Toutefois, tout utilisateur de l’espace de travail peut modifier les bibliothèques de codes stockées dans DBFS. Pour améliorer la sécurité des bibliothèques dans un espace de travail Azure Databricks, le stockage des bibliothèques de codes dans la racine DBFS est déconseillé et désactivé par défaut dans Databricks Runtime 15.1 et versions ultérieures. Consultez Le stockage des bibliothèques dans la racine DBFS est déconseillé et désactivé par défaut.
Au lieu de cela, Databricks recommande de charger toutes les bibliothèques, notamment les bibliothèques Python, les fichiers JAR et les connecteurs Spark, dans des fichiers d’espace de travail ou des volumes du catalogue Unity, ou d’utiliser des référentiels de packages de bibliothèques. Si votre charge de travail ne prend pas en charge ces modèles, vous pouvez également utiliser des bibliothèques stockées dans le stockage d’objets cloud.
Qu’est-ce qui différencie les bibliothèques de l’espace de travail des bibliothèques stockées dans les fichiers de l’espace de travail ?
Le terme « bibliothèques de l’espace de travail » fait référence à n’importe quelle bibliothèque inscrite dans un espace de travail. Les bibliothèques de l’espace de travail s’affichent en même temps que les notebooks et les fichiers de l’espace de travail et suivent les règles ACL du répertoire qui les contient.
Le terme « fichiers de l’espace de travail » fait référence à n’importe quel fichier arbitraire stocké dans l’espace de travail. Vous pouvez stocker des packages .whl Python en tant que fichiers de l’espace de travail, puis les inscrire en tant que bibliothèques de l’espace de travail. Consultez l’article Que sont les fichiers d’espace de travail ?.
Vous pouvez charger des bibliothèques en tant que fichiers de l’espace de travail. Consultez Utilisation de base des fichiers d’espace de travail.
Bien que vous puissiez charger de nombreux types de fichiers dans des fichiers d’espace de travail, seuls les fichiers .whl Python peuvent être installés à l’aide de fichiers d’espace de travail. Consultez Bibliothèques à l’échelle d’un cluster.
Dans Databricks Runtime 13.3 LTS et les versions ultérieures, vous pouvez utiliser %pip
pour installer des fichiers wheel Python stockés en tant que fichiers de l’espace de travail. Consultez Installer un package stocké en tant que fichier d’espace de travail avec %pip.
Créer une bibliothèque d’espace de travail
Avertissement
Cette fonctionnalité n’est plus disponible. Consultez La création et l’installation des bibliothèques d’espace de travail ne sont plus disponibles.
- Cliquez avec le bouton droit sur le dossier de l’espace de travail actuel dans lequel vous souhaitez stocker la bibliothèque.
- Sélectionnez Créer > Bibliothèque. La boîte de dialogue Créer une bibliothèque apparaît.
- Sélectionnez la source de la bibliothèque et suivez la procédure appropriée :
Charger un fichier Jar, Python Egg ou Python wheel
Remarque
L’installation de fichiers Python Egg est déconseillée et va être supprimée dans une prochaine version de Databricks Runtime.
Important
Vous pouvez également installer les bibliothèques à partir de DBFS lors de l’utilisation de Databricks Runtime 14.3 LTS et versions antérieures. Toutefois, tout utilisateur de l’espace de travail peut modifier les bibliothèques de codes stockées dans DBFS. Pour améliorer la sécurité des bibliothèques dans un espace de travail Azure Databricks, le stockage des bibliothèques de codes dans la racine DBFS est déconseillé et désactivé par défaut dans Databricks Runtime 15.1 et versions ultérieures. Consultez Le stockage des bibliothèques dans la racine DBFS est déconseillé et désactivé par défaut.
Au lieu de cela, Databricks recommande de charger toutes les bibliothèques, notamment les bibliothèques Python, les fichiers JAR et les connecteurs Spark, dans des fichiers d’espace de travail ou des volumes du catalogue Unity, ou d’utiliser des référentiels de packages de bibliothèques. Si votre charge de travail ne prend pas en charge ces modèles, vous pouvez également utiliser des bibliothèques stockées dans le stockage d’objets cloud.
- Dans la liste de boutons Source de la bibliothèque, sélectionnez Charger.
- Sélectionnez Jar, Python Egg ou Python Whl.
- Si vous le souhaitez, entrez un nom de bibliothèque.
- Faites glisser votre fichier Jar, Egg, ou Whl dans la zone de dépôt ou cliquez sur la zone de dépôt et naviguez jusqu’à un fichier. Le fichier est chargé dans
dbfs:/FileStore/jars
. - Cliquez sur Créer. L’écran d’état de la bibliothèque s’affiche.
Référencer un fichier JAR, Python Egg ou wheel Python chargé
Vous pouvez créer une bibliothèque d’espace de travail en référençant des fichiers JAR, Python egg ou Python wheel stockés à la racine DBFS, dans le stockage d’objets ou avec des fichiers d’espace de travail. Le suivi de ce flux de travail inscrit un pointeur vers une bibliothèque sans charger ni déplacer de fichiers.
Avec Databricks Runtime 13.2 et versions ultérieures, vous pouvez également référencer un volume dans Unity Catalog. Cette fonctionnalité est en préversion publique.
Pour le mode d’accès partagé, vous devez ajouter des fichiers JAR au allowlist
. Consultez Bibliothèques de listes d’autorisation et scripts d’initialisation sur le calcul partagé.
- Sélectionnez Chemin d’accès au fichier/ADLS dans la liste de boutons Source de la bibliothèque.
- Sélectionnez Jar, Python Egg ou Python Whl.
- Si vous le souhaitez, entrez un nom de bibliothèque.
- Spécifiez le chemin d’accès à la bibliothèque, comme dans les exemples suivants :
abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
/Workspace/path/to/library.whl
dbfs:/path/to/library.whl
/Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
- Cliquez sur Créer. L’écran d’état de la bibliothèque s’affiche.
Pour plus d’informations sur l’utilisation des bibliothèques dans le stockage d’objets, consultez Installer des bibliothèques à partir du stockage d’objets.
Pour plus d’informations sur les fichiers d’espace de travail, consultez Interagir avec des fichiers sur Azure Databricks.
Installer une bibliothèque d’espaces de travail sur un cluster
Remarque
Azure Databricks traite toutes les bibliothèques d’espace de travail dans l’ordre dans lequel elles ont été installées sur le cluster. Vous devrez peut-être prêter attention à l’ordre d’installation sur le cluster s’il existe des dépendances entre les bibliothèques.
Important
Vous pouvez également installer les bibliothèques à partir de DBFS lors de l’utilisation de Databricks Runtime 14.3 LTS et versions antérieures. Toutefois, tout utilisateur de l’espace de travail peut modifier les bibliothèques de codes stockées dans DBFS. Pour améliorer la sécurité des bibliothèques dans un espace de travail Azure Databricks, le stockage des bibliothèques de codes dans la racine DBFS est déconseillé et désactivé par défaut dans Databricks Runtime 15.1 et versions ultérieures. Consultez Le stockage des bibliothèques dans la racine DBFS est déconseillé et désactivé par défaut.
Au lieu de cela, Databricks recommande de charger toutes les bibliothèques, notamment les bibliothèques Python, les fichiers JAR et les connecteurs Spark, dans des fichiers d’espace de travail ou des volumes du catalogue Unity, ou d’utiliser des référentiels de packages de bibliothèques. Si votre charge de travail ne prend pas en charge ces modèles, vous pouvez également utiliser des bibliothèques stockées dans le stockage d’objets cloud.
En mode d’accès utilisateur unique, l’identité du principal attribué (un utilisateur ou un principal de service) est utilisée. En mode d’accès partagé, les bibliothèques utilisent l’identité de l’utilisateur qui a installé la bibliothèque. Le mode d’accès partagé sans isolation ne prend pas en charge les volumes, mais utilise la même attribution d’identité que le mode d’accès partagé.
Pour afficher toutes les options d’installation de bibliothèques sur des clusters, consultez Bibliothèques de cluster.
Pour installer une bibliothèque qui existe déjà dans l’espace de travail, vous pouvez démarrer le processus à partir de l’interface utilisateur du cluster ou de l’interface utilisateur de la bibliothèque :
Cluster
- Dans la barre latérale, cliquez sur Calcul.
- Cliquez sur le nom d’un cluster.
- Cliquez sur l’onglet Bibliothèques.
- Cliquez sur Installer.
- Dans la liste de boutons Source de la bibliothèque, sélectionnez Bibliothèque d’espace de travail.
- Sélectionnez une bibliothèque d’espace de travail.
- Cliquez sur Installer.
Bibliothèque
- Accédez au dossier qui contient la bibliothèque.
- Cliquez sur le nom de la bibliothèque.
- Cochez la case à côté du cluster sur lequel vous souhaitez installer la bibliothèque, puis cliquez sur Installer. Seuls les clusters en cours d’exécution s’affichent dans la liste.
Afficher les détails de la bibliothèque d’espace de travail
Remarque
Les dossiers d’espace de travail offrent une fonctionnalité pratique pour la découverte des bibliothèques d’espace de travail et la gestion des listes de contrôle d’accès.
- Accédez au dossier de l’espace de travail contenant la bibliothèque.
- Cliquez sur le nom de la bibliothèque.
La page de détails de la bibliothèque affiche les clusters en cours d’exécution et l’état d’installation de la bibliothèque. Si la bibliothèque est installée, la page contient un lien vers l’hôte du package. Si la bibliothèque a été chargée, la page affiche un lien vers le fichier de package chargé.
Déplacer une bibliothèque d’espace de travail
Remarque
Les dossiers d’espace de travail offrent une fonctionnalité pratique pour la découverte des bibliothèques d’espace de travail et la gestion des listes de contrôle d’accès. Le déplacement d’une bibliothèque d’espace de travail ne déplace pas les fichiers, mais peut modifier les utilisateurs qui ont accès à la bibliothèque d’espace de travail.
- Accédez au dossier de l’espace de travail contenant la bibliothèque.
- Cliquez avec le bouton droit sur le nom de la bibliothèque, puis sélectionnez Déplacer. Un navigateur de dossiers s’affiche.
- Cliquez sur le dossier de destination.
- Cliquez sur Déplacer.
Supprimer une bibliothèque d’espace de travail
Important
Avant de supprimer une bibliothèque d’espace de travail, vous devez la désinstaller de tous les clusters.
Pour supprimer une bibliothèque d’espace de travail :
- Déplacez la bibliothèque dans le dossier Corbeille.
- Supprimez définitivement la bibliothèque dans le dossier Corbeille ou videz le dossier Corbeille.