Attachement et gestion d’un pool Spark Synapse dans Azure Machine Learning
S’APPLIQUE À :Extension Azure CLI v2 (actuelle)Kit de développement logiciel (SDK) Python azure-ai-ml v2 (version actuelle)
Dans cet article, vous allez apprendre à attacher un pool Spark Synapse dans Azure Machine Learning. Il existe différentes manières de le faire :
- Avec l’interface utilisateur d’Azure Machine Learning studio
- Avec l’interface CLI d’Azure Machine Learning
- Avec le kit de développement logiciel (SDK) Python d’Azure Machine Learning
Prérequis
- Interface utilisateur du studio
- INTERFACE DE LIGNE DE COMMANDE
- Kit de développement logiciel (SDK) Python
- Un abonnement Azure : si vous n’en possédez pas, créez un compte gratuit avant de commencer.
- Un espace de travail Azure Machine Learning. Consultez Créer des ressources d’espace de travail.
- Créez un espace de travail Azure Synapse Analytics dans le portail Azure.
- Créez un pool Apache Spark avec le Portail Azure.
Attachement d’un pool Spark Synapse dans Azure Machine Learning
Azure Machine Learning offre différentes façons d’attacher et de gérer un pool Spark Synapse.
- Interface utilisateur du studio
- INTERFACE DE LIGNE DE COMMANDE
- Kit de développement logiciel (SDK) Python
Pour attacher un pool Spark Synapse sous l’onglet Calcul du studio :
- Dans la section Gérer située dans le volet gauche, sélectionnez Calcul.
- Sélectionnez Calculs attachés.
- Sur l’écran Calculs attachés, sélectionnez Nouveau pour afficher les options permettant d’attacher différents types de calculs.
- Sélectionnez Pool Spark Synapse.
Le panneau Attacher un pool Spark Synapse s’ouvre sur le côté droit de l’écran. Procédez comme suit dans ce panneau :
Entrez un Nom, qui fait référence au pool Spark Synapse attaché dans la ressource Azure Machine Learning.
Sélectionnez un abonnement Azure dans le menu déroulant.
Sélectionnez un espace de travail Synapse dans le menu déroulant.
Sélectionnez un pool Spark dans le menu déroulant.
Activez l’option Affecter une identité managée.
Sélectionnez un Type d’identité managé à utiliser avec ce pool Spark Synapse attaché.
SélectionnezMettre à jour pour terminer le processus d’attachement de pool Spark Synapse.
Ajout d’attributions de rôles dans Azure Synapse Analytics
Pour que le pool Spark Synapse attaché fonctionne correctement, attribuez-lui le rôle Administrateur dans l’interface utilisateur d’Azure Synapse Analytics Studio. Pour ce faire, procédez comme suit :
Ouvrez votre espace de travail Synapse sur le Portail Azure.
Dans le volet gauche, sélectionnez Vue d’ensemble.
Sélectionnez Ouvrir Synapse Studio.
Dans Azure Synapse Analytics Studio, sélectionnez Gérer dans le volet gauche.
Sélectionnez Contrôle d’accès dans la section Sécurité du volet gauche (le deuxième en partant de la gauche).
Sélectionnez Ajouter.
Le panneau Ajouter une attribution de rôle s’ouvre sur le côté droit de l’écran. Procédez comme suit dans ce panneau :
Sélectionnez Élément d’espace de travail comme Étendue.
Dans le menu déroulant Type d’élément, sélectionnez Pool Apache Spark.
Dans le menu déroulant Élément, sélectionnez votre pool Apache Spark.
Dans le menu déroulant Rôle, sélectionnez Administrateur Synapse.
Dans la zone de recherche Sélectionner un utilisateur, commencez à taper le nom de votre espace de travail Azure Machine Learning. La liste des pools Spark Synapse attachés s’affiche. Sélectionnez le pool Spark Synapse souhaité dans la liste.
Sélectionnez Appliquer.
Mise à jour du pool Spark Synapse
- Interface utilisateur du studio
- INTERFACE DE LIGNE DE COMMANDE
- Kit de développement logiciel (SDK) Python
Vous pouvez gérer le pool Spark Synapse attaché dans l’interface utilisateur d’Azure Machine Learning studio. Les fonctionnalités de gestion des pools Spark comprennent la mise à jour de l’identité managée associée à un pool Spark Synapse attaché. Vous pouvez attribuer une identité affectée par le système ou par l’utilisateur lors de la mise à jour d’un pool Spark Synapse. Vous devez créer une identité managée affectée par l’utilisateur dans le portail Azure avant de l’attribuer à un pool Spark Synapse.
Pour mettre à jour l’identité managée du pool Spark Synapse attaché, procédez comme suit :
Ouvrez la page Détail du pool Spark Synapse dans Azure Machine Learning studio.
Localisez l’icône de modification sur le côté droit de la section Identité managée.
Pour affecter une identité managée pour la première fois, activez l’option Affecter une identité managée.
Pour attribuer une identité managée affectée par le système, procédez comme suit :
- Sélectionnez Affectée par le système comme Type d’identité.
- Sélectionnez Update.
Pour attribuer une identité managée affectée par l’utilisateur, procédez comme suit :
- Sélectionnez Affectée par l’utilisateur comme Type d’identité.
- Sélectionnez un abonnement Azure dans le menu déroulant.
- Tapez les premières lettres du nom de l’identité managée affectée par l’utilisateur dans la zone de texte Rechercher par nom. La liste des noms d’identités managées affectées par l’utilisateur correspondants s’affiche. Sélectionnez l’identité managée affectée par l’utilisateur souhaitée dans la liste. Vous pouvez en choisir plusieurs et les attribuer au pool Spark Synapse attaché.
- Sélectionnez Mettre à jour.
Détachement du pool Spark Synapse
Il est parfois nécessaire, pour nettoyer un espace de travail, de détacher un pool Spark Synapse attaché.
- Interface utilisateur du studio
- INTERFACE DE LIGNE DE COMMANDE
- Kit de développement logiciel (SDK) Python
L’interface utilisateur d’Azure Machine Learning studio fournit également un moyen de détacher un pool Spark Synapse attaché. Pour ce faire, procédez comme suit :
Ouvrez la page Détail du pool Spark Synapse dans Azure Machine Learning studio.
Sélectionnez Détacher pour détacher le pool Spark Synapse attaché.
Calcul Spark serverless dans les Notebooks de Azure Machine Learning
Certains scénarios utilisateur peuvent nécessiter l’accès à une ressource de calcul Spark serverless, lors d’une soumission de travaux Azure Machine Learning, sans qu’il soit nécessaire d’attacher un pool Spark. L’intégration Azure Synapse Analytics à Azure Machine Learning offre également une expérience de calcul Spark serverless. Cela permet d’accorder l’accès au calcul Spark dans une tâche sans qu’il y ai besoin de joindre le calcul à un espace de travail au préalable. En savoir plus sur l’expérience de calcul Spark serverless.