Partager via


Azure Machine Learning en tant que produit de données pour l'analytique à l'échelle du cloud

Azure Machine Learning est une plateforme intégrée qui permet de gérer le cycle de vie de machine learning du début à la fin, avec une aide pour la création, l’exploitation et la consommation des modèles et workflows Machine Learning. Voici quelques-uns des avantages offerts par le service :

  • Les fonctionnalités soutiennent les créateurs pour augmenter leur productivité en les aidant à gérer les expériences, à accéder aux données, à effectuer le suivi des travaux, à régler les hyperparamètres et à automatiser les workflows.

  • La possibilité de décrire, de reproduire, d’auditer le modèle et de l’intégrer à DevOps, ainsi qu’un modèle de contrôle de sécurité riche, peuvent aider les opérateurs à répondre aux exigences de gouvernance et de conformité.

  • Les fonctionnalités d’inférence gérée, l’intégration robuste à Azure Compute et les services de données peuvent vous aider à simplifier la façon dont le service est consommé.

Azure Machine Learning couvre tous les aspects du cycle de vie de la science des données. Il couvre l’inscription des banques de données et des jeux de données pour le déploiement de modèles. Il peut être utilisé pour tout type d’apprentissage automatique, du machine learning classique au deep learning. Il inclut l’apprentissage supervisé et non supervisé. Que vous préfériez écrire du code Python ou R, ou des options zéro code/peu de code, comme le concepteur, vous pouvez générer, entraîner et suivre des modèles d’apprentissage automatique classique et profond précis dans un espace de travail Azure Machine Learning.

Azure Machine Learning, la plateforme Azure et les services Azure AI peuvent fonctionner ensemble pour gérer le cycle de vie de machine learning. Un responsable de machine learning peut utiliser Azure Synapse Analytics, Azure SQL Database ou Microsoft Power BI pour commencer à analyser des données et passer à Azure Machine Learning pour le prototypage, la gestion des expérimentations et l’opérationnalisation. Dans les zones d’atterrissage Azure , Azure Machine Learning peut être considéré comme un produit de données.

Azure Machine Learning dans l’analytique à l’échelle du cloud

Une base de zone d’atterrissage CAF (Cloud Adoption Framework), des zones d’atterrissage de données d’analytique à l’échelle du cloud et la configuration d’Azure Machine Learning configurent les professionnels de machine learning avec un environnement préconfiguré sur lequel ils peuvent déployer de manière répétée de nouvelles charges de travail Machine Learning ou migrer des charges de travail existantes. Ces fonctionnalités peuvent aider les professionnels de machine learning à gagner en agilité et en valeur pour le temps passé.

Les principes de conception suivants peuvent guider l’implémentation des zones d’atterrissage Azure Machine Learning :

  • Accès rapide aux données : préconfigurez les composants de stockage de zone d’atterrissage en tant que magasins de données dans l’espace de travail Azure Machine Learning.

  • Collaboration activée : organisez les espaces de travail par projet et centralisez la gestion des accès pour les ressources de zone d’atterrissage afin de permettre à l’ingénierie des données, à la science des données et aux professionnels de machine learning de collaborer.

  • Implémentation sécurisée : par défaut pour chaque déploiement, suivez les bonnes pratiques et utilisez l’isolement réseau, l’identité et la gestion des accès pour sécuriser les ressources de données.

  • Libre-service : les professionnels de machine learning peuvent gagner en agilité et en organisation en explorant les options de déploiement de nouvelles ressources de projet.

  • Séparation des préoccupations entre la gestion et la consommation des données : l’authentification directe basée sur l’identité est le type d’authentification par défaut pour Azure Machine Learning et le stockage.

  • Application de données plus rapide (alignée sur la source) : les zones d’atterrissage Azure Data Factory, Azure Synapse Analytics et Databricks peuvent être préconfigurées pour établir un lien vers Azure Machine Learning.

  • Observabilité : la journalisation centralisée et les configurations de référence peuvent aider à superviser l’environnement.

Vue d’ensemble de l’implémentation

Notes

Cette section recommande des configurations spécifiques à l'analytique à l'échelle du cloud. Elle vient en complément de la documentation Azure Machine Learning et des bonnes pratiques Cloud Adoption Framework.

Organisation et configuration de l’espace de travail

Vous pouvez déployer le nombre d’espaces de travail Machine Learning requis par vos charges de travail et pour chaque zone d’atterrissage que vous déployez. Les recommandations suivantes peuvent vous aider à configurer :

  • Déployez au moins un espace de travail Machine Learning par projet.

  • En fonction du cycle de vie de votre projet Machine Learning, déployez un espace de travail de développement (dev) pour prototyper les cas d’usage et explorer les données à un stade précoce. Pour le travail nécessitant une expérimentation, un test et un déploiement continus, déployez un espace de travail de préproduction et de production.

  • Quand plusieurs environnements sont nécessaires pour les espaces de travail de développement, de préproduction et de production dans une zone d’atterrissage de données, nous vous recommandons d’éviter la duplication de données en faisant en sorte que chaque environnement se trouve dans la même zone d’atterrissage de données de production.

  • Pour en savoir plus sur l’organisation et la configuration des ressources Azure Machine Learning, consultez Organiser et configurer des environnements Azure Machine Learning.

Pour chaque configuration de ressource par défaut dans une zone d’atterrissage de données, un service Azure Machine Learning est déployé dans un groupe de ressources dédié avec les configurations et les ressources dépendantes suivantes :

  • Azure Key Vault
  • Application Insights
  • Azure Container Registry
  • Utilisez Azure Machine Learning pour vous connecter à un compte de stockage Azure et une authentification basée sur l’identité Microsoft Entra pour aider les utilisateurs à se connecter au compte.
  • La journalisation des diagnostics est configurée pour chaque espace de travail et sur une ressource Log Analytics centrale à l’échelle de l’entreprise. Cela peut aider à analyser de manière centralisée les états des ressources et d’intégrité des travaux Azure Machine Learning dans et entre les zones d’atterrissage.
  • Consultez Qu’est-ce qu’un espace de travail Azure Machine Learning ? pour en savoir plus sur les ressources et les dépendances Azure Machine Learning.

Intégration aux services de base de la zone d’atterrissage de données

La zone d’atterrissage de données est fournie avec un ensemble de services par défaut qui sont déployés dans la couche de services de base. Ces services de base peuvent être configurés quand Azure Machine Learning est déployé dans la zone d’atterrissage de données.

  • Connectez les espaces de travail Azure Synapse Analytics ou Databricks en tant que services liés pour intégrer des données et traiter des Big Data.

  • Par défaut, les services de lac de données sont provisionnés dans la zone d’atterrissage de données et les déploiements de produits Azure Machine Learning sont fournis avec des connexions (magasins de données) préconfigurées sur ces comptes de stockage.

Overview of data product analytics for Azure Machine Learning.

Connectivité réseau

Le réseau pour l’implémentation d’Azure Machine Learning dans les zones d’atterrissage Azure est défini avec les bonnes pratiques de sécurité pour Azure Machine Learning et les bonnes pratiques relatives aux réseaux CAF. Ces bonnes pratiques incluent les configurations suivantes :

  • Azure Machine Learning et les ressources dépendantes sont configurés pour utiliser des points de terminaison de liaison privée.
  • Les ressources de calcul managées sont déployées uniquement avec des adresses IP privées.
  • La connectivité réseau au référentiel d’images de base publiques Azure Machine Learning et aux services partenaires comme Azure Artifacts peut être configurée au niveau du réseau.

Gestion de l’identité et de l’accès

Tenez compte des recommandations suivantes pour la gestion des identités et de l’accès utilisateur avec Azure Machine Learning :

  • Les magasins de données dans Azure Machine Learning peuvent être configurés pour utiliser l’authentification basée sur les informations d’identification ou l’identité. Lorsque vous utilisez le contrôle d’accès et les configurations de lacs de données dans Azure Data Lake Storage Gen2, configurez les magasins de données pour utiliser l’authentification basée sur l’identité ; cela permet à Azure Machine Learning d’optimiser les autorisations d’accès utilisateur pour le stockage.

  • Utilisez des groupes Microsoft Entra pour gérer les autorisations des utilisateurs pour les ressources de stockage et de Machine Learning.

  • Azure Machine Learning peut utiliser des identités managées affectées par l’utilisateur pour le contrôle d’accès et limiter la plage d’accès à Azure Container Registry, Key Vault, Azure Storage et Application Insights.

  • Créez des identités managées affectées par l’utilisateur pour des clusters de calcul managés créés dans Azure Machine Learning.

Provisionner l’infrastructure via le libre-service

Le libre-service peut être activé et régi par des stratégies pour Azure Machine Learning. Le tableau suivant répertorie un ensemble de stratégies par défaut lorsque vous déployez Azure Machine Learning. Pour plus d’informations, consultez Définitions de stratégies intégrées Azure Policy pour Azure Machine Learning.

Stratégie Type Informations de référence
Les espaces de travail Azure Machine Learning doivent utiliser Azure Private Link. Intégré Voir dans le portail Azure
Les espaces de travail Azure Machine Learning doivent utiliser des identités managées affectées par l’utilisateur. Intégré Voir dans le portail Azure
[Préversion] : Configurer les registres autorisés pour les capacités de calcul Azure Machine Learning spécifiées. Intégré Voir dans le portail Azure
Configurer les espaces de travail Azure Machine Learning avec des points de terminaison privés. Intégré Voir dans le portail Azure
Configurer les capacités de calcul Machine Learning pour désactiver les méthodes d’authentification locales. Intégré Voir dans le portail Azure
Append-machinelearningcompute-setupscriptscreationscript Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearning-hbiworkspace Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearning-publicaccesswhenbehindvnet Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearning-AKS Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearningcompute-subnetid Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearningcompute-vmsize Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearningcomputecluster-remoteloginportpublicaccess Personnalisé (zones d’atterrissage CAF) Voir sur GitHub
Deny-machinelearningcomputecluster-scale Personnalisé (zones d’atterrissage CAF) Voir sur GitHub

Recommandations pour la gestion de votre environnement

Les zones d’atterrissage de données d’analytique à l’échelle du cloud présentent une implémentation de référence pour les déploiements reproductibles, ce qui peut vous aider à configurer des environnements gérables et gouvernables. Tenez compte des recommandations suivantes pour l’utilisation d’Azure Machine Learning pour gérer votre environnement :

  • Utilisez des groupes Microsoft Entra pour gérer l’accès aux ressources Machine Learning.

  • Publiez un tableau de bord de monitoring central pour superviser l’intégrité du pipeline, l’utilisation du calcul et la gestion des quotas pour Machine Learning.

  • Si vous utilisez traditionnellement des stratégies Azure intégrées et que vous devez répondre à des exigences de conformité supplémentaires, créez des stratégies Azure personnalisées pour améliorer la gouvernance et le libre-service.

  • Pour suivre les coûts de recherche et de développement, déployez un espace de travail Machine Learning dans la zone d’atterrissage en tant que ressource partagée lors des premières phases de l’exploration de votre cas d’usage.

Important

Utilisez des clusters Azure Machine Learning pour l’apprentissage des modèles de qualité production et Azure Kubernetes Service (AKS) pour les déploiements de qualité production.

Conseil

Utilisez Azure Machine Learning pour les projets de science des données. Il couvre le workflow de bout en bout avec des sous-services et des fonctionnalités, et permet d’automatiser entièrement le processus.

Étapes suivantes

Utilisez le modèle Data Product Analytics et les conseils de déploiement d’Azure Machine Learning et consultez la documentation et les tutoriels Azure Machine Learning pour commencer à créer vos solutions.

Pour en savoir plus sur les bonnes pratiques en matière de déploiement et de gestion Azure Machine Learning pour les entreprises, consultez les quatre articles Cloud Adoption Framework suivants :