Glossaire Azure Machine Learning

Le glossaire Azure Machine Learning est un bref dictionnaire de terminologie pour la plateforme de Machine Learning. Pour connaître la terminologie générale d’Azure, consultez également :

Composant

Un composant de Machine Learning est un élément de code autonome qui effectue une étape dans un pipeline de Machine Learning. Les composants sont la base des pipelines Machine Learning avancés. Les composants peuvent effectuer des tâches telles que le traitement de données, l’entraînement de modèle et le scoring de modèle. Un composant est analogue à une fonction. Il a un nom et des paramètres, attend une entrée et retourne la sortie.

Compute

Un calcul est une ressource de calcul désignée où vous exécutez votre travail ou hébergez votre point de terminaison. Le Machine Learning prend en charge les types de calcul suivants :

  • Cluster de calcul : infrastructure de calcul managée que vous pouvez utiliser pour créer facilement un cluster de nœuds de calcul processeur ou GPU dans le cloud.

    Remarque

    Au lieu de créer un cluster de calcul, utilisez calcul serverless pour décharger la gestion du cycle de vie du calcul dans Azure Machine Learning.

  • Instance de calcul : environnement de développement entièrement configuré et géré dans le cloud. Vous pouvez utiliser l’instance comme un calcul d’entraînement ou d’inférence pour le développement et le test. Elle est similaire à une machine virtuelle dans le cloud.

  • Cluster Kubernetes : utilisé pour déployer des modèles de Machine Learning entraînés sur Azure Kubernetes Service (AKS). Vous pouvez créer un cluster AKS à partir de votre espace de travail Machine Learning ou attacher un cluster AKS existant.

  • Calcul attaché : vous pouvez attacher vos propres ressources de calcul à votre espace de travail et les utiliser pour l’entraînement et l’inférence.

Données

Le Machine Learning vous permet d’utiliser différents types de données :

  • URI (emplacement dans le stockage local ou cloud) :
    • uri_folder
    • uri_file
  • Tables (abstraction de données tabulaires) :
    • mltable
  • Primitives :
    • string
    • boolean
    • number

Pour la plupart des scénarios, vous utilisez des URI (uri_folder et uri_file) pour identifier un emplacement dans le stockage qui peut être facilement mappé au système de fichiers d’un nœud de calcul dans un travail en montant ou en téléchargeant le stockage sur le nœud.

Le paramètre mltable est une abstraction pour les données tabulaires utilisées pour les travaux AutoML automatisés, les travaux parallèles et certains scénarios avancés. Si vous commencez à utiliser le Machine Learning et que vous n’utilisez pas AutoML, nous vous encourageons vivement à commencer par des URI.

Magasin de données

Les magasins de données de Machine Learning conservent en toute sécurité les informations de connexion à votre stockage de données sur Azure afin que vous n’ayez pas à les coder dans vos scripts. Vous pouvez inscrire et créer un magasin de données pour vous connecter facilement à votre compte de stockage, et accéder aux données de votre service de stockage sous-jacent. Azure Machine Learning CLI v2 et SDK v2 prennent en charge les types de services de stockage cloud suivants :

  • Conteneur de stockage d'objets blob Azure
  • Partage Azure Files
  • Azure Data Lake Storage
  • Azure Data Lake Storage Gen2

Environnement

Les environnements de Machine Learning sont une encapsulation de l’environnement où se produit votre tâche de Machine Learning. Ils spécifient les packages logiciels, variables d’environnement et paramètres logiciels pour vos scripts d’entraînement et de scoring. Les environnements sont des entités managées et versionées au sein de votre espace de travail Machine Learning. Les environnements permettent d’avoir des flux de travail d’apprentissage automatique reproductibles, auditables et portables dans divers calculs.

Types d’environnement

Le Machine Learning prend en charge deux types d’environnements : organisés et personnalisés.

Les environnements organisés sont fournis par le Machine Learning et sont disponibles dans votre espace de travail par défaut. Elles sont destinées à être utilisées comme c’est le cas. Ils contiennent des collections de packages et paramètres Python destinés à vous aider à prendre en main diverses infrastructures de Machine Learning. Ces environnements précréés permettent également d’accélérer le déploiement. Pour récupérer la liste complète des environnements disponibles, consultez Environnements Azure Machine Learning avec l’interface CLI et le kit de développement logiciel (SDK) (v2).

Dans les environnements personnalisés, vous êtes responsable de la configuration de votre environnement. Veillez à installer les packages et autres dépendances dont votre script d’apprentissage ou de scoring a besoin sur le calcul. Le Machine Learning vous permet de créer votre propre environnement à l’aide :

  • D’une image Docker.
  • D’une image Docker de base avec un YAML conda pour personnaliser davantage.
  • D’un contexte de build Docker.

Modèle

Les modèles de Machine Learning se composent des fichiers binaires qui représentent un modèle Machine Learning et toutes les métadonnées correspondantes. Vous pouvez créer des modèles à partir d’un fichier ou d’un répertoire local ou distant. Pour les emplacements distants, les emplacements https, wasbset azureml sont pris en charge. Le modèle créé est suivi dans l’espace de travail sous le nom et la version spécifiés. Le Machine Learning prend en charge trois types de format de stockage pour les modèles :

  • custom_model
  • mlflow_model
  • triton_model

Espace de travail

L’espace de travail est la ressource de niveau supérieur pour le Machine Learning. Il fournit un emplacement centralisé pour travailler avec tous les artefacts que vous créez lorsque vous utilisez le Machine Learning. L’espace de travail conserve un historique de toutes les travaux, y compris les journaux, les métriques, la sortie et un instantané de vos scripts. L’espace de travail stocke les références à des ressources comme les magasins de données et le calcul. Il contient également toutes les ressources telles que les modèles, les environnements, les composants et les ressources de données.

Étapes suivantes

Qu'est-ce que Microsoft Azure Machine Learning ?