Partager via


Schéma YAML de l’ensemble de fonctionnalités CLI (v2)

S’APPLIQUE À : Extension ml Azure CLI v2 (actuelle)

Remarque

La syntaxe YAML détaillée dans ce document est basée sur le schéma JSON pour la dernière version de l’extension ML CLI v2. Le fonctionnement de cette syntaxe est garanti uniquement avec la dernière version de l’extension ML CLI v2. Vous trouverez les schémas des versions d’extension plus anciennes sur https://azuremlschemasprod.azureedge.net/.

Syntaxe YAML

Clé Type Description Valeurs autorisées Valeur par défaut
$schema string Schéma YAML. Si vous utilisez l’extension VS Code d’Azure Machine Learning afin de créer le fichier YAML, ajoutez $schema en haut de votre fichier pour appeler des complétions de schémas et de ressources.
name string Obligatoire. Nom de l’ensemble de fonctionnalités.
version string Obligatoire. Version de l’ensemble de fonctionnalités.
description string Description de l’ensemble de fonctionnalités.
specification object Obligatoire. Spécification de l’ensemble de fonctionnalités.
specification.path string Obligatoire Chemin du dossier local de spécification de l’ensemble de fonctionnalités.
entities objet (liste de chaînes) Obligatoire. Entités auxquelles cet ensemble de fonctionnalités est associé.
phase string Étape de l’ensemble de fonctionnalités. Développement, Production, Archivé Développement
tags object Dictionnaire des étiquettes de l’ensemble de fonctionnalités.
materialization_settings object Paramètre de matérialisation de l’ensemble de fonctionnalités.
materialization_settings.offline_enabled boolean Indique si la matérialisation des valeurs de fonctionnalité dans un stockage hors connexion est activée. True, False
materialization_settings.schedule object Planification de la matérialisation. Consultez Schéma YAML de planification CLI (v2)
materialization_settings.schedule.frequency string Obligatoire si la planification est configurée. Énumération qui décrit la fréquence d’une planification de périodicité. Jour, Heure, Minute, Semaine, Mois Jour
materialization_settings.schedule.interval entier Obligatoire si la planification est configurée. Intervalle entre les travaux récurrents.
materialization_settings.schedule.time_zone string Fuseau horaire du déclencheur de planification. UTC
materialization_settings.schedule.start_time string Heure du déclencheur de planification.
materialization_settings.notification object Paramètre de notification de matérialisation.
materialization_settings.notification.email_on objet (liste de chaînes) Obligatoire si la notification est configurée. La notification par e-mail est envoyée quand l’état du travail correspond à ce paramètre. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objet (liste de chaînes) Obligatoire si la notification est configurée. Adresse e-mail à laquelle la notification est envoyée.
materialization_settings.resource object Ressource de calcul Spark Azure Machine Learning utilisée pour le travail de matérialisation.
materialization_settings.resource.instance_type string Type d’instance de calcul Spark Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Consultez Data Wrangling interactif avec Apache Spark dans Azure Machine Learning (préversion) pour obtenir la liste mise à jour des types pris en charge.
materialization_settings.spark_configuration dictionnaire dictionnaire de configuration spark

Notes

La commande az ml feature-set peut être utilisée pour gérer l’ensemble de fonctionnalités.

Exemples

Des exemples sont disponibles dans le référentiel d’exemples GitHub. Vous en trouverez plusieurs ci-dessous.

YAML : de base

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML : avec configuration de matérialisation

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Étapes suivantes