Schéma YAML de l’ensemble de fonctionnalités CLI (v2)
S’APPLIQUE À : Extension ml Azure CLI v2 (actuelle)
Remarque
La syntaxe YAML détaillée dans ce document est basée sur le schéma JSON pour la dernière version de l’extension ML CLI v2. Le fonctionnement de cette syntaxe est garanti uniquement avec la dernière version de l’extension ML CLI v2. Vous trouverez les schémas des versions d’extension plus anciennes sur https://azuremlschemasprod.azureedge.net/.
Syntaxe YAML
Clé | Type | Description | Valeurs autorisées | Valeur par défaut |
---|---|---|---|---|
$schema | string | Schéma YAML. Si vous utilisez l’extension VS Code d’Azure Machine Learning afin de créer le fichier YAML, ajoutez $schema en haut de votre fichier pour appeler des complétions de schémas et de ressources. | ||
name | string | Obligatoire. Nom de l’ensemble de fonctionnalités. | ||
version | string | Obligatoire. Version de l’ensemble de fonctionnalités. | ||
description | string | Description de l’ensemble de fonctionnalités. | ||
specification | object | Obligatoire. Spécification de l’ensemble de fonctionnalités. | ||
specification.path | string | Obligatoire Chemin du dossier local de spécification de l’ensemble de fonctionnalités. | ||
entities | objet (liste de chaînes) | Obligatoire. Entités auxquelles cet ensemble de fonctionnalités est associé. | ||
phase | string | Étape de l’ensemble de fonctionnalités. | Développement, Production, Archivé | Développement |
tags | object | Dictionnaire des étiquettes de l’ensemble de fonctionnalités. | ||
materialization_settings | object | Paramètre de matérialisation de l’ensemble de fonctionnalités. | ||
materialization_settings.offline_enabled | boolean | Indique si la matérialisation des valeurs de fonctionnalité dans un stockage hors connexion est activée. | True, False | |
materialization_settings.schedule | object | Planification de la matérialisation. Consultez Schéma YAML de planification CLI (v2) | ||
materialization_settings.schedule.frequency | string | Obligatoire si la planification est configurée. Énumération qui décrit la fréquence d’une planification de périodicité. | Jour, Heure, Minute, Semaine, Mois | Jour |
materialization_settings.schedule.interval | entier | Obligatoire si la planification est configurée. Intervalle entre les travaux récurrents. | ||
materialization_settings.schedule.time_zone | string | Fuseau horaire du déclencheur de planification. | UTC | |
materialization_settings.schedule.start_time | string | Heure du déclencheur de planification. | ||
materialization_settings.notification | object | Paramètre de notification de matérialisation. | ||
materialization_settings.notification.email_on | objet (liste de chaînes) | Obligatoire si la notification est configurée. La notification par e-mail est envoyée quand l’état du travail correspond à ce paramètre. | JobFailed, JobCompleted, JobCancelled. | |
materialization_settings.notification.emails | objet (liste de chaînes) | Obligatoire si la notification est configurée. Adresse e-mail à laquelle la notification est envoyée. | ||
materialization_settings.resource | object | Ressource de calcul Spark Azure Machine Learning utilisée pour le travail de matérialisation. | ||
materialization_settings.resource.instance_type | string | Type d’instance de calcul Spark Azure Machine Learning. | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Consultez Data Wrangling interactif avec Apache Spark dans Azure Machine Learning (préversion) pour obtenir la liste mise à jour des types pris en charge. | |
materialization_settings.spark_configuration | dictionnaire | dictionnaire de configuration spark |
Notes
La commande az ml feature-set
peut être utilisée pour gérer l’ensemble de fonctionnalités.
Exemples
Des exemples sont disponibles dans le référentiel d’exemples GitHub. Vous en trouverez plusieurs ci-dessous.
YAML : de base
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML : avec configuration de matérialisation
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2