YAML-Schema für Funktionsgruppen der CLI (v2)
GILT FÜR Azure CLI-ML-Erweiterung v2 (aktuell)
Hinweis
Die in diesem Dokument beschriebene YAML-Syntax basiert auf dem JSON-Schema für die neueste Version der ML CLI v2-Erweiterung. Die Funktion dieser Syntax wird nur mit der neuesten Version der ML CLI v2-Erweiterung garantiert. Die Schemas für ältere Erweiterungsversionen finden Sie unter https://azuremlschemasprod.azureedge.net/.
YAML-Syntax
Schlüssel | type | BESCHREIBUNG | Zulässige Werte | Standardwert |
---|---|---|---|---|
$schema | Zeichenfolge | Das YAML-Schema. Wenn Sie die Erweiterung „VS Code“ für Azure Machine Learning zum Erstellen einer YAML-Datei verwenden, können Sie durch das Einfügen von „$schema“ am Anfang der Datei Schema- und Ressourcenvervollständigungen aufrufen. | ||
name | Zeichenfolge | Erforderlich. Name der Funktionsgruppe. | ||
version | Zeichenfolge | Erforderlich. Version der Funktionsgruppe. | ||
description | Zeichenfolge | Beschreibung der Funktionsgruppe. | ||
specification | Objekt (object) | Erforderlich. Spezifikation der Funktionsgruppe. | ||
specification.path | Zeichenfolge | Erforderlich. Pfad zum lokalen Ordner mit der Funktionsgruppenspezifikation. | ||
entities | Objekt (Zeichenfolgenliste) | Erforderlich. Die Entitäten, denen diese Funktionsgruppe zugeordnet ist. | ||
Stufe | Zeichenfolge | Phase der Funktionsgruppe. | „Entwicklung“, „Produktion“, „Archiviert“ | Entwicklung |
tags | Objekt (object) | Wörterbuch der Tags für die Funktionsgruppe. | ||
materialization_settings | Objekt (object) | Materialisierungseinstellung für die Funktionsgruppe. | ||
materialization_settings.offline_enabled | boolean | Gibt an, ob die Materialisierung von Featurewerten für einen Offlinespeicher aktiviert ist. | TRUE, FALSE | |
materialization_settings.schedule | Objekt (object) | Der Materialisierungszeitplan. Weitere Informationen finden Sie unter CLI (v2) Zeitplan für YAML-Schema. | ||
materialization_settings.schedule.frequency | Zeichenfolge | Erforderlich, wenn der Zeitplan konfiguriert ist. Enumeration, um die Frequenz eines Wiederholungszeitplans zu beschreiben. | Tag, Stunde, Minute, Woche, Monat | Tag |
materialization_settings.schedule.interval | integer | Erforderlich, wenn der Zeitplan konfiguriert ist. Das Intervall zwischen wiederkehrenden Aufträgen. | ||
materialization_settings.schedule.time_zone | Zeichenfolge | Die Zeitzone des Plantriggers. | UTC | |
materialization_settings.schedule.start_time | Zeichenfolge | Die Zeit des Plantriggers. | ||
materialization_settings.notification | Objekt (object) | Die Einstellung für die Materialisierungsbenachrichtigung. | ||
materialization_settings.notification.email_on | Objekt (Zeichenfolgenliste) | Erforderlich, wenn die Benachrichtigung konfiguriert ist. Die E-Mail-Benachrichtigung wird gesendet, wenn der Auftragsstatus dieser Einstellung entspricht. | JobFailed, JobCompleted, JobCancelled | |
materialization_settings.notification.emails | Objekt (Zeichenfolgenliste) | Erforderlich, wenn die Benachrichtigung konfiguriert ist. Die E-Mail-Adresse, an die die Benachrichtigung gesendet wird. | ||
materialization_settings.resource | Objekt (object) | Die Azure Machine Learning-Spark-Computeressource, die für den Materialisierungsauftrag verwendet wird. | ||
materialization_settings.resource.instance_type | Zeichenfolge | Der Typ der Spark-Compute-Instanz von Azure Machine Learning. | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Eine aktualisierte Liste der unterstützten Typen finden Sie unter Interaktives Data Wrangling mit Apache Spark in Azure Machine Learning (Vorschau). | |
materialization_settings.spark_configuration | dictionary | Wörterbuch der Spark-Konfiguration |
Bemerkungen
Der Befehl az ml feature-set
kann zum Verwalten der Funktionsgruppe verwendet werden.
Beispiele
Beispiele finden Sie im GitHub-Beispielrepository. Im Folgenden sind mehrere aufgeführt.
YAML: Grundlagen
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML: Mit Materialisierungskonfiguration
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2