Freigeben über


YAML-Schema für Funktionsgruppen der CLI (v2)

GILT FÜR Azure CLI-ML-Erweiterung v2 (aktuell)

Hinweis

Die in diesem Dokument beschriebene YAML-Syntax basiert auf dem JSON-Schema für die neueste Version der ML CLI v2-Erweiterung. Die Funktion dieser Syntax wird nur mit der neuesten Version der ML CLI v2-Erweiterung garantiert. Die Schemas für ältere Erweiterungsversionen finden Sie unter https://azuremlschemasprod.azureedge.net/.

YAML-Syntax

Schlüssel type BESCHREIBUNG Zulässige Werte Standardwert
$schema Zeichenfolge Das YAML-Schema. Wenn Sie die Erweiterung „VS Code“ für Azure Machine Learning zum Erstellen einer YAML-Datei verwenden, können Sie durch das Einfügen von „$schema“ am Anfang der Datei Schema- und Ressourcenvervollständigungen aufrufen.
name Zeichenfolge Erforderlich. Name der Funktionsgruppe.
version Zeichenfolge Erforderlich. Version der Funktionsgruppe.
description Zeichenfolge Beschreibung der Funktionsgruppe.
specification Objekt (object) Erforderlich. Spezifikation der Funktionsgruppe.
specification.path Zeichenfolge Erforderlich. Pfad zum lokalen Ordner mit der Funktionsgruppenspezifikation.
entities Objekt (Zeichenfolgenliste) Erforderlich. Die Entitäten, denen diese Funktionsgruppe zugeordnet ist.
Stufe Zeichenfolge Phase der Funktionsgruppe. „Entwicklung“, „Produktion“, „Archiviert“ Entwicklung
tags Objekt (object) Wörterbuch der Tags für die Funktionsgruppe.
materialization_settings Objekt (object) Materialisierungseinstellung für die Funktionsgruppe.
materialization_settings.offline_enabled boolean Gibt an, ob die Materialisierung von Featurewerten für einen Offlinespeicher aktiviert ist. TRUE, FALSE
materialization_settings.schedule Objekt (object) Der Materialisierungszeitplan. Weitere Informationen finden Sie unter CLI (v2) Zeitplan für YAML-Schema.
materialization_settings.schedule.frequency Zeichenfolge Erforderlich, wenn der Zeitplan konfiguriert ist. Enumeration, um die Frequenz eines Wiederholungszeitplans zu beschreiben. Tag, Stunde, Minute, Woche, Monat Tag
materialization_settings.schedule.interval integer Erforderlich, wenn der Zeitplan konfiguriert ist. Das Intervall zwischen wiederkehrenden Aufträgen.
materialization_settings.schedule.time_zone Zeichenfolge Die Zeitzone des Plantriggers. UTC
materialization_settings.schedule.start_time Zeichenfolge Die Zeit des Plantriggers.
materialization_settings.notification Objekt (object) Die Einstellung für die Materialisierungsbenachrichtigung.
materialization_settings.notification.email_on Objekt (Zeichenfolgenliste) Erforderlich, wenn die Benachrichtigung konfiguriert ist. Die E-Mail-Benachrichtigung wird gesendet, wenn der Auftragsstatus dieser Einstellung entspricht. JobFailed, JobCompleted, JobCancelled
materialization_settings.notification.emails Objekt (Zeichenfolgenliste) Erforderlich, wenn die Benachrichtigung konfiguriert ist. Die E-Mail-Adresse, an die die Benachrichtigung gesendet wird.
materialization_settings.resource Objekt (object) Die Azure Machine Learning-Spark-Computeressource, die für den Materialisierungsauftrag verwendet wird.
materialization_settings.resource.instance_type Zeichenfolge Der Typ der Spark-Compute-Instanz von Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Eine aktualisierte Liste der unterstützten Typen finden Sie unter Interaktives Data Wrangling mit Apache Spark in Azure Machine Learning (Vorschau).
materialization_settings.spark_configuration dictionary Wörterbuch der Spark-Konfiguration

Bemerkungen

Der Befehl az ml feature-set kann zum Verwalten der Funktionsgruppe verwendet werden.

Beispiele

Beispiele finden Sie im GitHub-Beispielrepository. Im Folgenden sind mehrere aufgeführt.

YAML: Grundlagen

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: Mit Materialisierungskonfiguration

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Nächste Schritte