Delen via


YAML-schema voor CLI-onderdelenset (v2)

VAN TOEPASSING OP:Azure CLI ml-extensie v2 (huidig)

Notitie

De YAML-syntaxis die in dit document wordt beschreven, is gebaseerd op het JSON-schema voor de nieuwste versie van de ML CLI v2-extensie. Deze syntaxis werkt gegarandeerd alleen met de nieuwste versie van de ML CLI v2-extensie. U vindt de schema's voor oudere extensieversies op https://azuremlschemasprod.azureedge.net/.

YAML-syntaxis

Sleutel Type Description Toegestane waarden Standaardwaarde
$schema tekenreeks Het YAML-schema. Als u de Azure Machine Learning VS Code-extensie gebruikt om het YAML-bestand te maken, inclusief $schema boven aan het bestand, kunt u schema- en resourcevoltooiingen aanroepen.
naam tekenreeks Vereist. Naam van functieset.
versie tekenreeks Vereist. Versie van functieset.
beschrijving tekenreeks Beschrijving van functieset.
Specificatie object Vereist. Specificatie van functieset.
specification.path tekenreeks Vereist Pad naar de map met lokale functiesetspecificatie.
entiteiten object (lijst met tekenreeksen) Vereist. De entiteiten waaraan deze functieset is gekoppeld.
fase tekenreeks Fase functieset. Ontwikkeling, Productie, Gearchiveerd Ontwikkeling
tags object Woordenlijst met tags voor de functieset.
materialization_settings object Materialisatie-instelling van functieset.
materialization_settings.offline_enabled booleaans Of het materialiseren van functiewaarden naar een offlineopslag is ingeschakeld. Waar, Onwaar
materialization_settings.schedule object Het materialisatieschema. Zie YAML-schema voor CLI (v2) plannen
materialization_settings.schedule.frequency tekenreeks Vereist als planning is geconfigureerd. Opsomming om de frequentie van een terugkeerschema te beschrijven. Dag, Uur, Minuut, Week, Maand Dag
materialization_settings.schedule.interval geheel getal Vereist als planning is geconfigureerd. Het interval tussen terugkerende taken.
materialization_settings.schedule.time_zone tekenreeks De tijdzone van de planningsactiveer. UTC
materialization_settings.schedule.start_time tekenreeks De tijd van de planningstrigger.
materialization_settings.notification object De instelling voor materialisatiemeldingen.
materialization_settings.notification.email_on object (lijst met tekenreeksen) Vereist als de melding is geconfigureerd. De e-mailmelding wordt verzonden wanneer de taakstatus overeenkomt met deze instelling. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails object (lijst met tekenreeksen) Vereist als de melding is geconfigureerd. Het e-mailadres waarnaar de melding wordt verzonden.
materialization_settings.resource object De Azure Machine Learning Spark-rekenresource die wordt gebruikt voor de materialisatietaak.
materialization_settings.resource.instance_type tekenreeks Type Azure Machine Learning Spark-rekenproces. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Raadpleeg Interactive Data Wrangling with Apache Spark in Azure Machine Learning (preview) (Interactive Data Wrangling with Apache Spark in Azure Machine Learning (preview) (preview) voor een bijgewerkte lijst met ondersteunde typen.
materialization_settings.spark_configuration Woordenboek woordenlijst van spark-configuratie

Opmerkingen

De az ml feature-set opdracht kan worden gebruikt voor het beheren van de functieset.

Voorbeelden

Voorbeelden zijn beschikbaar in de GitHub-voorbeeldopslagplaats. Hieronder ziet u een aantal.

YAML: basic

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: met materialisatieconfiguratie

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Volgende stappen