Dela via


CLI-funktionsuppsättning (v2) YAML-schema

GÄLLER FÖR: Azure CLI ml-tillägget v2 (aktuellt)

Kommentar

YAML-syntaxen som beskrivs i det här dokumentet baseras på JSON-schemat för den senaste versionen av ML CLI v2-tillägget. Den här syntaxen är garanterad att endast fungera med den senaste versionen av ML CLI v2-tillägget. Du hittar scheman för äldre tilläggsversioner på https://azuremlschemasprod.azureedge.net/.

YAML-syntax

Nyckel Typ Beskrivning Tillåtna värden Standardvärde
$schema sträng YAML-schemat. Om du använder Tillägget Azure Mašinsko učenje VS Code för att skapa YAML-filen, inklusive $schema överst i filen, kan du anropa schema- och resursavslutningar.
name sträng Obligatoriskt. Namn på funktionsuppsättning.
version sträng Obligatoriskt. Funktionsuppsättningsversion.
description sträng Beskrivning av funktionsuppsättning.
specifikation objekt Obligatoriskt. Funktionsuppsättningsspecifikation.
specification.path sträng Obligatorisk sökväg till den lokala funktionsuppsättningens specifikationsmapp.
entiteter objekt (lista över sträng) Obligatoriskt. De entiteter som den här funktionsuppsättningen är associerad med.
etapp sträng Scen för funktionsuppsättning. Utveckling, Produktion, Arkiverad Utveckling
taggar objekt Ordlista över taggar för funktionsuppsättningen.
materialization_settings objekt Inställning för materialisering av funktionsuppsättningar.
materialization_settings.offline_enabled boolean Om materialisering av funktionsvärden till offlinelagring är aktiverat. Sant, Falskt
materialization_settings.schedule objekt Materialiseringsschemat. Se CLI-schemaschemat (v2) YAML-schema
materialization_settings.schedule.frequency sträng Krävs om schemat har konfigurerats. Räkna upp för att beskriva frekvensen för ett upprepningsschema. Dag, timme, minut, vecka, månad Dag
materialization_settings.schedule.interval integer Krävs om schemat har konfigurerats. Intervallet mellan återkommande jobb.
materialization_settings.schedule.time_zone sträng Tidszon för schemautlösare. UTC
materialization_settings.schedule.start_time sträng Schemautlösarens tid.
materialization_settings.notification objekt Inställningen för materialiseringsmeddelanden.
materialization_settings.notification.email_on objekt (lista över sträng) Krävs om meddelandet har konfigurerats. E-postmeddelandet skickas när jobbstatusen matchar den här inställningen. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objekt (lista över sträng) Krävs om meddelandet har konfigurerats. E-postadressen som meddelandet skickas till.
materialization_settings.resource objekt Azure Mašinsko učenje Spark-beräkningsresursen som används för materialiseringsjobbet.
materialization_settings.resource.instance_type sträng Azure Mašinsko učenje Spark-beräkningsinstanstyp. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Se Interaktiv dataomvandling med Apache Spark i Azure Mašinsko učenje (förhandsversion) för att få en uppdaterad lista över typer som stöds.
materialization_settings.spark_configuration ordbok ordlista för Spark-konfiguration

Kommentarer

Kommandot az ml feature-set kan användas för att hantera funktionsuppsättningar.

Exempel

Exempel är tillgängliga i GitHub-exempellagringsplatsen. Flera visas nedan.

YAML: basic

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: med materialiseringskonfiguration

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Nästa steg