Schemat YAML zestawu funkcji interfejsu wiersza polecenia (wersja 2)

DOTYCZY:Rozszerzenie uczenia maszynowego platformy Azure w wersji 2 (bieżąca)

Uwaga

Składnia YAML opisana w tym dokumencie jest oparta na schemacie JSON dla najnowszej wersji rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Ta składnia jest gwarantowana tylko do pracy z najnowszą wersją rozszerzenia interfejsu wiersza polecenia uczenia maszynowego w wersji 2. Schematy starszych wersji rozszerzeń można znaleźć na stronie https://azuremlschemasprod.azureedge.net/.

Składnia YAML

Klucz Typ Opis Dozwolone wartości Wartość domyślna
$schema ciąg Schemat YAML. Jeśli używasz rozszerzenia programu VS Code usługi Azure Machine Learning do tworzenia pliku YAML, w tym $schema w górnej części pliku, umożliwia wywoływanie schematu i uzupełniania zasobów.
name ciąg Wymagane. Nazwa zestawu funkcji.
Wersja ciąg Wymagane. Wersja zestawu funkcji.
description (opis) ciąg Opis zestawu funkcji.
specyfikacja object Wymagane. Specyfikacja zestawu funkcji.
specification.path ciąg Wymagane Ścieżka do lokalnego folderu specyfikacji zestawu funkcji.
Podmioty object (lista ciągów) Wymagane. Jednostki skojarzone z tym zestawem funkcji.
etap ciąg Etap zestawu funkcji. Programowanie, produkcja, zarchiwizowana Opracowywanie zawartości
tags object Słownik tagów dla zestawu funkcji.
materialization_settings object Ustawienie materializacji zestawu funkcji.
materialization_settings.offline_enabled boolean Czy zmaterializowanie wartości funkcji w magazynie offline jest włączone. Prawda, fałsz
materialization_settings.schedule object Harmonogram materializacji. Zobacz schemat YAML dla harmonogramu interfejsu wiersza polecenia (wersja 2)
materialization_settings.schedule.frequency ciąg Wymagane w przypadku skonfigurowania harmonogramu. Wyliczenie opisujące częstotliwość harmonogramu cyklu. Dzień, Godzina, Minuta, Tydzień, Miesiąc Dzień
materialization_settings.schedule.interval liczba całkowita Wymagane w przypadku skonfigurowania harmonogramu. Interwał między powtarzającymi się zadaniami.
materialization_settings.schedule.time_zone ciąg Strefa czasowa wyzwalacza harmonogramu. UTC
materialization_settings.schedule.start_time ciąg Czas wyzwalacza harmonogramu.
materialization_settings.notification object Ustawienie powiadomienia materializacji.
materialization_settings.notification.email_on object (lista ciągów) Wymagane w przypadku skonfigurowania powiadomienia. Powiadomienie e-mail jest wysyłane, gdy stan zadania jest zgodny z tym ustawieniem. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.email object (lista ciągów) Wymagane w przypadku skonfigurowania powiadomienia. Adres e-mail, do który jest wysyłane powiadomienie.
materialization_settings.resource object Zasób obliczeniowy platformy Spark usługi Azure Machine Learning używany do zadania materializacji.
materialization_settings.resource.instance_type ciąg Typ wystąpienia obliczeniowego platformy Spark usługi Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3, Standard_E64s_v3. Zapoznaj się z tematem Interactive Data Wrangling with Apache Spark in Azure Machine Learning (wersja zapoznawcza), aby uzyskać zaktualizowaną listę obsługiwanych typów.
materialization_settings.spark_configuration Słownik słownik konfiguracji platformy Spark

Uwagi

Polecenie az ml feature-set może służyć do zarządzania zestawem funkcji.

Przykłady

Przykłady są dostępne w repozytorium GitHub przykładów. Poniżej przedstawiono kilka.

YAML: podstawowy

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: z konfiguracją materializacji

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Następne kroki