Partilhar via


Esquema YAML do conjunto de funcionalidades da CLI (v2)

APLICA-SE A:Extensão v2 da CLI do Azure (atual)

Nota

A sintaxe YAML detalhada neste documento baseia-se no esquema JSON para a versão mais recente da extensão da CLI v2 do ML. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão da CLI v2 do ML. Pode encontrar os esquemas para versões de extensões mais antigas em https://azuremlschemasprod.azureedge.net/.

Sintaxe YAML

Chave Tipo Description Valores permitidos Valor predefinido
$schema string O esquema YAML. Se utilizar a extensão do VS Code do Azure Machine Learning para criar o ficheiro YAML, incluindo $schema na parte superior do ficheiro, permite-lhe invocar conclusões de esquemas e recursos.
name string Obrigatório. Nome do conjunto de funcionalidades.
versão string Obrigatório. Versão do conjunto de funcionalidades.
descrição string Descrição do conjunto de funcionalidades.
especificação objeto Obrigatório. Especificação do conjunto de funcionalidades.
specification.path string Obrigatório Caminho para a pasta de especificações do conjunto de funcionalidades local.
entidades objeto (lista de cadeia) Obrigatório. As entidades a que este conjunto de funcionalidades está associado.
palco string Fase do conjunto de funcionalidades. Desenvolvimento, Produção, Arquivado Desenvolvimento
etiquetas objeto Dicionário de etiquetas para o conjunto de funcionalidades.
materialization_settings objeto Definição de materialização do conjunto de funcionalidades.
materialization_settings.offline_enabled boolean Se a materialização de valores de funcionalidades para um armazenamento offline está ativada. Verdadeiro, Falso
materialization_settings.schedule objeto O agendamento de materialização. Veja Esquema YAML de agendamento da CLI (v2)
materialization_settings.schedule.frequency string Necessário se a agenda estiver configurada. Enumerar para descrever a frequência de uma agenda de periodicidade. Dia, Hora, Minuto, Semana, Mês Dia
materialization_settings.schedule.interval número inteiro Necessário se a agenda estiver configurada. O intervalo entre tarefas recorrentes.
materialization_settings.schedule.time_zone string A agenda aciona o fuso horário. UTC
materialization_settings.schedule.start_time string A hora do acionador da agenda.
materialization_settings.notification objeto A definição de notificação de materialização.
materialization_settings.notification.email_on objeto (lista de cadeia) Necessário se a notificação estiver configurada. A notificação por e-mail é enviada quando o estado da tarefa corresponde a esta definição. JobFailed, JobCompleted, JobCancelled.
materialization_settings.notification.emails objeto (lista de cadeia) Necessário se a notificação estiver configurada. O endereço de e-mail para o qual a notificação é enviada.
materialization_settings.resource objeto O recurso de computação do Apache Spark do Azure Machine Learning utilizado para a tarefa de materialização.
materialization_settings.resource.instance_type string Tipo de instância de computação do Apache Spark do Azure Machine Learning. Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Veja Interactive Data Wrangling with Apache Spark in Azure Machine Learning (preview) (Wrangling de Dados Interativos com o Apache Spark no Azure Machine Learning [pré-visualização]) para obter uma lista atualizada de tipos suportados.
materialization_settings.spark_configuration dicionário dicionário da configuração do Spark

Observações

O az ml feature-set comando pode ser utilizado para gerir o conjunto de funcionalidades.

Exemplos

Estão disponíveis exemplos nos exemplos de repositório do GitHub. São apresentados vários abaixo.

YAML: básico

$schema: http://azureml/sdk-2-0/Featureset.json

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development

YAML: com a configuração de materialização

name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
  path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
  - azureml:account:1
stage: Development
materialization_settings:
    offline_enabled: True
    schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
        type: recurrence  # Only recurrence type would be supported
        frequency: Day # Only support Day and Hour
        interval: 1 #every day
        time_zone: "Pacific Standard Time"
    notification: 
        email_on:
        - JobFailed
        emails:
        - alice@microsoft.com

    resource:
        instance_type: Standard_E8S_V3
    spark_configuration:
        spark.driver.cores: 4
        spark.driver.memory: 36g
        spark.executor.cores: 4
        spark.executor.memory: 36g
        spark.executor.instances: 2

Passos seguintes