Esquema YAML do conjunto de funcionalidades da CLI (v2)
APLICA-SE A:Extensão v2 da CLI do Azure (atual)
Nota
A sintaxe YAML detalhada neste documento baseia-se no esquema JSON para a versão mais recente da extensão da CLI v2 do ML. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão da CLI v2 do ML. Pode encontrar os esquemas para versões de extensões mais antigas em https://azuremlschemasprod.azureedge.net/.
Sintaxe YAML
Chave | Tipo | Description | Valores permitidos | Valor predefinido |
---|---|---|---|---|
$schema | string | O esquema YAML. Se utilizar a extensão do VS Code do Azure Machine Learning para criar o ficheiro YAML, incluindo $schema na parte superior do ficheiro, permite-lhe invocar conclusões de esquemas e recursos. | ||
name | string | Obrigatório. Nome do conjunto de funcionalidades. | ||
versão | string | Obrigatório. Versão do conjunto de funcionalidades. | ||
descrição | string | Descrição do conjunto de funcionalidades. | ||
especificação | objeto | Obrigatório. Especificação do conjunto de funcionalidades. | ||
specification.path | string | Obrigatório Caminho para a pasta de especificações do conjunto de funcionalidades local. | ||
entidades | objeto (lista de cadeia) | Obrigatório. As entidades a que este conjunto de funcionalidades está associado. | ||
palco | string | Fase do conjunto de funcionalidades. | Desenvolvimento, Produção, Arquivado | Desenvolvimento |
etiquetas | objeto | Dicionário de etiquetas para o conjunto de funcionalidades. | ||
materialization_settings | objeto | Definição de materialização do conjunto de funcionalidades. | ||
materialization_settings.offline_enabled | boolean | Se a materialização de valores de funcionalidades para um armazenamento offline está ativada. | Verdadeiro, Falso | |
materialization_settings.schedule | objeto | O agendamento de materialização. Veja Esquema YAML de agendamento da CLI (v2) | ||
materialization_settings.schedule.frequency | string | Necessário se a agenda estiver configurada. Enumerar para descrever a frequência de uma agenda de periodicidade. | Dia, Hora, Minuto, Semana, Mês | Dia |
materialization_settings.schedule.interval | número inteiro | Necessário se a agenda estiver configurada. O intervalo entre tarefas recorrentes. | ||
materialization_settings.schedule.time_zone | string | A agenda aciona o fuso horário. | UTC | |
materialization_settings.schedule.start_time | string | A hora do acionador da agenda. | ||
materialization_settings.notification | objeto | A definição de notificação de materialização. | ||
materialization_settings.notification.email_on | objeto (lista de cadeia) | Necessário se a notificação estiver configurada. A notificação por e-mail é enviada quando o estado da tarefa corresponde a esta definição. | JobFailed, JobCompleted, JobCancelled. | |
materialization_settings.notification.emails | objeto (lista de cadeia) | Necessário se a notificação estiver configurada. O endereço de e-mail para o qual a notificação é enviada. | ||
materialization_settings.resource | objeto | O recurso de computação do Apache Spark do Azure Machine Learning utilizado para a tarefa de materialização. | ||
materialization_settings.resource.instance_type | string | Tipo de instância de computação do Apache Spark do Azure Machine Learning. | Standard_E4s_v3, Standard_E8s_v3, Standard_E16s_v3, Standard_E32s_v3 Standard_E64s_v3. Veja Interactive Data Wrangling with Apache Spark in Azure Machine Learning (preview) (Wrangling de Dados Interativos com o Apache Spark no Azure Machine Learning [pré-visualização]) para obter uma lista atualizada de tipos suportados. | |
materialization_settings.spark_configuration | dicionário | dicionário da configuração do Spark |
Observações
O az ml feature-set
comando pode ser utilizado para gerir o conjunto de funcionalidades.
Exemplos
Estão disponíveis exemplos nos exemplos de repositório do GitHub. São apresentados vários abaixo.
YAML: básico
$schema: http://azureml/sdk-2-0/Featureset.json
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
YAML: com a configuração de materialização
name: transactions
version: "1"
description: 7-day and 3-day rolling aggregation of transactions featureset
specification:
path: ./spec # path to feature set specification folder. Can be local (absolute path or relative path to current location) or cloud uri. Contains FeatureSetSpec.yaml + transformation code
entities: # entities associated with this feature-set
- azureml:account:1
stage: Development
materialization_settings:
offline_enabled: True
schedule: # we use existing definition of schedule under job with some constraints. Recurrence pattern will not be supported.
type: recurrence # Only recurrence type would be supported
frequency: Day # Only support Day and Hour
interval: 1 #every day
time_zone: "Pacific Standard Time"
notification:
email_on:
- JobFailed
emails:
- alice@microsoft.com
resource:
instance_type: Standard_E8S_V3
spark_configuration:
spark.driver.cores: 4
spark.driver.memory: 36g
spark.executor.cores: 4
spark.executor.memory: 36g
spark.executor.instances: 2