Share via


RegressionJob Classe

Configuração da Tarefa de Regressão autoML.

Inicialize uma nova tarefa de Regressão autoML.

Herança
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular
RegressionJob

Construtor

RegressionJob(*, primary_metric: str | None = None, **kwargs)

Parâmetros

primary_metric
str
Necessário

A métrica primária a utilizar para otimização

kwargs
dict
Necessário

Argumentos específicos da tarefa

Métodos

dump

Captura o conteúdo da tarefa num ficheiro no formato YAML.

set_data

Definir a configuração de dados.

set_featurization

Definir a configuração de engenharia de funcionalidades.

set_limits

Defina limites para a tarefa.

set_training

O método para configurar as definições relacionadas com a preparação.

dump

Captura o conteúdo da tarefa num ficheiro no formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parâmetros

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Necessário

O caminho local ou o fluxo de ficheiros para o qual escrever o conteúdo YAML. Se dest for um caminho de ficheiro, será criado um novo ficheiro. Se dest for um ficheiro aberto, o ficheiro será escrito diretamente.

kwargs
dict

Argumentos adicionais para passar para o serializador YAML.

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_data

Definir a configuração de dados.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

Parâmetros

training_data
Input

Dados de preparação.

target_column_name
str

Nome da coluna de destino.

weight_column_name
Optional[str]

Nome da coluna de peso, predefinição para Nenhum

validation_data
Optional[Input]

Dados de validação, predefinições para Nenhum

validation_data_size
Optional[float]

Tamanho dos dados de validação, predefinição para Nenhum

n_cross_validations
Optional[Union[str, int]]

n_cross_validations, predefinições para Nenhum

cv_split_column_names
Optional[List[str]]

cv_split_column_names, predefinição para Nenhum

test_data
Optional[Input]

Testar dados, predefinições para Nenhum

test_data_size
Optional[float]

Tamanho dos dados de teste, predefinições para Nenhum

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_featurization

Definir a configuração de engenharia de funcionalidades.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

Parâmetros

blocked_transformers
Optional[List[Union[BlockedTransformers, str]]]

Uma lista de nomes de transformadores a serem bloqueados durante a caracterização, predefinições para Nenhum

column_name_and_types
Optional[Dict[str, str]]

Um dicionário de nomes de colunas e tipos de funcionalidades utilizados para atualizar a finalidade da coluna, predefinições para Nenhum

dataset_language
Optional[str]

Código ISO 639-3 de três carateres para os idiomas contidos no conjunto de dados. Os idiomas que não o inglês só são suportados se utilizar computação ativada por GPU. A language_code "mula" deve ser utilizada se o conjunto de dados contiver vários idiomas. Para localizar códigos ISO 639-3 para idiomas diferentes, veja https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, predefinições para Nenhum

transformer_params
Optional[Dict[str, List[ColumnTransformer]]]

Um dicionário do transformador e dos parâmetros de personalização correspondentes, predefinições para Nenhum

mode
Optional[str]

"off", "auto", defaults to "auto", defaults to None

enable_dnn_featurization
Optional[bool]

Se pretende incluir métodos de engenharia de funcionalidades baseados em DNN, a predefinição é Nenhuma

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_limits

Defina limites para a tarefa.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Parâmetros

enable_early_termination
Optional[bool]

Se ativar a terminação antecipada se a classificação não estiver a melhorar a curto prazo, a predefinição é Nenhuma.

Lógica de paragem precoce:

  • Nenhuma paragem antecipada para as primeiras 20 iterações (marcos).

  • A janela de paragem antecipada começa na 21.ª iteração e procura iterações early_stopping_n_iters

    (atualmente definido como 10). Isto significa que a primeira iteração onde a paragem pode ocorrer é a 31ª.

  • O AutoML ainda agenda 2 iterações de conjunto após a paragem antecipada, o que pode resultar em pontuações mais altas.

  • A paragem antecipada é acionada se o valor absoluto da melhor classificação calculada for o mesmo para o passado

    early_stopping_n_iters iterações, ou seja, se não houver melhorias na classificação para iterações early_stopping_n_iters.

exit_score
Optional[float]

Classificação de destino para experimentação. A experimentação termina depois de esta classificação ser atingida. Se não for especificada (sem critérios), a experimentação é executada até que não sejam feitos mais progressos na métrica primária. Para obter mais informações sobre critérios de saída, veja este artigo , predefinições para Nenhum

max_concurrent_trials
Optional[int]

Este é o número máximo de iterações que seriam executadas em paralelo. O valor predefinido é 1.

  • Os clusters AmlCompute suportam uma iteração em execução por nó.

Para múltiplas execuções principais de experimentação autoML executadas em paralelo num único cluster AmlCompute, a soma dos max_concurrent_trials valores de todas as experimentações deve ser menor ou igual ao número máximo de nós. Caso contrário, as execuções serão colocadas em fila até que os nós estejam disponíveis.

  • A DSVM suporta várias iterações por nó. max_concurrent_trials deve

ser menor ou igual ao número de núcleos na DSVM. Para várias experimentações executadas em paralelo numa única DSVM, a soma dos max_concurrent_trials valores para todas as experimentações deve ser menor ou igual ao número máximo de nós.

  • Databricks – max_concurrent_trials deve ser menor ou igual ao número de

nós de trabalho no Databricks.

max_concurrent_trials não se aplica a execuções locais. Anteriormente, este parâmetro era denominado concurrent_iterations.

max_cores_per_trial
Optional[int]

O número máximo de threads a utilizar para uma determinada iteração de preparação. Valores aceitáveis:

  • Maior que 1 e menor ou igual ao número máximo de núcleos no destino de computação.

  • Igual a -1, o que significa utilizar todos os núcleos possíveis por iteração por execução subordinada.

  • Igual a 1, a predefinição.

max_nodes
Optional[int]

[Experimental] O número máximo de nós a utilizar para preparação distribuída.

  • Para a previsão, cada modelo é preparado com nós máximo(2, int(max_nodes/max_concurrent_trials)).

  • Para classificação/regressão, cada modelo é preparado com max_nodes nós.

Nota: este parâmetro está em pré-visualização pública e poderá mudar no futuro.

max_trials
Optional[int]

O número total de diferentes combinações de algoritmos e parâmetros a testar durante uma experimentação de ML automatizada. Se não for especificado, a predefinição é 1000 iterações.

timeout_minutes
Optional[int]

Período máximo de tempo em minutos que todas as iterações combinadas podem demorar até que a experimentação termine. Se não for especificado, o tempo limite da experimentação predefinido é de 6 dias. Para especificar um tempo limite inferior ou igual a 1 hora, certifique-se de que o tamanho do conjunto de dados não é superior a 10 000 000 (linhas vezes coluna) ou resultados de erros, predefinições para Nenhum

trial_timeout_minutes
Optional[int]

Tempo máximo em minutos para o qual cada iteração pode ser executada antes de terminar. Se não for especificado, é utilizado um valor de 1 mês ou 43200 minutos, predefinição para Nenhum

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_training

O método para configurar as definições relacionadas com a preparação.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

Parâmetros

enable_onnx_compatible_models
Optional[bool]

Quer ativar ou desativar a imposição dos modelos compatíveis com ONNX. A predefinição é Falso. Para obter mais informações sobre o Open Neural Network Exchange (ONNX) e o Azure Machine Learning, veja este artigo.

enable_dnn_training
Optional[bool]

Se pretende incluir modelos baseados em DNN durante a seleção de modelos. No entanto, a predefinição é True para tarefas NLP DNN e é Falso para todas as outras tarefas de AutoML.

enable_model_explainability
Optional[bool]

Se pretende ativar a explicação do melhor modelo autoML no final de todas as iterações de preparação autoML. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos na aprendizagem automática automatizada). , predefinições para Nenhum

enable_stack_ensemble
Optional[bool]

Quer ativar/desativar a iteração stackEnsemble. Se enable_onnx_compatible_models sinalizador estiver a ser definido, a iteração StackEnsemble será desativada. Da mesma forma, para tarefas do Timeseries, a iteração StackEnsemble será desativada por predefinição, para evitar riscos de sobreajuste devido ao pequeno conjunto de preparação utilizado na adaptação do meta-aluno. Para obter mais informações sobre conjuntos, veja Configuração do conjunto , predefinições para Nenhum

enable_vote_ensemble
Optional[bool]

Quer ativar/desativar a iteração VotingEnsemble. Para obter mais informações sobre conjuntos, veja Configuração do conjunto , predefinições para Nenhum

stack_ensemble_settings
Optional[StackEnsembleSettings]

Definições da iteração StackEnsemble, predefinições para Nenhuma

ensemble_model_download_timeout
Optional[int]

Durante a geração de modelos VotingEnsemble e StackEnsemble, são transferidos vários modelos ajustados das execuções subordinadas anteriores. Configure este parâmetro com um valor superior a 300 segundos, se for necessário mais tempo, a predefinição é Nenhuma

allowed_training_algorithms
Optional[List[str]]

Uma lista de nomes de modelos para procurar uma experimentação. Se não for especificado, todos os modelos suportados para a tarefa são utilizados menos os especificados em blocked_training_algorithms modelos tensorFlow ou preteridos, predefinições para Nenhum

blocked_training_algorithms
Optional[List[str]]

Uma lista de algoritmos a ignorar para uma experimentação, predefinição para Nenhum

training_mode
Optional[Union[str, TabularTrainingMode]]

[Experimental] O modo de preparação a utilizar. Os valores possíveis são:

  • distributed – permite a preparação distribuída para algoritmos suportados.

  • non_distributed- desativa a preparação distribuída.

  • auto- Atualmente, é o mesmo que non_distributed. No futuro, isto pode mudar.

Nota: este parâmetro está em pré-visualização pública e poderá mudar no futuro.

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

Atributos

base_path

O caminho base do recurso.

Devoluções

O caminho base do recurso.

Tipo de retorno

str

creation_context

O contexto de criação do recurso.

Devoluções

Os metadados de criação do recurso.

Tipo de retorno

featurization

Obtenha as definições de caracterização tabular para a tarefa autoML.

Devoluções

Definições de caracterização tabular para a tarefa de AutoML

Tipo de retorno

id

O ID do recurso.

Devoluções

O ID global do recurso, um ID do Azure Resource Manager (ARM).

Tipo de retorno

inputs

limits

Obtenha os limites tabulares da tarefa autoML.

Devoluções

Limites tabulares para a tarefa de AutoML

Tipo de retorno

log_files

Ficheiros de saída da tarefa.

Devoluções

O dicionário de nomes de registo e URLs.

Tipo de retorno

log_verbosity

Obtenha a verbosidade do registo para a tarefa autoML.

Devoluções

verbosidade do registo para a tarefa de AutoML

Tipo de retorno

<xref:LogVerbosity>

outputs

primary_metric

status

O estado da tarefa.

Os valores comuns devolvidos incluem "Running", "Completed" e "Failed". Todos os valores possíveis são:

  • NotStarted - este é um estado temporário em que os objetos Run do lado do cliente estão antes da submissão da cloud.

  • A iniciar – a Execução começou a ser processada na cloud. O autor da chamada tem um ID de execução neste momento.

  • Aprovisionamento – a computação a pedido está a ser criada para uma determinada submissão de tarefas.

  • Preparação – o ambiente de execução está a ser preparado e está numa de duas fases:

    • Compilação de imagens do Docker

    • configuração do ambiente conda

  • Em fila – a tarefa está em fila de espera no destino de computação. Por exemplo, no BatchAI, a tarefa está num estado em fila

    enquanto aguarda que todos os nós pedidos estejam prontos.

  • Em execução – a tarefa começou a ser executada no destino de computação.

  • Finalização – a execução do código do utilizador foi concluída e a execução encontra-se em fases de pós-processamento.

  • CancelRequested - Foi pedido o cancelamento para a tarefa.

  • Concluído – a execução foi concluída com êxito. Isto inclui a execução do código de utilizador e a execução

    fases de pós-processamento.

  • Falha - A execução falhou. Normalmente, a propriedade Erro numa execução irá fornecer detalhes sobre o motivo.

  • Cancelado – segue um pedido de cancelamento e indica que a execução foi cancelada com êxito.

  • NotResponding – para execuções com Heartbeats ativados, não foi enviado nenhum heartbeat recentemente.

Devoluções

Estado da tarefa.

Tipo de retorno

studio_url

Ponto final do Azure ML Studio.

Devoluções

O URL para a página de detalhes da tarefa.

Tipo de retorno

task_type

Obter tipo de tarefa.

Devoluções

O tipo de tarefa a executar. Os valores possíveis incluem: "classificação", "regressão", "previsão".

Tipo de retorno

str

test_data

Obter dados de teste.

Devoluções

Entrada de dados de teste

Tipo de retorno

training

training_data

Obter dados de preparação.

Devoluções

Entrada de dados de preparação

Tipo de retorno

type

O tipo de tarefa.

Devoluções

O tipo de tarefa.

Tipo de retorno

validation_data

Obter dados de validação.

Devoluções

Entrada de dados de validação

Tipo de retorno