RegressionJob Classe
Configuração da Tarefa de Regressão autoML.
Inicialize uma nova tarefa de Regressão autoML.
- Herança
-
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabularRegressionJob
Construtor
RegressionJob(*, primary_metric: str | None = None, **kwargs)
Parâmetros
Métodos
dump |
Captura o conteúdo da tarefa num ficheiro no formato YAML. |
set_data |
Definir a configuração de dados. |
set_featurization |
Definir a configuração de engenharia de funcionalidades. |
set_limits |
Defina limites para a tarefa. |
set_training |
O método para configurar as definições relacionadas com a preparação. |
dump
Captura o conteúdo da tarefa num ficheiro no formato YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parâmetros
O caminho local ou o fluxo de ficheiros para o qual escrever o conteúdo YAML. Se dest for um caminho de ficheiro, será criado um novo ficheiro. Se dest for um ficheiro aberto, o ficheiro será escrito diretamente.
- kwargs
- dict
Argumentos adicionais para passar para o serializador YAML.
Exceções
Gerado se dest é um caminho de ficheiro e o ficheiro já existe.
Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.
set_data
Definir a configuração de dados.
set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None
Parâmetros
- training_data
- Input
Dados de preparação.
- target_column_name
- str
Nome da coluna de destino.
Exceções
Gerado se dest é um caminho de ficheiro e o ficheiro já existe.
Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.
set_featurization
Definir a configuração de engenharia de funcionalidades.
set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None
Parâmetros
- blocked_transformers
- Optional[List[Union[BlockedTransformers, str]]]
Uma lista de nomes de transformadores a serem bloqueados durante a caracterização, predefinições para Nenhum
Um dicionário de nomes de colunas e tipos de funcionalidades utilizados para atualizar a finalidade da coluna, predefinições para Nenhum
Código ISO 639-3 de três carateres para os idiomas contidos no conjunto de dados. Os idiomas que não o inglês só são suportados se utilizar computação ativada por GPU. A language_code "mula" deve ser utilizada se o conjunto de dados contiver vários idiomas. Para localizar códigos ISO 639-3 para idiomas diferentes, veja https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, predefinições para Nenhum
- transformer_params
- Optional[Dict[str, List[ColumnTransformer]]]
Um dicionário do transformador e dos parâmetros de personalização correspondentes, predefinições para Nenhum
Se pretende incluir métodos de engenharia de funcionalidades baseados em DNN, a predefinição é Nenhuma
Exceções
Gerado se dest é um caminho de ficheiro e o ficheiro já existe.
Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.
set_limits
Defina limites para a tarefa.
set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Parâmetros
Se ativar a terminação antecipada se a classificação não estiver a melhorar a curto prazo, a predefinição é Nenhuma.
Lógica de paragem precoce:
Nenhuma paragem antecipada para as primeiras 20 iterações (marcos).
A janela de paragem antecipada começa na 21.ª iteração e procura iterações early_stopping_n_iters
(atualmente definido como 10). Isto significa que a primeira iteração onde a paragem pode ocorrer é a 31ª.
O AutoML ainda agenda 2 iterações de conjunto após a paragem antecipada, o que pode resultar em pontuações mais altas.
A paragem antecipada é acionada se o valor absoluto da melhor classificação calculada for o mesmo para o passado
early_stopping_n_iters iterações, ou seja, se não houver melhorias na classificação para iterações early_stopping_n_iters.
Classificação de destino para experimentação. A experimentação termina depois de esta classificação ser atingida. Se não for especificada (sem critérios), a experimentação é executada até que não sejam feitos mais progressos na métrica primária. Para obter mais informações sobre critérios de saída, veja este artigo , predefinições para Nenhum
Este é o número máximo de iterações que seriam executadas em paralelo. O valor predefinido é 1.
- Os clusters AmlCompute suportam uma iteração em execução por nó.
Para múltiplas execuções principais de experimentação autoML executadas em paralelo num único cluster AmlCompute, a soma dos max_concurrent_trials
valores de todas as experimentações deve ser menor ou igual ao número máximo de nós. Caso contrário, as execuções serão colocadas em fila até que os nós estejam disponíveis.
- A DSVM suporta várias iterações por nó.
max_concurrent_trials
deve
ser menor ou igual ao número de núcleos na DSVM. Para várias experimentações executadas em paralelo numa única DSVM, a soma dos max_concurrent_trials
valores para todas as experimentações deve ser menor ou igual ao número máximo de nós.
- Databricks –
max_concurrent_trials
deve ser menor ou igual ao número de
nós de trabalho no Databricks.
max_concurrent_trials
não se aplica a execuções locais. Anteriormente, este parâmetro era denominado concurrent_iterations
.
O número máximo de threads a utilizar para uma determinada iteração de preparação. Valores aceitáveis:
Maior que 1 e menor ou igual ao número máximo de núcleos no destino de computação.
Igual a -1, o que significa utilizar todos os núcleos possíveis por iteração por execução subordinada.
Igual a 1, a predefinição.
[Experimental] O número máximo de nós a utilizar para preparação distribuída.
Para a previsão, cada modelo é preparado com nós máximo(2, int(max_nodes/max_concurrent_trials)).
Para classificação/regressão, cada modelo é preparado com max_nodes nós.
Nota: este parâmetro está em pré-visualização pública e poderá mudar no futuro.
O número total de diferentes combinações de algoritmos e parâmetros a testar durante uma experimentação de ML automatizada. Se não for especificado, a predefinição é 1000 iterações.
Período máximo de tempo em minutos que todas as iterações combinadas podem demorar até que a experimentação termine. Se não for especificado, o tempo limite da experimentação predefinido é de 6 dias. Para especificar um tempo limite inferior ou igual a 1 hora, certifique-se de que o tamanho do conjunto de dados não é superior a 10 000 000 (linhas vezes coluna) ou resultados de erros, predefinições para Nenhum
Tempo máximo em minutos para o qual cada iteração pode ser executada antes de terminar. Se não for especificado, é utilizado um valor de 1 mês ou 43200 minutos, predefinição para Nenhum
Exceções
Gerado se dest é um caminho de ficheiro e o ficheiro já existe.
Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.
set_training
O método para configurar as definições relacionadas com a preparação.
set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None
Parâmetros
Quer ativar ou desativar a imposição dos modelos compatíveis com ONNX. A predefinição é Falso. Para obter mais informações sobre o Open Neural Network Exchange (ONNX) e o Azure Machine Learning, veja este artigo.
Se pretende incluir modelos baseados em DNN durante a seleção de modelos. No entanto, a predefinição é True para tarefas NLP DNN e é Falso para todas as outras tarefas de AutoML.
Se pretende ativar a explicação do melhor modelo autoML no final de todas as iterações de preparação autoML. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos na aprendizagem automática automatizada). , predefinições para Nenhum
Quer ativar/desativar a iteração stackEnsemble. Se enable_onnx_compatible_models sinalizador estiver a ser definido, a iteração StackEnsemble será desativada. Da mesma forma, para tarefas do Timeseries, a iteração StackEnsemble será desativada por predefinição, para evitar riscos de sobreajuste devido ao pequeno conjunto de preparação utilizado na adaptação do meta-aluno. Para obter mais informações sobre conjuntos, veja Configuração do conjunto , predefinições para Nenhum
Quer ativar/desativar a iteração VotingEnsemble. Para obter mais informações sobre conjuntos, veja Configuração do conjunto , predefinições para Nenhum
- stack_ensemble_settings
- Optional[StackEnsembleSettings]
Definições da iteração StackEnsemble, predefinições para Nenhuma
Durante a geração de modelos VotingEnsemble e StackEnsemble, são transferidos vários modelos ajustados das execuções subordinadas anteriores. Configure este parâmetro com um valor superior a 300 segundos, se for necessário mais tempo, a predefinição é Nenhuma
Uma lista de nomes de modelos para procurar uma experimentação. Se não for especificado, todos os modelos suportados para a tarefa são utilizados menos os especificados em blocked_training_algorithms
modelos tensorFlow ou preteridos, predefinições para Nenhum
Uma lista de algoritmos a ignorar para uma experimentação, predefinição para Nenhum
- training_mode
- Optional[Union[str, TabularTrainingMode]]
[Experimental] O modo de preparação a utilizar. Os valores possíveis são:
distributed – permite a preparação distribuída para algoritmos suportados.
non_distributed- desativa a preparação distribuída.
auto- Atualmente, é o mesmo que non_distributed. No futuro, isto pode mudar.
Nota: este parâmetro está em pré-visualização pública e poderá mudar no futuro.
Exceções
Gerado se dest é um caminho de ficheiro e o ficheiro já existe.
Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.
Atributos
base_path
creation_context
O contexto de criação do recurso.
Devoluções
Os metadados de criação do recurso.
Tipo de retorno
featurization
Obtenha as definições de caracterização tabular para a tarefa autoML.
Devoluções
Definições de caracterização tabular para a tarefa de AutoML
Tipo de retorno
id
O ID do recurso.
Devoluções
O ID global do recurso, um ID do Azure Resource Manager (ARM).
Tipo de retorno
inputs
limits
Obtenha os limites tabulares da tarefa autoML.
Devoluções
Limites tabulares para a tarefa de AutoML
Tipo de retorno
log_files
Ficheiros de saída da tarefa.
Devoluções
O dicionário de nomes de registo e URLs.
Tipo de retorno
log_verbosity
Obtenha a verbosidade do registo para a tarefa autoML.
Devoluções
verbosidade do registo para a tarefa de AutoML
Tipo de retorno
outputs
primary_metric
status
O estado da tarefa.
Os valores comuns devolvidos incluem "Running", "Completed" e "Failed". Todos os valores possíveis são:
NotStarted - este é um estado temporário em que os objetos Run do lado do cliente estão antes da submissão da cloud.
A iniciar – a Execução começou a ser processada na cloud. O autor da chamada tem um ID de execução neste momento.
Aprovisionamento – a computação a pedido está a ser criada para uma determinada submissão de tarefas.
Preparação – o ambiente de execução está a ser preparado e está numa de duas fases:
Compilação de imagens do Docker
configuração do ambiente conda
Em fila – a tarefa está em fila de espera no destino de computação. Por exemplo, no BatchAI, a tarefa está num estado em fila
enquanto aguarda que todos os nós pedidos estejam prontos.
Em execução – a tarefa começou a ser executada no destino de computação.
Finalização – a execução do código do utilizador foi concluída e a execução encontra-se em fases de pós-processamento.
CancelRequested - Foi pedido o cancelamento para a tarefa.
Concluído – a execução foi concluída com êxito. Isto inclui a execução do código de utilizador e a execução
fases de pós-processamento.
Falha - A execução falhou. Normalmente, a propriedade Erro numa execução irá fornecer detalhes sobre o motivo.
Cancelado – segue um pedido de cancelamento e indica que a execução foi cancelada com êxito.
NotResponding – para execuções com Heartbeats ativados, não foi enviado nenhum heartbeat recentemente.
Devoluções
Estado da tarefa.
Tipo de retorno
studio_url
Ponto final do Azure ML Studio.
Devoluções
O URL para a página de detalhes da tarefa.
Tipo de retorno
task_type
Obter tipo de tarefa.
Devoluções
O tipo de tarefa a executar. Os valores possíveis incluem: "classificação", "regressão", "previsão".
Tipo de retorno
test_data
training
training_data
type
validation_data
Azure SDK for Python
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários