Partilhar via


TextNerJob Classe

Configuração para Tarefa NER de Texto autoML.

Inicializa uma nova tarefa NER de Texto autoML.

Herança
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextNerJob

Construtor

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parâmetros

training_data
Necessário

Dados de preparação a utilizar para preparação

validation_data
Necessário

Dados de validação a utilizar para avaliar o modelo preparado

primary_metric
Necessário

A métrica primária a apresentar.

log_verbosity
Necessário

Nível de verbosidade do registo

kwargs
Necessário

Argumentos específicos da tarefa

Métodos

dump

Captura o conteúdo da tarefa num ficheiro no formato YAML.

extend_search_space

Adicione (a) espaços de pesquisa para esta tarefa NLP autoML.

set_data
set_featurization
set_limits
set_sweep

Definições de varrimento para todas as tarefas NLP de AutoML.

set_training_parameters

Corrija determinados parâmetros de preparação ao longo do procedimento de preparação para todos os candidatos.

passe. Tem de ser um número inteiro positivo. :keyword learning_rate: taxa de aprendizagem inicial. Tem de ser um carro alegórico (0, 1). :keyword learning_rate_scheduler: o tipo de programador de taxa de aprendizagem. Tem de escolher entre "linear", "cosseno", "cosine_with_restarts", "polinomial", "constante" e "constant_with_warmup". :keyword model_name: o nome do modelo a utilizar durante a preparação. Tem de escolher entre "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased e "xlnet-large-cased". :keyword number_of_epochs: o número de épocas com que preparar. Tem de ser um número inteiro positivo. :keyword training_batch_size: o tamanho do lote durante a preparação. Tem de ser um número inteiro positivo. :keyword validation_batch_size: o tamanho do lote durante a validação. Tem de ser um número inteiro positivo. :keyword warmup_ratio: proporção dos passos de preparação totais utilizados para um aquecimento linear de 0 para learning_rate. Tem de ser um carro alegórico em [0, 1]. :keyword weight_decay: valor de decadência de peso quando o otimizador é sgd, adam ou adamw. Tem de ser um flutuante no intervalo [0, 1]. :return: None.

dump

Captura o conteúdo da tarefa num ficheiro no formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parâmetros

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Necessário

O caminho local ou o fluxo de ficheiros para o qual escrever o conteúdo YAML. Se dest for um caminho de ficheiro, será criado um novo ficheiro. Se dest for um ficheiro aberto, o ficheiro será escrito diretamente.

kwargs
dict

Argumentos adicionais para passar para o serializador YAML.

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

extend_search_space

Adicione (a) espaços de pesquisa para esta tarefa NLP autoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parâmetros

value
Union[SearchSpace, List[SearchSpace]]
Necessário

um objeto SearchSpace ou uma lista de objetos do SearchSpace com parâmetros específicos de nlp.

Devoluções

Nenhum.

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_sweep

Definições de varrimento para todas as tarefas NLP de AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parâmetros

sampling_algorithm

Obrigatório. Especifica o tipo de algoritmo de amostragem de hiperparâmetros. Os valores possíveis incluem: "Grid", "Random" e "Bayesian".

early_termination

Política de cessação antecipada opcional para acabar com candidatos a formação com mau desempenho.

Devoluções

Nenhuma

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

set_training_parameters

Corrija determinados parâmetros de preparação ao longo do procedimento de preparação para todos os candidatos.

passe. Tem de ser um número inteiro positivo. :keyword learning_rate: taxa de aprendizagem inicial. Tem de ser um carro alegórico (0, 1). :keyword learning_rate_scheduler: o tipo de programador de taxa de aprendizagem. Tem de escolher entre "linear", "cosseno", "cosine_with_restarts", "polinomial", "constante" e "constant_with_warmup". :keyword model_name: o nome do modelo a utilizar durante a preparação. Tem de escolher entre "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased e "xlnet-large-cased". :keyword number_of_epochs: o número de épocas com que preparar. Tem de ser um número inteiro positivo. :keyword training_batch_size: o tamanho do lote durante a preparação. Tem de ser um número inteiro positivo. :keyword validation_batch_size: o tamanho do lote durante a validação. Tem de ser um número inteiro positivo. :keyword warmup_ratio: proporção dos passos de preparação totais utilizados para um aquecimento linear de 0 para learning_rate. Tem de ser um carro alegórico em [0, 1]. :keyword weight_decay: valor de decadência de peso quando o otimizador é sgd, adam ou adamw. Tem de ser um flutuante no intervalo [0, 1]. :return: None.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parâmetros

gradient_accumulation_steps

número de passos sobre os quais acumular gradações antes de retroceder

Exceções

Gerado se dest é um caminho de ficheiro e o ficheiro já existe.

Gerado se o dest for um ficheiro aberto e o ficheiro não for gravável.

Atributos

base_path

O caminho base do recurso.

Devoluções

O caminho base do recurso.

Tipo de retorno

str

creation_context

O contexto de criação do recurso.

Devoluções

Os metadados de criação do recurso.

Tipo de retorno

featurization

id

O ID do recurso.

Devoluções

O ID global do recurso, um ID do Azure Resource Manager (ARM).

Tipo de retorno

inputs

limits

log_files

Ficheiros de saída da tarefa.

Devoluções

O dicionário de nomes de registo e URLs.

Tipo de retorno

log_verbosity

outputs

primary_metric

search_space

status

O estado da tarefa.

Os valores comuns devolvidos incluem "Running", "Completed" e "Failed". Todos os valores possíveis são:

  • NotStarted - este é um estado temporário em que os objetos Run do lado do cliente estão antes da submissão da cloud.

  • A iniciar – a Execução começou a ser processada na cloud. O autor da chamada tem um ID de execução neste momento.

  • Aprovisionamento – a computação a pedido está a ser criada para uma determinada submissão de tarefas.

  • Preparação – o ambiente de execução está a ser preparado e está numa de duas fases:

    • Compilação de imagens do Docker

    • configuração do ambiente conda

  • Em fila – a tarefa está em fila de espera no destino de computação. Por exemplo, no BatchAI, a tarefa está num estado em fila

    enquanto aguarda que todos os nós pedidos estejam prontos.

  • Em execução – a tarefa começou a ser executada no destino de computação.

  • Finalização – a execução do código do utilizador foi concluída e a execução encontra-se em fases de pós-processamento.

  • CancelRequested - Foi pedido o cancelamento para a tarefa.

  • Concluído – a execução foi concluída com êxito. Isto inclui a execução do código de utilizador e a execução

    fases de pós-processamento.

  • Falha - A execução falhou. Normalmente, a propriedade Erro numa execução irá fornecer detalhes sobre o motivo.

  • Cancelado – segue um pedido de cancelamento e indica que a execução foi cancelada com êxito.

  • NotResponding – para execuções com Heartbeats ativados, não foi enviado nenhum heartbeat recentemente.

Devoluções

Estado da tarefa.

Tipo de retorno

studio_url

Ponto final do Azure ML Studio.

Devoluções

O URL para a página de detalhes da tarefa.

Tipo de retorno

sweep

task_type

Obter tipo de tarefa.

Devoluções

O tipo de tarefa a executar. Os valores possíveis incluem: "classificação", "regressão", "previsão".

Tipo de retorno

str

test_data

Obter dados de teste.

Devoluções

Entrada de dados de teste

Tipo de retorno

training_data

Obter dados de preparação.

Devoluções

Entrada de dados de preparação

Tipo de retorno

training_parameters

type

O tipo de tarefa.

Devoluções

O tipo de tarefa.

Tipo de retorno

validation_data

Obter dados de validação.

Devoluções

Entrada de dados de validação

Tipo de retorno