Share via


TextNerJob Clase

Configuración del trabajo NER de texto autoML.

Inicializa una nueva tarea NER de texto AutoML.

Herencia
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextNerJob

Constructor

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parámetros

training_data
Requerido

Datos de entrenamiento que se usarán para el entrenamiento

validation_data
Requerido

Datos de validación que se usarán para evaluar el modelo entrenado

primary_metric
Requerido

Métrica principal que se va a mostrar.

log_verbosity
Requerido

Nivel de detalle del registro

kwargs
Requerido

Argumentos específicos del trabajo

Métodos

dump

Volca el contenido del trabajo en un archivo en formato YAML.

extend_search_space

Agregue (a) espacios de búsqueda para este trabajo de NLP de AutoML.

set_data
set_featurization
set_limits
set_sweep

Configuración de barrido para todas las tareas de NLP de AutoML.

set_training_parameters

Corrija ciertos parámetros de entrenamiento a lo largo del procedimiento de entrenamiento para todos los candidatos.

Pasar. Debe ser un entero positivo. :keyword learning_rate: velocidad de aprendizaje inicial. Debe ser un valor float en (0, 1). :keyword learning_rate_scheduler: el tipo de programador de velocidad de aprendizaje. Debe elegir entre 'lineal', 'coseno', 'cosine_with_restarts', 'polinomial', 'constant' y 'constant_with_warmup'. :keyword model_name: el nombre del modelo que se va a usar durante el entrenamiento. Debe elegir entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingü-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' y 'xlnet-large-cased'. :keyword number_of_epochs: el número de épocas con las que entrenar. Debe ser un entero positivo. :keyword training_batch_size: el tamaño del lote durante el entrenamiento. Debe ser un entero positivo. :keyword validation_batch_size: el tamaño del lote durante la validación. Debe ser un entero positivo. :keyword warmup_ratio: proporción de los pasos de entrenamiento totales usados para un calentamiento lineal de 0 a learning_rate. Debe ser un valor float en [0, 1]. :palabra clave weight_decay: valor de descomposición del peso cuando el optimizador es sgd, adam o adamw. Debe ser un float en el intervalo [0, 1]. :return: None.

dump

Volca el contenido del trabajo en un archivo en formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parámetros

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Requerido

Ruta de acceso local o secuencia de archivos en la que se va a escribir el contenido de YAML. Si dest es una ruta de acceso de archivo, se creará un nuevo archivo. Si dest es un archivo abierto, el archivo se escribirá directamente.

kwargs
dict

Argumentos adicionales para pasar al serializador YAML.

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

extend_search_space

Agregue (a) espacios de búsqueda para este trabajo de NLP de AutoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parámetros

value
Union[SearchSpace, List[SearchSpace]]
Requerido

un objeto SearchSpace o una lista de objetos SearchSpace con parámetros específicos de nlp.

Devoluciones

Ninguno.

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

set_sweep

Configuración de barrido para todas las tareas de NLP de AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parámetros

sampling_algorithm

Necesario. Especifica el tipo de algoritmo de muestreo de hiperparámetros. Entre los valores posibles se incluyen: "Grid", "Random" y "Bayesian".

early_termination

Directiva de terminación anticipada opcional para terminar con candidatos de entrenamiento con un rendimiento deficiente.

Devoluciones

Ninguno

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

set_training_parameters

Corrija ciertos parámetros de entrenamiento a lo largo del procedimiento de entrenamiento para todos los candidatos.

Pasar. Debe ser un entero positivo. :keyword learning_rate: velocidad de aprendizaje inicial. Debe ser un valor float en (0, 1). :keyword learning_rate_scheduler: el tipo de programador de velocidad de aprendizaje. Debe elegir entre 'lineal', 'coseno', 'cosine_with_restarts', 'polinomial', 'constant' y 'constant_with_warmup'. :keyword model_name: el nombre del modelo que se va a usar durante el entrenamiento. Debe elegir entre 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingü-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' y 'xlnet-large-cased'. :keyword number_of_epochs: el número de épocas con las que entrenar. Debe ser un entero positivo. :keyword training_batch_size: el tamaño del lote durante el entrenamiento. Debe ser un entero positivo. :keyword validation_batch_size: el tamaño del lote durante la validación. Debe ser un entero positivo. :keyword warmup_ratio: proporción de los pasos de entrenamiento totales usados para un calentamiento lineal de 0 a learning_rate. Debe ser un valor float en [0, 1]. :palabra clave weight_decay: valor de descomposición del peso cuando el optimizador es sgd, adam o adamw. Debe ser un float en el intervalo [0, 1]. :return: None.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parámetros

gradient_accumulation_steps

número de pasos sobre los que se van a acumular degradados antes de un retroceso

Excepciones

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

Atributos

base_path

Ruta de acceso base del recurso.

Devoluciones

Ruta de acceso base del recurso.

Tipo de valor devuelto

str

creation_context

Contexto de creación del recurso.

Devoluciones

Metadatos de creación del recurso.

Tipo de valor devuelto

featurization

id

El identificador del recurso.

Devoluciones

Identificador global del recurso, un identificador de Azure Resource Manager (ARM).

Tipo de valor devuelto

inputs

limits

log_files

Archivos de salida del trabajo.

Devoluciones

Diccionario de nombres de registro y direcciones URL.

Tipo de valor devuelto

log_verbosity

outputs

primary_metric

search_space

status

El estado del trabajo.

Los valores comunes devueltos incluyen "Running", "Completed" y "Failed". Todos los valores posibles son:

  • NotStarted: se trata de un estado temporal en el que se encuentran los objetos Run del lado cliente antes del envío en la nube.

  • Starting: la ejecución ha empezado a procesarse en la nube. El autor de la llamada tiene un identificador de ejecución en este momento.

  • Aprovisionamiento: el proceso a petición se está creando para un envío de trabajo determinado.

  • Preparación: el entorno de ejecución se está preparando y se encuentra en una de estas dos fases:

    • Compilación de imágenes de Docker

    • configuración del entorno Conda

  • En cola: el trabajo se pone en cola en el destino de proceso. Por ejemplo, en BatchAI, el trabajo está en estado en cola.

    mientras espera a que todos los nodos solicitados estén listos.

  • En ejecución: el trabajo se ha iniciado para ejecutarse en el destino de proceso.

  • Finalización: la ejecución del código de usuario se ha completado y la ejecución está en fases posteriores al procesamiento.

  • CancelRequested: se ha solicitado la cancelación del trabajo.

  • Completado: la ejecución se ha completado correctamente. Esto incluye tanto la ejecución del código de usuario como la ejecución

    posteriores al procesamiento de la ejecución.

  • Failed: error en la ejecución. Normalmente, la propiedad Error de una ejecución proporcionará detalles sobre por qué se produjo el error.

  • Canceled: sigue a una solicitud de cancelación e indica que la ejecución se ha cancelado correctamente.

  • NotResponding: en el caso de las ejecuciones que tienen los latidos habilitados, no se ha enviado recientemente ningún latido.

Devoluciones

Estado del trabajo.

Tipo de valor devuelto

studio_url

Punto de conexión de Azure ML Studio.

Devoluciones

Dirección URL de la página de detalles del trabajo.

Tipo de valor devuelto

sweep

task_type

Obtiene el tipo de tarea.

Devoluciones

Tipo de tarea que se va a ejecutar. Entre los valores posibles se incluyen: "classification", "regression", "forecasting".

Tipo de valor devuelto

str

test_data

Obtener datos de prueba.

Devoluciones

Entrada de datos de prueba

Tipo de valor devuelto

training_data

Obtener datos de entrenamiento.

Devoluciones

Entrada de datos de entrenamiento

Tipo de valor devuelto

training_parameters

type

Tipo del trabajo.

Devoluciones

Tipo del trabajo.

Tipo de valor devuelto

validation_data

Obtener datos de validación.

Devoluciones

Entrada de datos de validación

Tipo de valor devuelto