Compartir a través de


automl Paquete

Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2.

Entre las áreas principales se incluyen la administración de tareas de AutoML.

Clases

ClassificationJob

Configuración del trabajo de clasificación de AutoML.

Inicialice una nueva tarea clasificación de AutoML.

ColumnTransformer

Configuración del transformador de columna.

ForecastingJob

Configuración de la tarea de previsión de AutoML.

Inicialice una nueva tarea de previsión de AutoML.

ForecastingSettings

Configuración de previsión de un trabajo de AutoML.

ImageClassificationJob

Configuración del trabajo clasificación de imágenes de varias clases de AutoML.

Inicialice un nuevo trabajo de clasificación de imágenes de varias clases de AutoML.

ImageClassificationMultilabelJob

Configuración del trabajo clasificación de imágenes de varias etiquetas de AutoML.

Inicialice un nuevo trabajo de clasificación de imágenes de varias etiquetas de AutoML.

ImageClassificationSearchSpace

Espacio de búsqueda para las tareas Clasificación de imágenes y Clasificación de imágenes multietiqueta de AutoML.

ImageInstanceSegmentationJob

Configuración del trabajo de segmentación de instancia de imagen de AutoML.

Inicialice un nuevo trabajo de segmentación de instancia de imagen de AutoML.

ImageLimitSettings

Limite la configuración de los verticales de imagen de AutoML.

ImageLimitSettings es una clase que contiene los parámetros siguientes: max_concurrent_trials, max_trials y timeout_minutes.

Se trata de un método de configuración opcional para configurar parámetros de límites, como tiempos de espera, etc.

Nota

El número de ejecuciones simultáneas viene determinado por los recursos disponibles en el destino de proceso especificado.

Asegúrese de que el destino de proceso tenga los recursos disponibles para la simultaneidad deseada.

Sugerencia

Se recomienda hacer coincidir max_concurrent_trials recuento con el número de nodos del clúster.

Por ejemplo, si tiene un clúster con 4 nodos, establezca max_concurrent_trials en 4.

Ejemplo de uso

Configuración de ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Inicialice un objeto ImageLimitSettings.

Constructor para ImageLimitSettings para verticales de imagen autoML.

ImageModelSettingsClassification

Configuración del modelo para las tareas de clasificación de imágenes de AutoML.

ImageModelSettingsObjectDetection

Configuración del modelo para la tarea detección de objetos de imagen AutoML.

ImageObjectDetectionJob

Configuración del trabajo de detección de objetos de imagen de AutoML.

Inicialice un nuevo trabajo de detección de objetos de imagen de AutoML.

ImageObjectDetectionSearchSpace

Espacio de búsqueda para tareas de detección de objetos de imagen autoML e segmentación de instancia de imagen.

ImageSweepSettings

Configuración de barrido para todos los verticales de imagen de AutoML.

NlpFeaturizationSettings

Configuración de caracterización para todas las verticales NLP de AutoML.

NlpFixedParameters

Objeto para hospedar parámetros fijos para trabajos NLP.

NlpLimitSettings

Limite la configuración de todos los verticales NLP de AutoML.

NlpSearchSpace

Espacio de búsqueda para tareas NLP de AutoML.

NlpSweepSettings

Configuración de barrido para todas las tareas NLP de AutoML.

RegressionJob

Configuración del trabajo de regresión de AutoML.

Inicialice una nueva tarea regresión de AutoML.

SearchSpace

Clase SearchSpace para verticales de AutoML.

StackEnsembleSettings

Ajuste avanzado para personalizar la ejecución de StackEnsemble.

TabularFeaturizationSettings

Configuración de caracterización para un trabajo de AutoML.

TabularLimitSettings

Limite la configuración de una tabla De AutoML verticales.

TextClassificationJob

Configuración del trabajo de clasificación de texto AutoML.

Inicializa una nueva tarea clasificación de texto AutoML.

TextClassificationMultilabelJob

Configuración del trabajo multietiqueta de clasificación de texto AutoML.

Inicializa una nueva tarea Multilabel de clasificación de texto AutoML.

TextNerJob

Configuración del trabajo de NER de texto autoML.

Inicializa una nueva tarea NER de texto AutoML.

TrainingSettings

Clase TrainingSettings para Azure Machine Learning.

Clase TrainingSettings para Azure Machine Learning.

Enumeraciones

BlockedTransformers

Enumeración para todos los modelos de clasificación admitidos por AutoML.

ClassificationModels

Enumeración para todos los modelos de clasificación admitidos por AutoML.

ClassificationMultilabelPrimaryMetrics

Métricas principales para las tareas de varias etiquetas de clasificación.

ClassificationPrimaryMetrics

Métricas principales para las tareas de clasificación.

FeaturizationMode

Modo de caracterización: determina el modo de caracterización de datos.

ForecastHorizonMode

Enumeración para determinar el modo de selección del horizonte de previsión.

ForecastingModels

Enumeración para todos los modelos de previsión admitidos por AutoML.

ForecastingPrimaryMetrics

Métricas principales de la tarea Previsión.

InstanceSegmentationPrimaryMetrics

Métricas principales para las tareas instanceSegmentation.

LearningRateScheduler

Enumeración del programador de velocidad de aprendizaje.

LogTrainingMetrics

Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2.

Entre las áreas principales se incluyen la administración de tareas de AutoML.

LogValidationLoss

Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2.

Entre las áreas principales se incluyen la administración de tareas de AutoML.

NCrossValidationsMode

Determina cómo se determina el valor de N-Cross validations.

ObjectDetectionPrimaryMetrics

Métricas principales de la tarea Image ObjectDetection.

RegressionModels

Enumeración para todos los modelos de regresión admitidos por AutoML.

RegressionPrimaryMetrics

Métricas principales de la tarea Regresión.

SamplingAlgorithmType

Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2.

Entre las áreas principales se incluyen la administración de tareas de AutoML.

ShortSeriesHandlingConfiguration

Parámetro que define si AutoML debe controlar series temporales cortas.

StochasticOptimizer

Optimizador estocástico para modelos de imagen.

TargetAggregationFunction

Función de agregado de destino.

TargetLagsMode

Modos de selección de retardos de destino.

TargetRollingWindowSizeMode

Modo de tamaño de ventanas graduales de destino.

UseStl

Configura la descomposición de STL de la columna de destino de la serie temporal.

ValidationMetricType

Método de cálculo de métricas que se va a usar para las métricas de validación en las tareas de imagen.

Funciones

classification

Función para crear un Objeto ClassificationJob.

Un trabajo de clasificación se usa para entrenar un modelo que prediga mejor la clase de un ejemplo de datos. Varios modelos se entrenan mediante los datos de entrenamiento. El modelo con el mejor rendimiento en los datos de validación basados en la métrica principal se selecciona como modelo final.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a training_datalos parámetros y test_data . validation_data

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: precisión, AUC_weighted, norm_macro_recall, average_precision_score_weighted y precision_score_weighted valores predeterminados de precisión

enable_model_explainability
bool

Si se habilita la explicación del mejor modelo de AutoML al final de todas las iteraciones de entrenamiento de AutoML. El valor predeterminado es none. Para más información, consulte Interpretación: capacidad de explicación de modelos de aprendizaje automático automatizado (versión preliminar).

weight_column_name
str

Nombre de la columna de peso de muestra. El aprendizaje automático automatizado admite una columna de peso como entrada, lo que provoca que las filas de los datos se puedan subir o bajar. Si los datos de entrada son de un elemento Pandas.DataFrame que no tiene nombres de columna, se pueden usar índices de columna en su lugar, expresados como enteros.

Este parámetro es aplicable a training_data los parámetros y validation_data

validation_data
Input

Datos de validación que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).

El valor predeterminado es None

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca n_cross_validations o validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados. Para el plegado de validación cruzada personalizado, use cv_split_column_names.

Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.

El valor predeterminado es None

n_cross_validations
Union[str, int]

Número de validaciones cruzadas que se realizan cuando no se especifican los datos de validación del usuario.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca n_cross_validations o validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados. Para el plegado de validación cruzada personalizado, use cv_split_column_names.

Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.

El valor predeterminado es None

cv_split_column_names
List[str]

Lista de nombres de las columnas que contienen una división de validación cruzada personalizada. Cada una de las columnas de división de CV representa una división de CV donde cada fila se marca como 1 para el entrenamiento o 0 para la validación.

El valor predeterminado es None

test_data
Input

La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Los datos de prueba que se usarán para una ejecución de pruebas que se iniciarán automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.

Si no se especifica este parámetro o el parámetro test_data_size, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo. Los datos de prueba deben contener características y columnas de etiqueta. Si se especifica test_data, se debe especificar el parámetro target_column_name.

El valor predeterminado es None

test_data_size
float

La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Qué fracción de los datos de entrenamiento se va a mantener para los datos de prueba de una ejecución de prueba que se iniciará automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.

Debe estar entre 0,0 y 1,0 no inclusivo. Si se especifica test_data_size al mismo tiempo que validation_data_size, los datos de prueba se dividen de training_data antes de dividir los datos de validación. Por ejemplo, si validation_data_size=0.1, test_data_size=0.1 y los datos de entrenamiento originales tienen 1000 filas, los datos de prueba tendrán 100 filas, los datos de validación contendrán 90 filas y los datos de entrenamiento tendrán 810 filas.

En las tareas de regresión se usa el muestreo aleatorio. Para las tareas de clasificación, se usa el muestreo estratificado. La previsión no admite actualmente la especificación de un conjunto de datos de prueba mediante una división de entrenamiento o prueba.

Si no se especifica este parámetro o el parámetro test_data, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.

El valor predeterminado es None

Devoluciones

Objeto de trabajo que se puede enviar a un proceso de Azure ML para su ejecución.

Tipo de valor devuelto

forecasting

Función para crear un trabajo de previsión.

Una tarea de previsión se usa para predecir los valores de destino de un período de tiempo futuro basado en los datos históricos. Varios modelos se entrenan mediante los datos de entrenamiento. El modelo con el mejor rendimiento en los datos de validación basados en la métrica principal se selecciona como modelo final.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a training_datalos validation_data parámetros , y test_data

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error valores predeterminados para normalized_root_mean_squared_error

enable_model_explainability
bool

Si se habilita la explicación del mejor modelo de AutoML al final de todas las iteraciones de entrenamiento de AutoML. El valor predeterminado es none. Para más información, consulte Interpretación: capacidad de explicación de modelos de aprendizaje automático automatizado (versión preliminar).

weight_column_name
str

Nombre de la columna de peso de muestra. El aprendizaje automático automatizado admite una columna de peso como entrada, lo que provoca que las filas de los datos se puedan subir o bajar. Si los datos de entrada son de un elemento Pandas.DataFrame que no tiene nombres de columna, se pueden usar índices de columna en su lugar, expresados como enteros.

Este parámetro es aplicable a training_data los parámetros y validation_data

validation_data
Input

Datos de validación que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).

El valor predeterminado es None

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca n_cross_validations o validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados. Para el plegado de validación cruzada personalizado, use cv_split_column_names.

Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.

El valor predeterminado es None

n_cross_validations
Union[str, int]

Número de validaciones cruzadas que se realizan cuando no se especifican los datos de validación del usuario.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca n_cross_validations o validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados. Para el plegado de validación cruzada personalizado, use cv_split_column_names.

Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.

El valor predeterminado es None

cv_split_column_names
List[str]

Lista de nombres de las columnas que contienen una división de validación cruzada personalizada. Cada una de las columnas de división de CV representa una división de CV donde cada fila se marca como 1 para el entrenamiento o 0 para la validación.

El valor predeterminado es None

test_data
Input

La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Los datos de prueba que se usarán para una ejecución de pruebas que se iniciarán automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.

Si no se especifica este parámetro o el parámetro test_data_size, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo. Los datos de prueba deben contener características y columnas de etiqueta. Si se especifica test_data, se debe especificar el parámetro target_column_name.

El valor predeterminado es None

test_data_size
float

La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Qué fracción de los datos de entrenamiento se va a mantener para los datos de prueba de una ejecución de prueba que se iniciará automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.

Debe estar entre 0,0 y 1,0 no inclusivo. Si se especifica test_data_size al mismo tiempo que validation_data_size, los datos de prueba se dividen de training_data antes de dividir los datos de validación. Por ejemplo, si validation_data_size=0.1, test_data_size=0.1 y los datos de entrenamiento originales tienen 1000 filas, los datos de prueba tendrán 100 filas, los datos de validación contendrán 90 filas y los datos de entrenamiento tendrán 810 filas.

En las tareas de regresión se usa el muestreo aleatorio. Para las tareas de clasificación, se usa el muestreo estratificado. La previsión no admite actualmente la especificación de un conjunto de datos de prueba mediante una división de entrenamiento o prueba.

Si no se especifica este parámetro o el parámetro test_data, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.

El valor predeterminado es None

forecasting_settings
ForecastingSettings

La configuración de la tarea de previsión

Devoluciones

Objeto de trabajo que se puede enviar a un proceso de Azure ML para su ejecución.

Tipo de valor devuelto

image_classification

Crea un objeto para el trabajo clasificación de varias clases de imagen de AutoML.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento.

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a los parámetros training_data y validation_data.

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: precisión, AUC_weighted, norm_macro_recall, average_precision_score_weighted y precision_score_weighted Valores predeterminados de precisión.

validation_data
Input

Datos de validación que se usarán dentro del experimento.

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados.

El valor predeterminado es .2.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Objeto de trabajo de clasificación de imágenes que se puede enviar a un proceso de Azure ML para su ejecución.

Tipo de valor devuelto

image_classification_multilabel

Crea un objeto para el trabajo clasificación de varias etiquetas de imagen autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento.

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a los parámetros training_data y validation_data.

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: precisión, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted y Valores predeterminados de Iou en Iou.

validation_data
Input

Datos de validación que se usarán dentro del experimento.

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados.

El valor predeterminado es .2.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Imagen del objeto de trabajo de clasificación de varias etiquetas que se puede enviar a un proceso de Azure ML para su ejecución.

Tipo de valor devuelto

image_instance_segmentation

Crea un objeto para el trabajo segmentación de instancia de imagen autoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento.

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a los parámetros training_data y validation_data.

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Datos de validación que se usarán dentro del experimento.

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados.

El valor predeterminado es .2.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Trabajo de segmentación de instancias de imagen

Tipo de valor devuelto

image_object_detection

Crea un objeto para el trabajo detección de objetos de imagen autoML.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento.

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a los parámetros training_data y validation_data.

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Datos de validación que se usarán dentro del experimento.

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados.

El valor predeterminado es .2.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Objeto de trabajo de detección de objetos de imagen que se puede enviar a un proceso de Azure ML para su ejecución.

Tipo de valor devuelto

regression

Función para crear un trabajo de regresión.

Un trabajo de regresión se usa para entrenar un modelo para predecir valores continuos de una variable de destino a partir de un conjunto de datos. Varios modelos se entrenan mediante los datos de entrenamiento. El modelo con el mejor rendimiento en los datos de validación basados en la métrica principal se selecciona como modelo final.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).

target_column_name
str

Nombre de la columna de etiquetas. Este parámetro es aplicable a training_datalos validation_data parámetros , y test_data

primary_metric

Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceptables: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. El valor predeterminado es normalized_root_mean_squared_error

enable_model_explainability
bool

Si se habilita la explicación del mejor modelo de AutoML al final de todas las iteraciones de entrenamiento de AutoML. El valor predeterminado es none. Para más información, consulte Interpretación: capacidad de explicación de modelos de aprendizaje automático automatizado (versión preliminar).

weight_column_name
str

Nombre de la columna de peso de muestra. El aprendizaje automático automatizado admite una columna de peso como entrada, lo que provoca que las filas de los datos se puedan subir o bajar. Si los datos de entrada son de un elemento Pandas.DataFrame que no tiene nombres de columna, se pueden usar índices de columna en su lugar, expresados como enteros.

Este parámetro es aplicable a training_data los parámetros y validation_data

validation_data
Input

Datos de validación que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).

El valor predeterminado es None

validation_data_size
float

Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca n_cross_validations o validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados. Para el plegado de validación cruzada personalizado, use cv_split_column_names.

Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.

El valor predeterminado es None

n_cross_validations
Union[str, int]

Número de validaciones cruzadas que se realizan cuando no se especifican los datos de validación del usuario.

Especifique validation_data para proporcionar datos de validación; de lo contrario, establezca n_cross_validations o validation_data_size para extraer los datos de validación de los datos de entrenamiento especificados. Para el plegado de validación cruzada personalizado, use cv_split_column_names.

Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.

El valor predeterminado es None

cv_split_column_names
List[str]

Lista de nombres de las columnas que contienen una división de validación cruzada personalizada. Cada una de las columnas de división de CV representa una división de CV donde cada fila se marca como 1 para el entrenamiento o 0 para la validación.

El valor predeterminado es None

test_data
Input

La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Los datos de prueba que se usarán para una ejecución de pruebas que se iniciarán automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.

Si no se especifica este parámetro o el parámetro test_data_size, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo. Los datos de prueba deben contener características y columnas de etiqueta. Si se especifica test_data, se debe especificar el parámetro target_column_name.

El valor predeterminado es None

test_data_size
float

La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Qué fracción de los datos de entrenamiento se va a mantener para los datos de prueba de una ejecución de prueba que se iniciará automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.

Debe estar entre 0,0 y 1,0 no inclusivo. Si se especifica test_data_size al mismo tiempo que validation_data_size, los datos de prueba se dividen de training_data antes de dividir los datos de validación. Por ejemplo, si validation_data_size=0.1, test_data_size=0.1 y los datos de entrenamiento originales tienen 1000 filas, los datos de prueba tendrán 100 filas, los datos de validación contendrán 90 filas y los datos de entrenamiento tendrán 810 filas.

En las tareas de regresión se usa el muestreo aleatorio. Para las tareas de clasificación, se usa el muestreo estratificado. La previsión no admite actualmente la especificación de un conjunto de datos de prueba mediante una división de entrenamiento o prueba.

Si no se especifica este parámetro o el parámetro test_data, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.

El valor predeterminado es None

Devoluciones

Objeto de trabajo que se puede enviar a un proceso de Azure ML para su ejecución.

Tipo de valor devuelto

text_classification

Función para crear un TextClassificationJob.

Un trabajo de clasificación de texto se usa para entrenar un modelo que puede predecir la clase o categoría de los datos de texto. Los datos de entrenamiento de entrada deben incluir una columna de destino que clasifique el texto en exactamente una clase.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.

target_column_name
str

Nombre de la columna de destino.

validation_data
Input

Datos de validación que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Métrica principal de la tarea. Valores aceptables: precisión, AUC_weighted, precision_score_weighted

log_verbosity
str

Nivel de detalle del registro.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Objeto TextClassificationJob.

Tipo de valor devuelto

text_classification_multilabel

Función para crear un TextClassificationMultilabelJob.

Un trabajo de varias etiquetas de clasificación de texto se usa para entrenar un modelo que puede predecir las clases o categorías de datos de texto. Los datos de entrenamiento de entrada deben incluir una columna de destino que clasifique el texto en clases. Para obtener más información sobre el formato de los datos de varias etiquetas, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.

target_column_name
str

Nombre de la columna de destino.

validation_data
Input

Datos de validación que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.

primary_metric
str

Métrica principal de la tarea. Valores aceptables: precisión

log_verbosity
str

Nivel de detalle del registro.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Objeto TextClassificationMultilabelJob.

Tipo de valor devuelto

text_ner

Función para crear un TextNerJob.

Un trabajo de reconocimiento de entidades con nombre de texto se usa para entrenar un modelo que pueda predecir las entidades con nombre en el texto. Los datos de entrenamiento de entrada deben ser un archivo de texto en formato CoNLL. Para obtener más información sobre el formato de los datos NER de texto, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parámetros

training_data
Input

Datos de entrenamiento que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.

validation_data
Input

Datos de validación que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.

primary_metric
str

Métrica principal de la tarea. Valores aceptables: precisión

log_verbosity
str

Nivel de detalle del registro.

kwargs
dict

Diccionario de parámetros de configuración adicionales.

Devoluciones

Objeto TextNerJob.

Tipo de valor devuelto