automl Paquete
Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2.
Entre las áreas principales se incluyen la administración de tareas de AutoML.
Clases
ClassificationJob |
Configuración del trabajo de clasificación de AutoML. Inicialice una nueva tarea clasificación de AutoML. |
ColumnTransformer |
Configuración del transformador de columna. |
ForecastingJob |
Configuración de la tarea de previsión de AutoML. Inicialice una nueva tarea de previsión de AutoML. |
ForecastingSettings |
Configuración de previsión de un trabajo de AutoML. |
ImageClassificationJob |
Configuración del trabajo clasificación de imágenes de varias clases de AutoML. Inicialice un nuevo trabajo de clasificación de imágenes de varias clases de AutoML. |
ImageClassificationMultilabelJob |
Configuración del trabajo clasificación de imágenes de varias etiquetas de AutoML. Inicialice un nuevo trabajo de clasificación de imágenes de varias etiquetas de AutoML. |
ImageClassificationSearchSpace |
Espacio de búsqueda para las tareas Clasificación de imágenes y Clasificación de imágenes multietiqueta de AutoML. |
ImageInstanceSegmentationJob |
Configuración del trabajo de segmentación de instancia de imagen de AutoML. Inicialice un nuevo trabajo de segmentación de instancia de imagen de AutoML. |
ImageLimitSettings |
Limite la configuración de los verticales de imagen de AutoML. ImageLimitSettings es una clase que contiene los parámetros siguientes: max_concurrent_trials, max_trials y timeout_minutes. Se trata de un método de configuración opcional para configurar parámetros de límites, como tiempos de espera, etc. Nota El número de ejecuciones simultáneas viene determinado por los recursos disponibles en el destino de proceso especificado. Asegúrese de que el destino de proceso tenga los recursos disponibles para la simultaneidad deseada. Sugerencia Se recomienda hacer coincidir max_concurrent_trials recuento con el número de nodos del clúster. Por ejemplo, si tiene un clúster con 4 nodos, establezca max_concurrent_trials en 4. Ejemplo de uso Configuración de ImageLimitSettings
Inicialice un objeto ImageLimitSettings. Constructor para ImageLimitSettings para verticales de imagen autoML. |
ImageModelSettingsClassification |
Configuración del modelo para las tareas de clasificación de imágenes de AutoML. |
ImageModelSettingsObjectDetection |
Configuración del modelo para la tarea detección de objetos de imagen AutoML. |
ImageObjectDetectionJob |
Configuración del trabajo de detección de objetos de imagen de AutoML. Inicialice un nuevo trabajo de detección de objetos de imagen de AutoML. |
ImageObjectDetectionSearchSpace |
Espacio de búsqueda para tareas de detección de objetos de imagen autoML e segmentación de instancia de imagen. |
ImageSweepSettings |
Configuración de barrido para todos los verticales de imagen de AutoML. |
NlpFeaturizationSettings |
Configuración de caracterización para todas las verticales NLP de AutoML. |
NlpFixedParameters |
Objeto para hospedar parámetros fijos para trabajos NLP. |
NlpLimitSettings |
Limite la configuración de todos los verticales NLP de AutoML. |
NlpSearchSpace |
Espacio de búsqueda para tareas NLP de AutoML. |
NlpSweepSettings |
Configuración de barrido para todas las tareas NLP de AutoML. |
RegressionJob |
Configuración del trabajo de regresión de AutoML. Inicialice una nueva tarea regresión de AutoML. |
SearchSpace |
Clase SearchSpace para verticales de AutoML. |
StackEnsembleSettings |
Ajuste avanzado para personalizar la ejecución de StackEnsemble. |
TabularFeaturizationSettings |
Configuración de caracterización para un trabajo de AutoML. |
TabularLimitSettings |
Limite la configuración de una tabla De AutoML verticales. |
TextClassificationJob |
Configuración del trabajo de clasificación de texto AutoML. Inicializa una nueva tarea clasificación de texto AutoML. |
TextClassificationMultilabelJob |
Configuración del trabajo multietiqueta de clasificación de texto AutoML. Inicializa una nueva tarea Multilabel de clasificación de texto AutoML. |
TextNerJob |
Configuración del trabajo de NER de texto autoML. Inicializa una nueva tarea NER de texto AutoML. |
TrainingSettings |
Clase TrainingSettings para Azure Machine Learning. Clase TrainingSettings para Azure Machine Learning. |
Enumeraciones
BlockedTransformers |
Enumeración para todos los modelos de clasificación admitidos por AutoML. |
ClassificationModels |
Enumeración para todos los modelos de clasificación admitidos por AutoML. |
ClassificationMultilabelPrimaryMetrics |
Métricas principales para las tareas de varias etiquetas de clasificación. |
ClassificationPrimaryMetrics |
Métricas principales para las tareas de clasificación. |
FeaturizationMode |
Modo de caracterización: determina el modo de caracterización de datos. |
ForecastHorizonMode |
Enumeración para determinar el modo de selección del horizonte de previsión. |
ForecastingModels |
Enumeración para todos los modelos de previsión admitidos por AutoML. |
ForecastingPrimaryMetrics |
Métricas principales de la tarea Previsión. |
InstanceSegmentationPrimaryMetrics |
Métricas principales para las tareas instanceSegmentation. |
LearningRateScheduler |
Enumeración del programador de velocidad de aprendizaje. |
LogTrainingMetrics |
Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2. Entre las áreas principales se incluyen la administración de tareas de AutoML. |
LogValidationLoss |
Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2. Entre las áreas principales se incluyen la administración de tareas de AutoML. |
NCrossValidationsMode |
Determina cómo se determina el valor de N-Cross validations. |
ObjectDetectionPrimaryMetrics |
Métricas principales de la tarea Image ObjectDetection. |
RegressionModels |
Enumeración para todos los modelos de regresión admitidos por AutoML. |
RegressionPrimaryMetrics |
Métricas principales de la tarea Regresión. |
SamplingAlgorithmType |
Contiene clases de aprendizaje automático automatizado para el SDK de Azure Machine Learningv2. Entre las áreas principales se incluyen la administración de tareas de AutoML. |
ShortSeriesHandlingConfiguration |
Parámetro que define si AutoML debe controlar series temporales cortas. |
StochasticOptimizer |
Optimizador estocástico para modelos de imagen. |
TargetAggregationFunction |
Función de agregado de destino. |
TargetLagsMode |
Modos de selección de retardos de destino. |
TargetRollingWindowSizeMode |
Modo de tamaño de ventanas graduales de destino. |
UseStl |
Configura la descomposición de STL de la columna de destino de la serie temporal. |
ValidationMetricType |
Método de cálculo de métricas que se va a usar para las métricas de validación en las tareas de imagen. |
Funciones
classification
Función para crear un Objeto ClassificationJob.
Un trabajo de clasificación se usa para entrenar un modelo que prediga mejor la clase de un ejemplo de datos. Varios modelos se entrenan mediante los datos de entrenamiento. El modelo con el mejor rendimiento en los datos de validación basados en la métrica principal se selecciona como modelo final.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a training_data
los parámetros y test_data
. validation_data
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: precisión, AUC_weighted, norm_macro_recall, average_precision_score_weighted y precision_score_weighted valores predeterminados de precisión
- enable_model_explainability
- bool
Si se habilita la explicación del mejor modelo de AutoML al final de todas las iteraciones de entrenamiento de AutoML. El valor predeterminado es none. Para más información, consulte Interpretación: capacidad de explicación de modelos de aprendizaje automático automatizado (versión preliminar).
- weight_column_name
- str
Nombre de la columna de peso de muestra. El aprendizaje automático automatizado admite una columna de peso como entrada, lo que provoca que las filas de los datos se puedan subir o bajar. Si los datos de entrada son de un elemento Pandas.DataFrame que no tiene nombres de columna, se pueden usar índices de columna en su lugar, expresados como enteros.
Este parámetro es aplicable a training_data
los parámetros y validation_data
- validation_data
- Input
Datos de validación que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).
El valor predeterminado es None
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca n_cross_validations
o validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
Para el plegado de validación cruzada personalizado, use cv_split_column_names
.
Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.
El valor predeterminado es None
Número de validaciones cruzadas que se realizan cuando no se especifican los datos de validación del usuario.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca n_cross_validations
o validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
Para el plegado de validación cruzada personalizado, use cv_split_column_names
.
Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.
El valor predeterminado es None
Lista de nombres de las columnas que contienen una división de validación cruzada personalizada. Cada una de las columnas de división de CV representa una división de CV donde cada fila se marca como 1 para el entrenamiento o 0 para la validación.
El valor predeterminado es None
- test_data
- Input
La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Los datos de prueba que se usarán para una ejecución de pruebas que se iniciarán automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.
Si no se especifica este parámetro o el parámetro test_data_size
, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.
Los datos de prueba deben contener características y columnas de etiqueta.
Si se especifica test_data
, se debe especificar el parámetro target_column_name
.
El valor predeterminado es None
- test_data_size
- float
La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Qué fracción de los datos de entrenamiento se va a mantener para los datos de prueba de una ejecución de prueba que se iniciará automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.
Debe estar entre 0,0 y 1,0 no inclusivo.
Si se especifica test_data_size
al mismo tiempo que validation_data_size
, los datos de prueba se dividen de training_data
antes de dividir los datos de validación.
Por ejemplo, si validation_data_size=0.1
, test_data_size=0.1
y los datos de entrenamiento originales tienen 1000 filas, los datos de prueba tendrán 100 filas, los datos de validación contendrán 90 filas y los datos de entrenamiento tendrán 810 filas.
En las tareas de regresión se usa el muestreo aleatorio. Para las tareas de clasificación, se usa el muestreo estratificado. La previsión no admite actualmente la especificación de un conjunto de datos de prueba mediante una división de entrenamiento o prueba.
Si no se especifica este parámetro o el parámetro test_data
, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.
El valor predeterminado es None
Devoluciones
Objeto de trabajo que se puede enviar a un proceso de Azure ML para su ejecución.
Tipo de valor devuelto
forecasting
Función para crear un trabajo de previsión.
Una tarea de previsión se usa para predecir los valores de destino de un período de tiempo futuro basado en los datos históricos. Varios modelos se entrenan mediante los datos de entrenamiento. El modelo con el mejor rendimiento en los datos de validación basados en la métrica principal se selecciona como modelo final.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a training_data
los validation_data
parámetros , y test_data
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error valores predeterminados para normalized_root_mean_squared_error
- enable_model_explainability
- bool
Si se habilita la explicación del mejor modelo de AutoML al final de todas las iteraciones de entrenamiento de AutoML. El valor predeterminado es none. Para más información, consulte Interpretación: capacidad de explicación de modelos de aprendizaje automático automatizado (versión preliminar).
- weight_column_name
- str
Nombre de la columna de peso de muestra. El aprendizaje automático automatizado admite una columna de peso como entrada, lo que provoca que las filas de los datos se puedan subir o bajar. Si los datos de entrada son de un elemento Pandas.DataFrame que no tiene nombres de columna, se pueden usar índices de columna en su lugar, expresados como enteros.
Este parámetro es aplicable a training_data
los parámetros y validation_data
- validation_data
- Input
Datos de validación que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).
El valor predeterminado es None
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca n_cross_validations
o validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
Para el plegado de validación cruzada personalizado, use cv_split_column_names
.
Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.
El valor predeterminado es None
Número de validaciones cruzadas que se realizan cuando no se especifican los datos de validación del usuario.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca n_cross_validations
o validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
Para el plegado de validación cruzada personalizado, use cv_split_column_names
.
Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.
El valor predeterminado es None
Lista de nombres de las columnas que contienen una división de validación cruzada personalizada. Cada una de las columnas de división de CV representa una división de CV donde cada fila se marca como 1 para el entrenamiento o 0 para la validación.
El valor predeterminado es None
- test_data
- Input
La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Los datos de prueba que se usarán para una ejecución de pruebas que se iniciarán automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.
Si no se especifica este parámetro o el parámetro test_data_size
, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.
Los datos de prueba deben contener características y columnas de etiqueta.
Si se especifica test_data
, se debe especificar el parámetro target_column_name
.
El valor predeterminado es None
- test_data_size
- float
La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Qué fracción de los datos de entrenamiento se va a mantener para los datos de prueba de una ejecución de prueba que se iniciará automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.
Debe estar entre 0,0 y 1,0 no inclusivo.
Si se especifica test_data_size
al mismo tiempo que validation_data_size
, los datos de prueba se dividen de training_data
antes de dividir los datos de validación.
Por ejemplo, si validation_data_size=0.1
, test_data_size=0.1
y los datos de entrenamiento originales tienen 1000 filas, los datos de prueba tendrán 100 filas, los datos de validación contendrán 90 filas y los datos de entrenamiento tendrán 810 filas.
En las tareas de regresión se usa el muestreo aleatorio. Para las tareas de clasificación, se usa el muestreo estratificado. La previsión no admite actualmente la especificación de un conjunto de datos de prueba mediante una división de entrenamiento o prueba.
Si no se especifica este parámetro o el parámetro test_data
, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.
El valor predeterminado es None
- forecasting_settings
- ForecastingSettings
La configuración de la tarea de previsión
Devoluciones
Objeto de trabajo que se puede enviar a un proceso de Azure ML para su ejecución.
Tipo de valor devuelto
image_classification
Crea un objeto para el trabajo clasificación de varias clases de imagen de AutoML.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento.
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a los parámetros training_data
y validation_data
.
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: precisión, AUC_weighted, norm_macro_recall, average_precision_score_weighted y precision_score_weighted Valores predeterminados de precisión.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento.
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
El valor predeterminado es .2.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Objeto de trabajo de clasificación de imágenes que se puede enviar a un proceso de Azure ML para su ejecución.
Tipo de valor devuelto
image_classification_multilabel
Crea un objeto para el trabajo clasificación de varias etiquetas de imagen autoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento.
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a los parámetros training_data
y validation_data
.
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: precisión, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted y Valores predeterminados de Iou en Iou.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento.
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
El valor predeterminado es .2.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Imagen del objeto de trabajo de clasificación de varias etiquetas que se puede enviar a un proceso de Azure ML para su ejecución.
Tipo de valor devuelto
image_instance_segmentation
Crea un objeto para el trabajo segmentación de instancia de imagen autoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento.
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a los parámetros training_data
y validation_data
.
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento.
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
El valor predeterminado es .2.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Trabajo de segmentación de instancias de imagen
Tipo de valor devuelto
image_object_detection
Crea un objeto para el trabajo detección de objetos de imagen autoML.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento.
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a los parámetros training_data
y validation_data
.
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento.
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
El valor predeterminado es .2.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Objeto de trabajo de detección de objetos de imagen que se puede enviar a un proceso de Azure ML para su ejecución.
Tipo de valor devuelto
regression
Función para crear un trabajo de regresión.
Un trabajo de regresión se usa para entrenar un modelo para predecir valores continuos de una variable de destino a partir de un conjunto de datos. Varios modelos se entrenan mediante los datos de entrenamiento. El modelo con el mejor rendimiento en los datos de validación basados en la métrica principal se selecciona como modelo final.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).
- target_column_name
- str
Nombre de la columna de etiquetas.
Este parámetro es aplicable a training_data
los validation_data
parámetros , y test_data
- primary_metric
Métrica que Automated Machine Learning optimizará para la selección del modelo. AutoML recopila más métricas de las que puede optimizar. Para obtener más información sobre cómo se calculan las métricas, vea https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceptables: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. El valor predeterminado es normalized_root_mean_squared_error
- enable_model_explainability
- bool
Si se habilita la explicación del mejor modelo de AutoML al final de todas las iteraciones de entrenamiento de AutoML. El valor predeterminado es none. Para más información, consulte Interpretación: capacidad de explicación de modelos de aprendizaje automático automatizado (versión preliminar).
- weight_column_name
- str
Nombre de la columna de peso de muestra. El aprendizaje automático automatizado admite una columna de peso como entrada, lo que provoca que las filas de los datos se puedan subir o bajar. Si los datos de entrada son de un elemento Pandas.DataFrame que no tiene nombres de columna, se pueden usar índices de columna en su lugar, expresados como enteros.
Este parámetro es aplicable a training_data
los parámetros y validation_data
- validation_data
- Input
Datos de validación que se usarán dentro del experimento. Debe contener características de entrenamiento y una columna de etiqueta (opcionalmente, una columna de pesos de ejemplo).
El valor predeterminado es None
- validation_data_size
- float
Fracción de los datos que se va a contener para la validación cuando no se especifican los datos de validación de usuario. Debe estar entre 0,0 y 1,0 no inclusivo.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca n_cross_validations
o validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
Para el plegado de validación cruzada personalizado, use cv_split_column_names
.
Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.
El valor predeterminado es None
Número de validaciones cruzadas que se realizan cuando no se especifican los datos de validación del usuario.
Especifique validation_data
para proporcionar datos de validación; de lo contrario, establezca n_cross_validations
o validation_data_size
para extraer los datos de validación de los datos de entrenamiento especificados.
Para el plegado de validación cruzada personalizado, use cv_split_column_names
.
Para obtener más información, consulte Configuración de las divisiones de datos y la validación cruzada en aprendizaje automático automatizado.
El valor predeterminado es None
Lista de nombres de las columnas que contienen una división de validación cruzada personalizada. Cada una de las columnas de división de CV representa una división de CV donde cada fila se marca como 1 para el entrenamiento o 0 para la validación.
El valor predeterminado es None
- test_data
- Input
La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Los datos de prueba que se usarán para una ejecución de pruebas que se iniciarán automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.
Si no se especifica este parámetro o el parámetro test_data_size
, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.
Los datos de prueba deben contener características y columnas de etiqueta.
Si se especifica test_data
, se debe especificar el parámetro target_column_name
.
El valor predeterminado es None
- test_data_size
- float
La característica Prueba de modelo mediante conjuntos de datos de prueba o divisiones de datos de prueba es una característica en estado de versión preliminar y puede cambiar en cualquier momento. Qué fracción de los datos de entrenamiento se va a mantener para los datos de prueba de una ejecución de prueba que se iniciará automáticamente una vez completado el entrenamiento del modelo. La serie de pruebas calculará las predicciones con el mejor modelo y generará métricas con arreglo a estas predicciones.
Debe estar entre 0,0 y 1,0 no inclusivo.
Si se especifica test_data_size
al mismo tiempo que validation_data_size
, los datos de prueba se dividen de training_data
antes de dividir los datos de validación.
Por ejemplo, si validation_data_size=0.1
, test_data_size=0.1
y los datos de entrenamiento originales tienen 1000 filas, los datos de prueba tendrán 100 filas, los datos de validación contendrán 90 filas y los datos de entrenamiento tendrán 810 filas.
En las tareas de regresión se usa el muestreo aleatorio. Para las tareas de clasificación, se usa el muestreo estratificado. La previsión no admite actualmente la especificación de un conjunto de datos de prueba mediante una división de entrenamiento o prueba.
Si no se especifica este parámetro o el parámetro test_data
, no se ejecutará ninguna ejecución de prueba automáticamente una vez completado el entrenamiento del modelo.
El valor predeterminado es None
Devoluciones
Objeto de trabajo que se puede enviar a un proceso de Azure ML para su ejecución.
Tipo de valor devuelto
text_classification
Función para crear un TextClassificationJob.
Un trabajo de clasificación de texto se usa para entrenar un modelo que puede predecir la clase o categoría de los datos de texto. Los datos de entrenamiento de entrada deben incluir una columna de destino que clasifique el texto en exactamente una clase.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.
- target_column_name
- str
Nombre de la columna de destino.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Métrica principal de la tarea. Valores aceptables: precisión, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Nivel de detalle del registro.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Objeto TextClassificationJob.
Tipo de valor devuelto
text_classification_multilabel
Función para crear un TextClassificationMultilabelJob.
Un trabajo de varias etiquetas de clasificación de texto se usa para entrenar un modelo que puede predecir las clases o categorías de datos de texto. Los datos de entrenamiento de entrada deben incluir una columna de destino que clasifique el texto en clases. Para obtener más información sobre el formato de los datos de varias etiquetas, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.
- target_column_name
- str
Nombre de la columna de destino.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.
- primary_metric
- str
Métrica principal de la tarea. Valores aceptables: precisión
- log_verbosity
- str
Nivel de detalle del registro.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Objeto TextClassificationMultilabelJob.
Tipo de valor devuelto
text_ner
Función para crear un TextNerJob.
Un trabajo de reconocimiento de entidades con nombre de texto se usa para entrenar un modelo que pueda predecir las entidades con nombre en el texto. Los datos de entrenamiento de entrada deben ser un archivo de texto en formato CoNLL. Para obtener más información sobre el formato de los datos NER de texto, consulte: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parámetros
- training_data
- Input
Datos de entrenamiento que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.
- validation_data
- Input
Datos de validación que se usarán dentro del experimento. Debe contener tanto las características de entrenamiento como una columna de destino.
- primary_metric
- str
Métrica principal de la tarea. Valores aceptables: precisión
- log_verbosity
- str
Nivel de detalle del registro.
- kwargs
- dict
Diccionario de parámetros de configuración adicionales.
Devoluciones
Objeto TextNerJob.
Tipo de valor devuelto
Azure SDK for Python