automl Pacote
Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning.
As áreas principais incluem a gestão de tarefas de AutoML.
Classes
ClassificationJob |
Configuração da Tarefa de Classificação de AutoML. Inicializar uma nova tarefa de Classificação de AutoML. |
ColumnTransformer |
Definições do transformador de colunas. |
ForecastingJob |
Configuração da Tarefa de Previsão de AutoML. Inicializar uma nova tarefa de Previsão de AutoML. |
ForecastingSettings |
Definições de previsão para uma Tarefa de AutoML. |
ImageClassificationJob |
Configuração para tarefa de Classificação de Imagens de várias classes do AutoML. Inicializar uma nova tarefa de Classificação de Imagens de várias classes de AutoML. |
ImageClassificationMultilabelJob |
Configuração para tarefa de Classificação de Imagens de várias etiquetas do AutoML. Inicializar uma nova tarefa de Classificação de Imagens de multi-etiquetas autoML. |
ImageClassificationSearchSpace |
Espaço de pesquisa para tarefas De Classificação de Imagens de AutoML e Classificação de Imagens Multilabel. |
ImageInstanceSegmentationJob |
Configuração da tarefa de Segmentação de Instâncias de Imagem de AutoML. Inicializar uma nova tarefa de Segmentação de Instâncias de Imagem de AutoML. |
ImageLimitSettings |
Limite as definições para Verticais de Imagem autoML. ImageLimitSettings é uma classe que contém os seguintes parâmetros: max_concurrent_trials, max_trials e timeout_minutes. Este é um método de configuração opcional para configurar parâmetros de limites, como tempos limite, etc. Nota O número de execuções simultâneas é controlado nos recursos disponíveis no destino de computação especificado. Certifique-se de que o destino de computação tem os recursos disponíveis para a simultaneidade pretendida. Dica É uma boa prática corresponder max_concurrent_trials contagem com o número de nós no cluster. Por exemplo, se tiver um cluster com 4 nós, defina max_concurrent_trials como 4. Utilização de exemplo Configuração de ImageLimitSettings
Inicializar um objeto ImageLimitSettings. Construtor para ImageLimitSettings para Verticais de Imagens de AutoML. |
ImageModelSettingsClassification |
Definições de modelo para tarefas de Classificação de Imagens de AutoML. |
ImageModelSettingsObjectDetection |
Definições de modelo para Tarefa de Deteção de Objetos de Imagem autoML. |
ImageObjectDetectionJob |
Configuração da tarefa de Deteção de Objetos de Imagem autoML. Inicializar uma nova tarefa de Deteção de Objetos de Imagem autoML. |
ImageObjectDetectionSearchSpace |
Espaço de pesquisa para tarefas de Deteção de Objetos de Imagem AutoML e Segmentação de Instâncias de Imagem. |
ImageSweepSettings |
Definições de varrimento para todos os Verticais de Imagem autoML. |
NlpFeaturizationSettings |
Definições de caracterização para todos os Verticais NLP de AutoML. |
NlpFixedParameters |
Objeto para alojar parâmetros fixos para tarefas NLP. |
NlpLimitSettings |
Limite as definições para todos os Verticais NLP de AutoML. |
NlpSearchSpace |
Espaço de pesquisa para tarefas NLP de AutoML. |
NlpSweepSettings |
Definições de varrimento para todas as tarefas NLP de AutoML. |
RegressionJob |
Configuração da Tarefa de Regressão de AutoML. Inicializar uma nova tarefa de Regressão de AutoML. |
SearchSpace |
Classe SearchSpace para verticais de AutoML. |
StackEnsembleSettings |
Definição avançada para personalizar a execução stackEnsemble. |
TabularFeaturizationSettings |
Definições de caracterização para uma Tarefa de AutoML. |
TabularLimitSettings |
Limitar as definições de uma Tabela AutoML Verticais. |
TextClassificationJob |
Configuração da Tarefa de Classificação de Textos de AutoML. Inicializa uma nova tarefa de Classificação de Texto autoML. |
TextClassificationMultilabelJob |
Configuração da Tarefa Multilabela de Classificação de Textos de AutoML. Inicializa uma nova tarefa Multilabel de Classificação de Texto autoML. |
TextNerJob |
Configuração para Tarefa de NER de Texto de AutoML. Inicializa uma nova tarefa NER de Texto autoML. |
TrainingSettings |
TrainingSettings class for Azure Machine Learning (Classe TrainingSettings para o Azure Machine Learning). TrainingSettings class for Azure Machine Learning (Classe TrainingSettings para o Azure Machine Learning). |
Enumerações
BlockedTransformers |
Enumeração para todos os modelos de classificação suportados pelo AutoML. |
ClassificationModels |
Enumeração para todos os modelos de classificação suportados pelo AutoML. |
ClassificationMultilabelPrimaryMetrics |
Métricas primárias para tarefas com várias etiquetas de classificação. |
ClassificationPrimaryMetrics |
Métricas primárias para tarefas de classificação. |
FeaturizationMode |
Modo de caracterização – determina o modo de caracterização de dados. |
ForecastHorizonMode |
Enumerar para determinar o modo de seleção de horizonte de previsão. |
ForecastingModels |
Enumeração para todos os modelos de previsão suportados pelo AutoML. |
ForecastingPrimaryMetrics |
Métricas primárias da tarefa Previsão. |
InstanceSegmentationPrimaryMetrics |
Métricas primárias para tarefas InstanceSegmentation. |
LearningRateScheduler |
Enumeração do agendador de taxa de aprendizagem. |
LogTrainingMetrics |
Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning. As áreas principais incluem a gestão de tarefas de AutoML. |
LogValidationLoss |
Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning. As áreas principais incluem a gestão de tarefas de AutoML. |
NCrossValidationsMode |
Determina a forma como o valor de validações N-Cross é determinado. |
ObjectDetectionPrimaryMetrics |
Métricas primárias da tarefa Image ObjectDetection. |
RegressionModels |
Enumeração para todos os modelos de Regressão suportados pelo AutoML. |
RegressionPrimaryMetrics |
Métricas primárias da tarefa regressão. |
SamplingAlgorithmType |
Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning. As áreas principais incluem a gestão de tarefas de AutoML. |
ShortSeriesHandlingConfiguration |
O parâmetro que define como se o AutoML deve processar séries de tempo curtos. |
StochasticOptimizer |
Otimizador estocástico para modelos de imagem. |
TargetAggregationFunction |
Função de agregação de destino. |
TargetLagsMode |
O destino desfasa os modos de seleção. |
TargetRollingWindowSizeMode |
Modo de tamanho de janelas sem interrupção de destino. |
UseStl |
Configure a Decomposição de STL da coluna de destino da série temporal. |
ValidationMetricType |
Método de computação de métricas a utilizar para métricas de validação em tarefas de imagem. |
Funções
classification
Função para criar um ClassificationJob.
Uma tarefa de classificação é utilizada para preparar um modelo que melhor prevê a classe de um exemplo de dados. Vários modelos são preparados com os dados de preparação. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de etiqueta (opcionalmente, uma coluna de pesos de exemplo).
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável a training_data
parâmetros e validation_data
test_data
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Predefinições para precisão
- enable_model_explainability
- bool
Se pretende ativar a explicação do melhor modelo de AutoML no final de todas as iterações de preparação de AutoML. A predefinição é Nenhum. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos no machine learning automatizado).
- weight_column_name
- str
O nome da coluna de peso de exemplo. O ML automatizado suporta uma coluna ponderada como entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada forem de um pandas. DataFrame que não tem nomes de colunas, os índices de colunas podem ser utilizados, expressos como números inteiros.
Este parâmetro é aplicável aos training_data
parâmetros e validation_data
- validation_data
- Input
Os dados de validação a utilizar na experimentação. Deve conter as funcionalidades de preparação e a coluna de etiquetas (opcionalmente, uma coluna de pesos de exemplo).
Predefinições para Nenhum
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina n_cross_validations
ou validation_data_size
extraia dados de validação dos dados de preparação especificados.
Para a dobra de validação cruzada personalizada, utilize cv_split_column_names
.
Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.
Predefinições para Nenhum
Quantas validações cruzadas deve executar quando os dados de validação do utilizador não são especificados.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina n_cross_validations
ou validation_data_size
extraia dados de validação dos dados de preparação especificados.
Para a pasta de validação cruzada personalizada, utilize cv_split_column_names
.
Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.
Predefinições para Nenhum
Lista de nomes das colunas que contêm a divisão de validação cruzada personalizada. Cada uma das colunas divididas por CV representa uma divisão cv em que cada linha está marcada como 1 para preparação ou 0 para validação.
Predefinições para Nenhum
- test_data
- Input
A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Os dados de teste a utilizar para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.
Se este parâmetro ou o test_data_size
parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.
Os dados de teste devem conter funcionalidades e colunas de etiqueta.
Se test_data
for especificado, o target_column_name
parâmetro tem de ser especificado.
Predefinições para Nenhum
- test_data_size
- float
A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Que fração dos dados de preparação a reter para dados de teste para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.
Isto deve estar entre 0,0 e 1.0 não inclusivo.
Se test_data_size
for especificado ao mesmo tempo que validation_data_size
, os dados de teste serão divididos antes de training_data
os dados de validação serem divididos.
Por exemplo, se validation_data_size=0.1
, test_data_size=0.1
e os dados de preparação originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação conterão 90 linhas e os dados de preparação terão 810 linhas.
Para tarefas baseadas em regressão, é utilizada uma amostragem aleatória. Para tarefas de classificação, é utilizada a amostragem estratificada. A previsão não suporta atualmente a especificação de um conjunto de dados de teste com uma divisão de preparação/teste.
Se este parâmetro ou o test_data
parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.
Predefinições para Nenhum
Devoluções
Um objeto de tarefa que pode ser submetido a uma computação do Azure ML para execução.
Tipo de retorno
forecasting
Função para criar uma tarefa de Previsão.
Uma tarefa de previsão é utilizada para prever valores de destino para um período de tempo futuro com base nos dados históricos. Vários modelos são preparados com os dados de preparação. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação. Deve conter as funcionalidades de preparação e uma coluna de etiqueta (opcionalmente uma coluna de pesos de exemplo).
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável a training_data
, validation_data
e test_data
parâmetros
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Predefinições para normalized_root_mean_squared_error
- enable_model_explainability
- bool
Se pretende ativar a explicação do melhor modelo autoML no final de todas as iterações de preparação autoML. A predefinição é Nenhuma. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos na aprendizagem automática automatizada).
- weight_column_name
- str
O nome da coluna de peso de exemplo. O ML automatizado suporta uma coluna ponderada como entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada forem de um pandas. DataFrame que não tem nomes de colunas, os índices de colunas podem ser utilizados, expressos como números inteiros.
Este parâmetro é aplicável a training_data
parâmetros e validation_data
- validation_data
- Input
Os dados de validação a utilizar na experimentação. Deve conter as funcionalidades de preparação e a coluna de etiquetas (opcionalmente uma coluna de pesos de exemplo).
Predefinições para Nenhum
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Isto deve estar entre 0,0 e 1.0 não inclusivo.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina n_cross_validations
ou validation_data_size
extraia dados de validação dos dados de preparação especificados.
Para a pasta de validação cruzada personalizada, utilize cv_split_column_names
.
Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.
Predefinições para Nenhum
Quantas validações cruzadas deve executar quando os dados de validação do utilizador não são especificados.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina n_cross_validations
ou validation_data_size
extraia dados de validação dos dados de preparação especificados.
Para a pasta de validação cruzada personalizada, utilize cv_split_column_names
.
Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.
Predefinições para Nenhum
Lista de nomes das colunas que contêm a divisão de validação cruzada personalizada. Cada uma das colunas divididas por CV representa uma divisão cv em que cada linha está marcada como 1 para preparação ou 0 para validação.
Predefinições para Nenhum
- test_data
- Input
A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Os dados de teste a utilizar para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.
Se este parâmetro ou o test_data_size
parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.
Os dados de teste devem conter funcionalidades e colunas de etiqueta.
Se test_data
for especificado, o target_column_name
parâmetro tem de ser especificado.
Predefinições para Nenhum
- test_data_size
- float
A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Que fração dos dados de preparação a reter para dados de teste para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.
Isto deve estar entre 0,0 e 1.0 não inclusivo.
Se test_data_size
for especificado ao mesmo tempo que validation_data_size
, os dados de teste serão divididos antes de training_data
os dados de validação serem divididos.
Por exemplo, se validation_data_size=0.1
, test_data_size=0.1
e os dados de preparação originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação conterão 90 linhas e os dados de preparação terão 810 linhas.
Para tarefas baseadas em regressão, é utilizada uma amostragem aleatória. Para tarefas de classificação, é utilizada a amostragem estratificada. A previsão não suporta atualmente a especificação de um conjunto de dados de teste com uma divisão de preparação/teste.
Se este parâmetro ou o test_data
parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.
Predefinições para Nenhum
- forecasting_settings
- ForecastingSettings
As definições da tarefa de previsão
Devoluções
Um objeto de tarefa que pode ser submetido a uma computação do Azure ML para execução.
Tipo de retorno
image_classification
Cria um objeto para a tarefa de Classificação de várias classes da Imagem autoML.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação.
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável a training_data
parâmetros e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Predefinições para precisão.
- validation_data
- Input
Os dados de validação a utilizar na experimentação.
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Isto deve estar entre 0,0 e 1.0 não inclusivo.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de preparação especificados.
Predefinições para .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
Objeto de tarefa de classificação de imagens que pode ser submetido para uma computação do Azure ML para execução.
Tipo de retorno
image_classification_multilabel
Cria um objeto para a tarefa de Classificação de várias etiquetas da Imagem autoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação.
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável aos training_data
parâmetros e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted e Predefinições Iou.
- validation_data
- Input
Os dados de validação a utilizar na experimentação.
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de preparação especificados.
Predefinições para .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
Imagem de objeto de tarefa de classificação de várias etiquetas que pode ser submetido a uma computação do Azure ML para execução.
Tipo de retorno
image_instance_segmentation
Cria um objeto para a tarefa de Segmentação de Instâncias de Imagem autoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação.
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável aos training_data
parâmetros e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Os dados de validação a utilizar na experimentação.
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de preparação especificados.
Predefinições para .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
Tarefa de segmentação de instância de imagem
Tipo de retorno
image_object_detection
Cria um objeto para a tarefa de Deteção de Objetos de Imagem autoML.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação.
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável aos training_data
parâmetros e validation_data
.
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Os dados de validação a utilizar na experimentação.
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina validation_data_size
para extrair dados de validação dos dados de preparação especificados.
Predefinições para .2
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
Objeto de tarefa de deteção de objetos de imagem que pode ser submetido para uma computação do Azure ML para execução.
Tipo de retorno
regression
Função para criar uma Tarefa de Regressão.
Uma tarefa de regressão é utilizada para preparar um modelo para prever valores contínuos de uma variável de destino a partir de um conjunto de dados. Vários modelos são preparados com os dados de preparação. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de etiqueta (opcionalmente, uma coluna de pesos de exemplo).
- target_column_name
- str
O nome da coluna de etiqueta.
Este parâmetro é aplicável a training_data
parâmetros e validation_data
test_data
- primary_metric
A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Valores aceitáveis: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. Predefinições para normalized_root_mean_squared_error
- enable_model_explainability
- bool
Se pretende ativar a explicação do melhor modelo de AutoML no final de todas as iterações de preparação de AutoML. A predefinição é Nenhum. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos no machine learning automatizado).
- weight_column_name
- str
O nome da coluna de peso de exemplo. O ML automatizado suporta uma coluna ponderada como entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada forem de um pandas. DataFrame que não tem nomes de colunas, os índices de colunas podem ser utilizados, expressos como números inteiros.
Este parâmetro é aplicável aos training_data
parâmetros e validation_data
- validation_data
- Input
Os dados de validação a utilizar na experimentação. Deve conter as funcionalidades de preparação e a coluna de etiquetas (opcionalmente, uma coluna de pesos de exemplo).
Predefinições para Nenhum
- validation_data_size
- float
Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina n_cross_validations
ou validation_data_size
extraia dados de validação dos dados de preparação especificados.
Para a dobra de validação cruzada personalizada, utilize cv_split_column_names
.
Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.
Predefinições para Nenhum
Quantas validações cruzadas efetuar quando os dados de validação do utilizador não são especificados.
Especifique validation_data
para fornecer dados de validação, caso contrário, defina n_cross_validations
ou validation_data_size
extraia dados de validação dos dados de preparação especificados.
Para a dobra de validação cruzada personalizada, utilize cv_split_column_names
.
Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.
Predefinições para Nenhum
Lista de nomes das colunas que contêm a divisão de validação cruzada personalizada. Cada uma das colunas divididas por CV representa uma divisão cv em que cada linha está marcada como 1 para preparação ou 0 para validação.
Predefinições para Nenhum
- test_data
- Input
A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Os dados de teste a serem utilizados para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de testes obterá predições com o melhor modelo e calculará as métricas dadas estas predições.
Se este parâmetro ou o test_data_size
parâmetro não for especificado, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.
Os dados de teste devem conter funcionalidades e colunas de etiqueta.
Se test_data
for especificado, o target_column_name
parâmetro tem de ser especificado.
Predefinições para Nenhum
- test_data_size
- float
A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Que fração dos dados de preparação a reter para dados de teste para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de testes obterá predições com o melhor modelo e calculará as métricas dadas estas predições.
Deve ser entre 0.0 e 1.0 não inclusive.
Se test_data_size
for especificado ao mesmo tempo que validation_data_size
, os dados de teste são divididos antes de os dados de training_data
validação serem divididos.
Por exemplo, se validation_data_size=0.1
, test_data_size=0.1
e os dados de preparação originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação conterão 90 linhas e os dados de preparação terão 810 linhas.
Para tarefas baseadas em regressão, é utilizada a amostragem aleatória. Para tarefas de classificação, é utilizada a amostragem estratificada. Atualmente, a previsão não suporta a especificação de um conjunto de dados de teste com uma divisão de preparação/teste.
Se este parâmetro ou o test_data
parâmetro não for especificado, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.
Predefinições para Nenhum
Devoluções
Um objeto de tarefa que pode ser submetido para uma computação do Azure ML para execução.
Tipo de retorno
text_classification
Função para criar um TextClassificationJob.
Uma tarefa de classificação de textos é utilizada para preparar um modelo que possa prever a classe/categoria de dados de texto. Os dados de preparação de entrada devem incluir uma coluna de destino que classifica o texto em exatamente uma classe.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.
- target_column_name
- str
Nome da coluna de destino.
- validation_data
- Input
Os dados de validação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Métrica primária da tarefa. Valores aceitáveis: precisão, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Nível de verbosidade do registo.
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
O objeto TextClassificationJob.
Tipo de retorno
text_classification_multilabel
Função para criar um TextClassificationMultilabelJob.
Uma tarefa com várias etiquetas de classificação de textos é utilizada para preparar um modelo que possa prever as classes/categorias de dados de texto. Os dados de preparação de entrada devem incluir uma coluna de destino que classifica o texto na(es) classe(es). Para obter mais informações sobre o formato dos dados com várias etiquetas, veja: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.
- target_column_name
- str
Nome da coluna de destino.
- validation_data
- Input
Os dados de validação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.
- primary_metric
- str
Métrica primária da tarefa. Valores aceitáveis: precisão
- log_verbosity
- str
Nível de verbosidade do registo.
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
O objeto TextClassificationMultilabelJob.
Tipo de retorno
text_ner
Função para criar um TextNerJob.
Uma tarefa de reconhecimento de entidades denominada é utilizada para preparar um modelo que possa prever as entidades nomeadas no texto. Os dados de preparação de entrada devem ser um ficheiro de texto no formato CoNLL. Para obter mais informações sobre o formato dos dados NER de texto, veja: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parâmetros
- training_data
- Input
Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.
- validation_data
- Input
Os dados de validação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.
- primary_metric
- str
Métrica primária da tarefa. Valores aceitáveis: precisão
- log_verbosity
- str
Nível de verbosidade do registo.
- kwargs
- dict
Um dicionário de parâmetros de configuração adicionais.
Devoluções
O objeto TextNerJob.
Tipo de retorno
Azure SDK for Python