Delen via


automl Pakket

Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2.

De belangrijkste gebieden zijn het beheren van AutoML-taken.

Klassen

ClassificationJob

Configuratie voor AutoML-classificatietaak.

Initialiseer een nieuwe AutoML-classificatietaak.

ColumnTransformer

Instellingen voor kolomtransformator.

ForecastingJob

Configuratie voor AutoML-prognosetaak.

Initialiseer een nieuwe AutoML-prognosetaak.

ForecastingSettings

Instellingen voor prognoses voor een AutoML-taak.

ImageClassificationJob

Configuratie voor autoML-taak voor afbeeldingsclassificatie met meerdere klassen.

Initialiseer een nieuwe AutoML-taak voor afbeeldingsclassificatie met meerdere klassen.

ImageClassificationMultilabelJob

Configuratie voor autoML-taak voor afbeeldingsclassificatie met meerdere labels.

Initialiseer een nieuwe AutoML-taak voor afbeeldingsclassificatie met meerdere labels.

ImageClassificationSearchSpace

Zoekruimte voor autoML-afbeeldingsclassificatie en afbeeldingsclassificatie met meerdere labels.

ImageInstanceSegmentationJob

Configuratie voor de taak Segmentatie van autoML-installatiekopieën.

Initialiseer een nieuwe taak voor het segmenteren van een exemplaar van een AutoML-installatiekopieën.

ImageLimitSettings

Instellingen voor AutoML-afbeeldingsverticalen beperken.

ImageLimitSettings is een klasse die de volgende parameters bevat: max_concurrent_trials, max_trials en timeout_minutes.

Dit is een optionele configuratiemethode voor het configureren van limietparameters, zoals time-outs, enzovoort.

Notitie

Het aantal gelijktijdige uitvoeringen is afhankelijk van de resources die beschikbaar zijn in het opgegeven rekendoel.

Zorg ervoor dat het rekendoel de beschikbare resources heeft voor de gewenste gelijktijdigheid.

Tip

Het is een goede gewoonte om max_concurrent_trials aantal te vergelijken met het aantal knooppunten in het cluster.

Als u bijvoorbeeld een cluster met vier knooppunten hebt, stelt u max_concurrent_trials in op 4.

Voorbeeld van gebruik

Configuratie van ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Initialiseer een ImageLimitSettings-object.

Constructor voor ImageLimitSettings voor AutoML Image Verticals.

ImageModelSettingsClassification

Modelinstellingen voor autoML-afbeeldingsclassificatietaken.

ImageModelSettingsObjectDetection

Modelinstellingen voor AutoML Image Object Detection Task.

ImageObjectDetectionJob

Configuratie voor autoML Image Object Detection-taak.

Initialiseer een nieuwe AutoML Image Object Detection-taak.

ImageObjectDetectionSearchSpace

Zoekruimte naar autoML-afbeeldingsobjectdetectie en segmentatietaken van afbeeldingsexemplaar.

ImageSweepSettings

Veeginstellingen voor alle AutoML-afbeeldingsverticalen.

NlpFeaturizationSettings

Featurization-instellingen voor alle AutoML NLP Verticals.

NlpFixedParameters

Object om vaste parameters voor NLP-taken op te geven.

NlpLimitSettings

Beperk instellingen voor alle AutoML NLP-verticalen.

NlpSearchSpace

Zoekruimte voor AutoML NLP-taken.

NlpSweepSettings

Sweep-instellingen voor alle AutoML NLP-taken.

RegressionJob

Configuratie voor AutoML-regressietaak.

Initialiseer een nieuwe AutoML-regressietaak.

SearchSpace

SearchSpace-klasse voor AutoML-verticalen.

StackEnsembleSettings

Geavanceerde instelling om stackEnsemble-uitvoering aan te passen.

TabularFeaturizationSettings

Featurization-instellingen voor een AutoML-taak.

TabularLimitSettings

Instellingen beperken voor autoML-tabelverticalen.

TextClassificationJob

Configuratie voor autoML-tekstclassificatietaak.

Initialiseert een nieuwe AutoML-tekstclassificatietaak.

TextClassificationMultilabelJob

Configuratie voor autoML-tekstclassificatie multilabeltaak.

Initialiseert een nieuwe AutoML-taak voor tekstclassificatie met meerdere labels.

TextNerJob

Configuratie voor AutoML-tekst-NER-taak.

Initialiseert een nieuwe AutoML-tekst-NER-taak.

TrainingSettings

TrainingSettings-klasse voor Azure Machine Learning.

TrainingSettings-klasse voor Azure Machine Learning.

Enums

BlockedTransformers

Opsomming voor alle classificatiemodellen die door AutoML worden ondersteund.

ClassificationModels

Opsomming voor alle classificatiemodellen die door AutoML worden ondersteund.

ClassificationMultilabelPrimaryMetrics

Primaire metrische gegevens voor classificatietaken met meerdere labels.

ClassificationPrimaryMetrics

Primaire metrische gegevens voor classificatietaken.

FeaturizationMode

Featurization-modus: bepaalt de gegevens featurization-modus.

ForecastHorizonMode

Enum om de selectiemodus voor de voorspellingshorizon te bepalen.

ForecastingModels

Opsomming voor alle prognosemodellen die door AutoML worden ondersteund.

ForecastingPrimaryMetrics

Primaire metrische gegevens voor prognosetaak.

InstanceSegmentationPrimaryMetrics

Primaire metrische gegevens voor InstanceSegmentation-taken.

LearningRateScheduler

Enum learning rate scheduler.

LogTrainingMetrics

Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2.

De belangrijkste gebieden zijn het beheren van AutoML-taken.

LogValidationLoss

Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2.

De belangrijkste gebieden zijn het beheren van AutoML-taken.

NCrossValidationsMode

Bepaalt hoe de waarde van N-Cross-validaties wordt bepaald.

ObjectDetectionPrimaryMetrics

Primaire metrische gegevens voor de taak Image ObjectDetection.

RegressionModels

Opsomming voor alle regressiemodellen die worden ondersteund door AutoML.

RegressionPrimaryMetrics

Primaire metrische gegevens voor regressietaak.

SamplingAlgorithmType

Bevat geautomatiseerde machine learning-klassen voor Azure Machine Learning SDKv2.

De belangrijkste gebieden zijn het beheren van AutoML-taken.

ShortSeriesHandlingConfiguration

De parameter die definieert hoe autoML korte tijdreeksen moet verwerken.

StochasticOptimizer

Stochastic optimizer voor afbeeldingsmodellen.

TargetAggregationFunction

Statistische doelfunctie.

TargetLagsMode

Doel zorgt voor vertraging bij selectiemodi.

TargetRollingWindowSizeMode

Doelmodus voor de grootte van rollende vensters.

UseStl

Configureer STL-ontleding van de doelkolom van de tijdreeks.

ValidationMetricType

Metrische berekeningsmethode voor validatie van metrische gegevens in afbeeldingstaken.

Functies

classification

Functie voor het maken van een classificatietaak.

Een classificatietaak wordt gebruikt om een model te trainen dat de klasse van een gegevensvoorbeeld het beste voorspelt. Verschillende modellen worden getraind met behulp van de trainingsgegevens. Het model met de beste prestaties voor de validatiegegevens op basis van de primaire metrische gegevens wordt geselecteerd als het uiteindelijke model.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als een labelkolom bevatten (optioneel een voorbeeldkolom met gewichten).

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_datade parameters , validation_data en test_data

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: nauwkeurigheid, AUC_weighted, norm_macro_recall, average_precision_score_weighted en precision_score_weighted Standaardwaarden voor nauwkeurigheid

enable_model_explainability
bool

Of u uitleg van het beste AutoML-model aan het einde van alle AutoML-trainingsiteraties wilt inschakelen. De standaardwaarde is None. Zie Interpretability: model explanations in automated machine learning (Interpretability: model explanations in automated machine learning) voor meer informatie.

weight_column_name
str

De naam van de kolom met het gewicht van het voorbeeld. Geautomatiseerde ML ondersteunt een gewogen kolom als invoer, waardoor rijen in de gegevens omhoog of omlaag worden gewogen. Als de invoergegevens afkomstig zijn van een pandas. DataFrame dat geen kolomnamen heeft, kunnen in plaats daarvan kolomindexen worden gebruikt, uitgedrukt als gehele getallen.

Deze parameter is van toepassing op training_data parameters en validation_data

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als labelkolom bevatten (optioneel een kolom met voorbeeldgewichten).

Standaard ingesteld op Geen

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef op validation_data om validatiegegevens op te geven, anders in te stellen n_cross_validations of validation_data_size om validatiegegevens uit de opgegeven trainingsgegevens te extraheren. Gebruik cv_split_column_namesvoor aangepaste kruisvalidatievouw.

Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.

Standaard ingesteld op Geen

n_cross_validations
Union[str, int]

Hoeveel kruisvalidaties moeten worden uitgevoerd wanneer er geen gebruikersvalidatiegegevens zijn opgegeven.

Geef op validation_data om validatiegegevens op te geven, anders in te stellen n_cross_validations of validation_data_size om validatiegegevens uit de opgegeven trainingsgegevens te extraheren. Gebruik cv_split_column_namesvoor aangepaste kruisvalidatievouw.

Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.

Standaard ingesteld op Geen

cv_split_column_names
List[str]

Lijst met namen van de kolommen die een aangepaste kruisvalidatiesplitsing bevatten. Elk van de kolommen voor het splitsen van cv's vertegenwoordigt één CV-splitsing waarbij elke rij is gemarkeerd als 1 voor training of 0 voor validatie.

Standaard ingesteld op Geen

test_data
Input

De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. De testgegevens die moeten worden gebruikt voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.

Als deze parameter of de test_data_size parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid. Testgegevens moeten zowel functies als labelkolom bevatten. Als test_data is opgegeven, moet de target_column_name parameter worden opgegeven.

Standaard ingesteld op Geen

test_data_size
float

De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. Welk deel van de trainingsgegevens moet worden gebruikt voor testgegevens voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.

Dit moet tussen 0,0 en 1,0 niet-inclusief zijn. Als test_data_size wordt opgegeven op hetzelfde moment als validation_data_size, worden de testgegevens gesplitst training_data voordat de validatiegegevens worden gesplitst. Als validation_data_size=0.1bijvoorbeeld en test_data_size=0.1 de oorspronkelijke trainingsgegevens 1000 rijen hebben, hebben de testgegevens 100 rijen, bevatten de validatiegegevens 90 rijen en de trainingsgegevens 810 rijen.

Voor taken op basis van regressie wordt willekeurige steekproeven gebruikt. Voor classificatietaken wordt gestratificeerde steekproeven gebruikt. Prognose biedt momenteel geen ondersteuning voor het opgeven van een testgegevensset met behulp van een train-/testsplitsing.

Als deze parameter of de test_data parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.

Standaard ingesteld op Geen

Retouren

Een taakobject dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.

Retourtype

forecasting

Functie om een prognosetaak te maken.

Een prognosetaak wordt gebruikt om doelwaarden voor een toekomstige periode te voorspellen op basis van de historische gegevens. Verschillende modellen worden getraind met behulp van de trainingsgegevens. Het model met de beste prestaties voor de validatiegegevens op basis van de primaire metrische gegevens wordt geselecteerd als het uiteindelijke model.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als een labelkolom bevatten (optioneel een voorbeeldkolom met gewichten).

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_datade parameters , validation_data en test_data

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Standaardwaarden voor normalized_root_mean_squared_error

enable_model_explainability
bool

Of u uitleg van het beste AutoML-model aan het einde van alle AutoML-trainingsiteraties wilt inschakelen. De standaardwaarde is None. Zie Interpretability: model explanations in automated machine learning (Interpretability: model explanations in automated machine learning) voor meer informatie.

weight_column_name
str

De naam van de kolom met het gewicht van het voorbeeld. Geautomatiseerde ML ondersteunt een gewogen kolom als invoer, waardoor rijen in de gegevens omhoog of omlaag worden gewogen. Als de invoergegevens afkomstig zijn van een pandas. DataFrame dat geen kolomnamen heeft, kunnen in plaats daarvan kolomindexen worden gebruikt, uitgedrukt als gehele getallen.

Deze parameter is van toepassing op training_data parameters en validation_data

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als labelkolom bevatten (optioneel een kolom met voorbeeldgewichten).

Standaard ingesteld op Geen

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef op validation_data om validatiegegevens op te geven, anders in te stellen n_cross_validations of validation_data_size om validatiegegevens uit de opgegeven trainingsgegevens te extraheren. Gebruik cv_split_column_namesvoor aangepaste kruisvalidatievouw.

Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.

Standaard ingesteld op Geen

n_cross_validations
Union[str, int]

Hoeveel kruisvalidaties moeten worden uitgevoerd wanneer er geen gebruikersvalidatiegegevens zijn opgegeven.

Geef op validation_data om validatiegegevens op te geven, anders in te stellen n_cross_validations of validation_data_size om validatiegegevens uit de opgegeven trainingsgegevens te extraheren. Gebruik cv_split_column_namesvoor aangepaste kruisvalidatievouw.

Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.

Standaard ingesteld op Geen

cv_split_column_names
List[str]

Lijst met namen van de kolommen die een aangepaste kruisvalidatiesplitsing bevatten. Elk van de kolommen voor het splitsen van cv's vertegenwoordigt één CV-splitsing waarbij elke rij is gemarkeerd als 1 voor training of 0 voor validatie.

Standaard ingesteld op Geen

test_data
Input

De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. De testgegevens die moeten worden gebruikt voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.

Als deze parameter of de test_data_size parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid. Testgegevens moeten zowel functies als labelkolom bevatten. Als test_data is opgegeven, moet de target_column_name parameter worden opgegeven.

Standaard ingesteld op Geen

test_data_size
float

De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. Welk deel van de trainingsgegevens moet worden gebruikt voor testgegevens voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.

Dit moet tussen 0,0 en 1,0 niet-inclusief zijn. Als test_data_size wordt opgegeven op hetzelfde moment als validation_data_size, worden de testgegevens gesplitst training_data voordat de validatiegegevens worden gesplitst. Als validation_data_size=0.1bijvoorbeeld en test_data_size=0.1 de oorspronkelijke trainingsgegevens 1000 rijen hebben, hebben de testgegevens 100 rijen, bevatten de validatiegegevens 90 rijen en de trainingsgegevens 810 rijen.

Voor taken op basis van regressie wordt willekeurige steekproeven gebruikt. Voor classificatietaken wordt gestratificeerde steekproeven gebruikt. Prognose biedt momenteel geen ondersteuning voor het opgeven van een testgegevensset met behulp van een train-/testsplitsing.

Als deze parameter of de test_data parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.

Standaard ingesteld op Geen

forecasting_settings
ForecastingSettings

De instellingen voor de prognosetaak

Retouren

Een taakobject dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.

Retourtype

image_classification

Hiermee maakt u een object voor de classificatietaak autoML-installatiekopieën met meerdere klassen.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt.

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_data de parameters en validation_data .

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: nauwkeurigheid, AUC_weighted, norm_macro_recall, average_precision_score_weighted en precision_score_weighted Standaardwaarden voor nauwkeurigheid.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt.

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef validation_data op om validatiegegevens op te geven. Stel anders in validation_data_size dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.

Standaard ingesteld op .2

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Taakobject voor afbeeldingsclassificatie dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.

Retourtype

image_classification_multilabel

Hiermee maakt u een object voor de taak Classificatie van AutoML-installatiekopieën met meerdere labels.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt.

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_data de parameters en validation_data .

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: nauwkeurigheid, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted en standaardinstellingen voor Iou.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt.

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef validation_data op om validatiegegevens op te geven. Stel anders in validation_data_size dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.

Standaard ingesteld op .2

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Afbeelding van een classificatietaakobject met meerdere labels dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.

Retourtype

image_instance_segmentation

Hiermee maakt u een object voor de taak Segmentatie van autoML-installatiekopieënexemplaar.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt.

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_data de parameters en validation_data .

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: MeanAveragePrecision is standaard ingesteld op MeanAveragePrecision.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt.

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef validation_data op om validatiegegevens op te geven. Stel anders in validation_data_size dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.

Standaard ingesteld op .2

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Segmentatietaak voor afbeeldingsexemplaar

Retourtype

image_object_detection

Hiermee maakt u een object voor de taak AutoML Image Object Detection.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt.

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_data de parameters en validation_data .

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: MeanAveragePrecision is standaard ingesteld op MeanAveragePrecision.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt.

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef validation_data op om validatiegegevens op te geven. Stel anders in validation_data_size dat validatiegegevens uit de opgegeven trainingsgegevens worden geëxtraheerd.

Standaard ingesteld op .2

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Taakobject voor afbeeldingsobjectdetectie dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.

Retourtype

regression

Functie voor het maken van een regressietaak.

Een regressietaak wordt gebruikt om een model te trainen om continue waarden van een doelvariabele te voorspellen vanuit een gegevensset. Verschillende modellen worden getraind met behulp van de trainingsgegevens. Het model met de beste prestaties voor de validatiegegevens op basis van de primaire metrische gegevens wordt geselecteerd als het uiteindelijke model.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als een labelkolom bevatten (optioneel een voorbeeldkolom met gewichten).

target_column_name
str

De naam van de labelkolom. Deze parameter is van toepassing op training_datade parameters , validation_data en test_data

primary_metric

De metrische gegevens die met Geautomatiseerde Machine Learning worden geoptimaliseerd voor modelselectie. Geautomatiseerde Machine Learning verzamelt meer metrische gegevens dan kan worden geoptimaliseerd. Zie voor meer informatie over hoe metrische gegevens worden berekend https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Acceptabele waarden: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. Standaard ingesteld op normalized_root_mean_squared_error

enable_model_explainability
bool

Of u uitleg van het beste AutoML-model aan het einde van alle AutoML-trainingsiteraties wilt inschakelen. De standaardwaarde is None. Zie Interpretability: model explanations in automated machine learning (Interpretability: model explanations in automated machine learning) voor meer informatie.

weight_column_name
str

De naam van de kolom met het gewicht van het voorbeeld. Geautomatiseerde ML ondersteunt een gewogen kolom als invoer, waardoor rijen in de gegevens omhoog of omlaag worden gewogen. Als de invoergegevens afkomstig zijn van een pandas. DataFrame dat geen kolomnamen heeft, kunnen in plaats daarvan kolomindexen worden gebruikt, uitgedrukt als gehele getallen.

Deze parameter is van toepassing op training_data parameters en validation_data

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt. Deze moet zowel trainingsfuncties als labelkolom bevatten (optioneel een kolom met voorbeeldgewichten).

Standaard ingesteld op Geen

validation_data_size
float

Welk deel van de gegevens moet worden opgeslagen voor validatie wanneer er geen gebruikersvalidatiegegevens zijn opgegeven. Dit moet tussen 0,0 en 1,0 niet-inclusief zijn.

Geef op validation_data om validatiegegevens op te geven, anders in te stellen n_cross_validations of validation_data_size om validatiegegevens uit de opgegeven trainingsgegevens te extraheren. Gebruik cv_split_column_namesvoor aangepaste kruisvalidatievouw.

Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.

Standaard ingesteld op Geen

n_cross_validations
Union[str, int]

Hoeveel kruisvalidaties moeten worden uitgevoerd wanneer er geen gebruikersvalidatiegegevens zijn opgegeven.

Geef op validation_data om validatiegegevens op te geven, anders in te stellen n_cross_validations of validation_data_size om validatiegegevens uit de opgegeven trainingsgegevens te extraheren. Gebruik cv_split_column_namesvoor aangepaste kruisvalidatievouw.

Zie Gegevenssplitsingen en kruisvalidatie configureren in geautomatiseerde machine learning voor meer informatie.

Standaard ingesteld op Geen

cv_split_column_names
List[str]

Lijst met namen van de kolommen die een aangepaste kruisvalidatiesplitsing bevatten. Elk van de kolommen voor het splitsen van cv's vertegenwoordigt één CV-splitsing waarbij elke rij is gemarkeerd als 1 voor training of 0 voor validatie.

Standaard ingesteld op Geen

test_data
Input

De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. De testgegevens die moeten worden gebruikt voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.

Als deze parameter of de test_data_size parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid. Testgegevens moeten zowel functies als labelkolom bevatten. Als test_data is opgegeven, moet de target_column_name parameter worden opgegeven.

Standaard ingesteld op Geen

test_data_size
float

De functie Modeltest met behulp van testgegevenssets of splitsingen van testgegevens is een functie met de preview-status en kan op elk gewenst moment worden gewijzigd. Welk deel van de trainingsgegevens moet worden gebruikt voor testgegevens voor een testuitvoering die automatisch wordt gestart nadat de modeltraining is voltooid. De testuitvoering krijgt voorspellingen met behulp van het beste model en berekent metrische gegevens op basis van deze voorspellingen.

Dit moet tussen 0,0 en 1,0 niet-inclusief zijn. Als test_data_size wordt opgegeven op hetzelfde moment als validation_data_size, worden de testgegevens gesplitst training_data voordat de validatiegegevens worden gesplitst. Als validation_data_size=0.1bijvoorbeeld en test_data_size=0.1 de oorspronkelijke trainingsgegevens 1000 rijen hebben, hebben de testgegevens 100 rijen, bevatten de validatiegegevens 90 rijen en de trainingsgegevens 810 rijen.

Voor taken op basis van regressie wordt willekeurige steekproeven gebruikt. Voor classificatietaken wordt gestratificeerde steekproeven gebruikt. Prognose biedt momenteel geen ondersteuning voor het opgeven van een testgegevensset met behulp van een train-/testsplitsing.

Als deze parameter of de test_data parameter niet zijn opgegeven, wordt er geen testuitvoering automatisch uitgevoerd nadat de modeltraining is voltooid.

Standaard ingesteld op Geen

Retouren

Een taakobject dat kan worden verzonden naar een Azure ML-berekening voor uitvoering.

Retourtype

text_classification

Functie voor het maken van een TextClassificationJob.

Een tekstclassificatietaak wordt gebruikt om een model te trainen waarmee de klasse/categorie van een tekstgegevens kan worden voorspeld. Invoertrainingsgegevens moeten een doelkolom bevatten die de tekst in precies één klasse classificeert.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.

target_column_name
str

Naam van de doelkolom.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Primaire metrische gegevens voor de taak. Acceptabele waarden: nauwkeurigheid, AUC_weighted, precision_score_weighted

log_verbosity
str

Uitgebreidheidsniveau logboek.

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Het object TextClassificationJob.

Retourtype

text_classification_multilabel

Functie voor het maken van een TextClassificationMultilabelJob.

Een taak met meerdere labels voor tekstclassificatie wordt gebruikt om een model te trainen waarmee de klassen/categorieën van een tekstgegevens kunnen worden voorspeld. Invoertrainingsgegevens moeten een doelkolom bevatten die de tekst in klasse(sen) classificeert. Raadpleeg voor meer informatie over de indeling van gegevens met meerdere labels: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.

target_column_name
str

Naam van de doelkolom.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.

primary_metric
str

Primaire metrische gegevens voor de taak. Acceptabele waarden: nauwkeurigheid

log_verbosity
str

Uitgebreidheidsniveau logboek.

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Het object TextClassificationMultilabelJob.

Retourtype

text_ner

Functie voor het maken van een TextNerJob.

Een taak voor entiteitsherkenning met een tekstnaam wordt gebruikt om een model te trainen waarmee de benoemde entiteiten in de tekst kunnen worden voorspeld. Invoertrainingsgegevens moeten een tekstbestand in CoNLL-indeling zijn. Raadpleeg voor meer informatie over de indeling van tekst-NER-gegevens: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parameters

training_data
Input

De trainingsgegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.

validation_data
Input

De validatiegegevens die in het experiment moeten worden gebruikt. Het moet zowel trainingsfuncties als een doelkolom bevatten.

primary_metric
str

Primaire metrische gegevens voor de taak. Acceptabele waarden: nauwkeurigheid

log_verbosity
str

Uitgebreidheidsniveau logboek.

kwargs
dict

Een woordenlijst met aanvullende configuratieparameters.

Retouren

Het object TextNerJob.

Retourtype