automl Paket

Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2.

Huvudområden är att hantera AutoML-uppgifter.

Klasser

ClassificationJob

Konfiguration för AutoML-klassificeringsjobb.

Initiera en ny AutoML-klassificeringsaktivitet.

ColumnTransformer

Inställningar för kolumntransformatorer.

ForecastingJob

Konfiguration för AutoML-prognostiseringsaktivitet.

Initiera en ny AutoML-prognostiseringsaktivitet.

ForecastingSettings

Prognostiseringsinställningar för ett AutoML-jobb.

ImageClassificationJob

Konfiguration för AutoML-jobb för bildklassificering i flera klasser.

Initiera ett nytt AutoML-jobb för bildklassificering i flera klasser.

ImageClassificationMultilabelJob

Konfiguration för AutoML-jobb för bildklassificering med flera etiketter.

Initiera ett nytt AutoML-jobb med flera etiketter för bildklassificering.

ImageClassificationSearchSpace

Sök efter autoML-bildklassificering och bildklassificerings-multilabeluppgifter.

ImageInstanceSegmentationJob

Konfiguration för autoML-avbildningsinstanssegmenteringsjobb.

Initiera ett nytt AutoML-avbildningsinstanssegmenteringsjobb.

ImageLimitSettings

Begränsa inställningarna för AutoML Image Verticals.

ImageLimitSettings är en klass som innehåller följande parametrar: max_concurrent_trials, max_trials och timeout_minutes.

Det här är en valfri konfigurationsmetod för att konfigurera begränsningsparametrar, till exempel tidsgränser osv.

Anteckning

Antalet samtidiga körningar är gated för de resurser som är tillgängliga i det angivna beräkningsmålet.

Kontrollera att beräkningsmålet har tillgängliga resurser för önskad samtidighet.

Tips

Det är en bra idé att matcha max_concurrent_trials antal med antalet noder i klustret.

Om du till exempel har ett kluster med 4 noder anger du max_concurrent_trials till 4.

Exempel på användning

Konfiguration av ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Initiera ett ImageLimitSettings-objekt.

Konstruktor för ImageLimitSettings för AutoML Image Verticals.

ImageModelSettingsClassification

Modellinställningar för AutoML-bildklassificeringsuppgifter.

ImageModelSettingsObjectDetection

Modellinställningar för AutoML-avbildningsobjektidentifieringsaktivitet.

ImageObjectDetectionJob

Konfiguration för AutoML-avbildningsobjektidentifieringsjobb.

Initiera ett nytt AutoML-jobb för avbildningsobjektidentifiering.

ImageObjectDetectionSearchSpace

Sökutrymme för autoML-objektidentifiering och segmentering av bildinstanser.

ImageSweepSettings

Rensa inställningar för alla AutoML Image Verticals.

NlpFeaturizationSettings

Funktionaliseringsinställningar för alla AutoML NLP Verticals.

NlpFixedParameters

Objekt för att inrymma fasta parametrar för NLP-jobb.

NlpLimitSettings

Begränsa inställningarna för alla AutoML NLP Verticals.

NlpSearchSpace

Sök efter AutoML NLP-uppgifter.

NlpSweepSettings

Rensa inställningar för alla AutoML NLP-uppgifter.

RegressionJob

Konfiguration för AutoML-regressionsjobb.

Initiera en ny AutoML Regression-uppgift.

SearchSpace

SearchSpace-klass för AutoML-lodräta.

StackEnsembleSettings

Förhandsinställning för att anpassa StackEnsemble-körning.

TabularFeaturizationSettings

Funktionaliseringsinställningar för ett AutoML-jobb.

TabularLimitSettings

Begränsa inställningarna för autoML-tabell lodräta.

TextClassificationJob

Konfiguration för AutoML-textklassificeringsjobb.

Initierar en ny AutoML-textklassificeringsaktivitet.

TextClassificationMultilabelJob

Konfiguration för AutoML-textklassificeringsjobb för flera etiketter.

Initierar en ny AutoML-textklassificeringsaktivitet med flera etiketter.

TextNerJob

Konfiguration för AutoML Text NER-jobb.

Initierar en ny AutoML Text NER-uppgift.

TrainingSettings

TrainingSettings-klass för Azure Machine Learning.

TrainingSettings-klass för Azure Machine Learning.

Uppräkningar

BlockedTransformers

Räkna upp alla klassificeringsmodeller som stöds av AutoML.

ClassificationModels

Räkna upp alla klassificeringsmodeller som stöds av AutoML.

ClassificationMultilabelPrimaryMetrics

Primära mått för klassificering av multilabeluppgifter.

ClassificationPrimaryMetrics

Primära mått för klassificeringsuppgifter.

FeaturizationMode

Funktionaliseringsläge – avgör datafunktionaliseringsläge.

ForecastHorizonMode

Räkna upp för att fastställa läget för val av prognoshorisont.

ForecastingModels

Räkna upp alla prognosmodeller som stöds av AutoML.

ForecastingPrimaryMetrics

Primära mått för prognostiseringsaktivitet.

InstanceSegmentationPrimaryMetrics

Primära mått för InstanceSegmentation-uppgifter.

LearningRateScheduler

Uppräkning av inlärningsfrekvensschema.

LogTrainingMetrics

Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2.

Huvudområden är att hantera AutoML-uppgifter.

LogValidationLoss

Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2.

Huvudområden är att hantera AutoML-uppgifter.

NCrossValidationsMode

Avgör hur värdet för N-Korsvalidering bestäms.

ObjectDetectionPrimaryMetrics

Primära mått för Image ObjectDetection-uppgift.

RegressionModels

Räkna upp alla regressionsmodeller som stöds av AutoML.

RegressionPrimaryMetrics

Primära mått för regressionsaktivitet.

SamplingAlgorithmType

Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2.

Huvudområden är att hantera AutoML-uppgifter.

ShortSeriesHandlingConfiguration

Parametern som definierar hur AutoML ska hantera korta tidsserier.

StochasticOptimizer

Stokastisk optimerare för bildmodeller.

TargetAggregationFunction

Funktionen Målaggregat.

TargetLagsMode

Målet släpar efter urvalslägen.

TargetRollingWindowSizeMode

Målläge för rullande fönsterstorlek.

UseStl

Konfigurera STL-nedbrytning av tidsseriemålkolumnen.

ValidationMetricType

Beräkningsmetod för mått som ska användas för valideringsmått i bilduppgifter.

Funktioner

classification

Funktion för att skapa ett klassificeringsjobb.

Ett klassificeringsjobb används för att träna en modell som bäst förutsäger klassen för ett dataexempel. Olika modeller tränas med träningsdata. Modellen med bästa prestanda på valideringsdata baserat på det primära måttet väljs som den slutliga modellen.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en etikettkolumn (valfritt en kolumn med exempelvikter).

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_dataparametrarna och validation_datatest_data

primary_metric

Måttet som Automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godtagbara värden: noggrannhet, AUC_weighted, norm_macro_recall, average_precision_score_weighted och precision_score_weighted Standardvärden för noggrannhet

enable_model_explainability
bool

Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-tränings iterationer. Standardvärdet är Ingen. Mer information finns i Tolka: modellförklaringar i automatiserad maskininlärning.

weight_column_name
str

Namnet på exempelviktkolumnen. Automatiserad ML stöder en viktad kolumn som indata, vilket gör att rader i data viktas upp eller ned. Om indata kommer från en Pandas. DataFrame som inte har kolumnnamn, kolumnindex kan användas i stället, uttryckt som heltal.

Den här parametern gäller för training_data och validation_data parametrar

validation_data
Input

Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och etikettkolumn (valfritt en kolumn med exempelvikter).

Standardvärdet är Ingen

validation_data_size
float

Vilken del av data som ska lagras för validering när användarvalideringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, ange n_cross_validations på annat sätt eller validation_data_size extrahera valideringsdata från angivna träningsdata. Använd för anpassad korsvalideringsdelegering cv_split_column_names.

Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.

Standardvärdet är Ingen

n_cross_validations
Union[str, int]

Hur många korsvalideringar som ska utföras när användarverifieringsdata inte har angetts.

Ange validation_data för att tillhandahålla valideringsdata, annars ange n_cross_validations eller validation_data_size extrahera valideringsdata från angivna träningsdata. För anpassad korsvalideringsdelegering använder du cv_split_column_names.

Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.

Standardvärdet är Ingen

cv_split_column_names
List[str]

Lista över namnen på kolumnerna som innehåller anpassad korsvalideringsdelning. Var och en av CV-delade kolumner representerar en CV-delning där varje rad antingen är markerad 1 för träning eller 0 för validering.

Standardvärdet är Ingen

test_data
Input

Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Testdata som ska användas för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.

Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data_size har slutförts. Testdata ska innehålla både funktioner och etikettkolumnen. Om test_data anges måste parametern target_column_name anges.

Standardvärdet är Ingen

test_data_size
float

Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Vilken del av träningsdata som ska lagras för testdata för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.

Detta bör vara mellan 0.0 och 1.0 icke-inkluderande. Om test_data_size anges samtidigt som validation_data_sizedelas testdata från training_data innan valideringsdata delas upp. Om till exempel validation_data_size=0.1, test_data_size=0.1 och de ursprungliga träningsdata har 1 000 rader, kommer testdata att ha 100 rader, valideringsdata innehåller 90 rader och träningsdata har 810 rader.

För regressionsbaserade uppgifter används slumpmässig sampling. För klassificeringsuppgifter används stratifierad sampling. Prognostisering stöder för närvarande inte att ange en testdatauppsättning med hjälp av en tränings-/testdelning.

Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data har slutförts.

Standardvärdet är Ingen

Returer

Ett jobbobjekt som kan skickas till en Azure ML-beräkning för körning.

Returtyp

forecasting

Funktion för att skapa ett prognostiseringsjobb.

En prognostiseringsaktivitet används för att förutsäga målvärden för en framtida tidsperiod baserat på historiska data. Olika modeller tränas med träningsdata. Modellen med bästa prestanda på valideringsdata baserat på det primära måttet väljs som den slutliga modellen.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en etikettkolumn (valfritt en exempelviktkolumn).

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_dataparametrarna , validation_data och test_data

primary_metric

Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godkända värden: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Standardvärden för att normalized_root_mean_squared_error

enable_model_explainability
bool

Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-träningsiterationer. Standardvärdet är Ingen. Mer information finns i Tolkningsbarhet: modellförklaringar i automatiserad maskininlärning.

weight_column_name
str

Namnet på exempelviktkolumnen. Automatiserad ML stöder en viktad kolumn som indata, vilket gör att rader i data viktas upp eller ned. Om indata kommer från en Pandas. DataFrame som inte har kolumnnamn, kolumnindex kan användas i stället, uttryckt som heltal.

Den här parametern gäller för training_data parametrarna och validation_data

validation_data
Input

Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och etikettkolumn (om du vill kan du välja en exempelviktkolumn).

Standardvärdet är Ingen

validation_data_size
float

Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, annars ange n_cross_validations eller validation_data_size extrahera valideringsdata från angivna träningsdata. För anpassad korsvalideringsdelegering använder du cv_split_column_names.

Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.

Standardvärdet är Ingen

n_cross_validations
Union[str, int]

Hur många korsvalideringar som ska utföras när användarverifieringsdata inte har angetts.

Ange validation_data för att tillhandahålla valideringsdata, annars ange n_cross_validations eller validation_data_size extrahera valideringsdata från angivna träningsdata. För anpassad korsvalideringsdelegering använder du cv_split_column_names.

Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.

Standardvärdet är Ingen

cv_split_column_names
List[str]

Lista över namnen på kolumnerna som innehåller anpassad korsvalideringsdelning. Var och en av CV-delade kolumner representerar en CV-delning där varje rad antingen är markerad 1 för träning eller 0 för validering.

Standardvärdet är Ingen

test_data
Input

Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Testdata som ska användas för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.

Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data_size har slutförts. Testdata ska innehålla både funktioner och etikettkolumnen. Om test_data anges måste parametern target_column_name anges.

Standardvärdet är Ingen

test_data_size
float

Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Vilken del av träningsdata som ska lagras för testdata för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.

Detta bör vara mellan 0.0 och 1.0 icke-inkluderande. Om test_data_size anges samtidigt som validation_data_sizedelas testdata från training_data innan valideringsdata delas upp. Om till exempel validation_data_size=0.1, test_data_size=0.1 och de ursprungliga träningsdata har 1 000 rader, kommer testdata att ha 100 rader, valideringsdata innehåller 90 rader och träningsdata har 810 rader.

För regressionsbaserade uppgifter används slumpmässig sampling. För klassificeringsuppgifter används stratifierad sampling. Prognostisering stöder för närvarande inte att ange en testdatauppsättning med hjälp av en tränings-/testdelning.

Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data har slutförts.

Standardvärdet är Ingen

forecasting_settings
ForecastingSettings

Inställningarna för prognostiseringsaktiviteten

Returer

Ett jobbobjekt som kan skickas till en Azure ML-beräkning för körning.

Returtyp

image_classification

Skapar ett objekt för autoML-avbildningsjobb med flera klasser.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet.

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_data parametrarna och validation_data .

primary_metric

Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godtagbara värden: noggrannhet, AUC_weighted, norm_macro_recall, average_precision_score_weighted och precision_score_weighted Standardinställningar för noggrannhet.

validation_data
Input

Valideringsdata som ska användas i experimentet.

validation_data_size
float

Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, annars inställt validation_data_size på att extrahera valideringsdata från angivna träningsdata.

Standardvärdet är .2

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

Jobbobjekt för bildklassificering som kan skickas till en Azure ML-beräkning för körning.

Returtyp

image_classification_multilabel

Skapar ett objekt för autoML-bild med flera etiketter klassificeringsjobb.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet.

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_data parametrarna och validation_data .

primary_metric

Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godtagbara värden: noggrannhet, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted och Iou Standardvärden för Iou.

validation_data
Input

Valideringsdata som ska användas i experimentet.

validation_data_size
float

Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, annars inställt validation_data_size på att extrahera valideringsdata från angivna träningsdata.

Standardvärdet är .2

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

Avbilda jobbobjekt med flera etiketter som kan skickas till en Azure ML-beräkning för körning.

Returtyp

image_instance_segmentation

Skapar ett objekt för autoML-avbildningsinstanssegmenteringsjobbet.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet.

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_data parametrarna och validation_data .

primary_metric

Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godtagbara värden: MeanAveragePrecision använder MeanAveragePrecision som standard.

validation_data
Input

Valideringsdata som ska användas i experimentet.

validation_data_size
float

Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, annars inställt validation_data_size på att extrahera valideringsdata från angivna träningsdata.

Standardvärdet är .2

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

Segmenteringsjobb för bildinstans

Returtyp

image_object_detection

Skapar ett -objekt för autoML-avbildningsobjektidentifieringsjobb.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet.

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_data parametrarna och validation_data .

primary_metric

Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godtagbara värden: MeanAveragePrecision använder MeanAveragePrecision som standard.

validation_data
Input

Valideringsdata som ska användas i experimentet.

validation_data_size
float

Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, annars inställt validation_data_size på att extrahera valideringsdata från angivna träningsdata.

Standardvärdet är .2

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

Jobbobjekt för identifiering av bildobjekt som kan skickas till en Azure ML-beräkning för körning.

Returtyp

regression

Funktion för att skapa ett regressionsjobb.

Ett regressionsjobb används för att träna en modell för att förutsäga kontinuerliga värden för en målvariabel från en datauppsättning. Olika modeller tränas med träningsdata. Modellen med bästa prestanda för valideringsdata baserat på det primära måttet väljs som den slutliga modellen.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en etikettkolumn (valfritt en exempelviktkolumn).

target_column_name
str

Namnet på etikettkolumnen. Den här parametern gäller för training_dataparametrarna , validation_data och test_data

primary_metric

Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Godkända värden: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. Standardvärdet är normalized_root_mean_squared_error

enable_model_explainability
bool

Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-träningsiterationer. Standardvärdet är Ingen. Mer information finns i Tolkningsbarhet: modellförklaringar i automatiserad maskininlärning.

weight_column_name
str

Namnet på exempelviktkolumnen. Automatiserad ML stöder en viktad kolumn som indata, vilket gör att rader i data viktas upp eller ned. Om indata kommer från en Pandas. DataFrame som inte har kolumnnamn, kolumnindex kan användas i stället, uttryckt som heltal.

Den här parametern gäller för training_data parametrarna och validation_data

validation_data
Input

Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och etikettkolumn (om du vill kan du välja en exempelviktkolumn).

Standardvärdet är Ingen

validation_data_size
float

Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.

Ange validation_data för att tillhandahålla valideringsdata, annars ange n_cross_validations eller validation_data_size extrahera valideringsdata från angivna träningsdata. För anpassad korsvalideringsdelegering använder du cv_split_column_names.

Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.

Standardvärdet är Ingen

n_cross_validations
Union[str, int]

Hur många korsvalideringar som ska utföras när användarverifieringsdata inte har angetts.

Ange validation_data för att tillhandahålla valideringsdata, annars ange n_cross_validations eller validation_data_size extrahera valideringsdata från angivna träningsdata. För anpassad korsvalideringsdelegering använder du cv_split_column_names.

Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.

Standardvärdet är Ingen

cv_split_column_names
List[str]

Lista över namnen på kolumnerna som innehåller anpassad korsvalideringsdelning. Var och en av CV-delade kolumner representerar en CV-delning där varje rad antingen är markerad 1 för träning eller 0 för validering.

Standardvärdet är Ingen

test_data
Input

Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Testdata som ska användas för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.

Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data_size har slutförts. Testdata ska innehålla både funktioner och etikettkolumnen. Om test_data anges måste parametern target_column_name anges.

Standardvärdet är Ingen

test_data_size
float

Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Vilken del av träningsdata som ska lagras för testdata för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.

Detta bör vara mellan 0.0 och 1.0 icke-inkluderande. Om test_data_size anges samtidigt som validation_data_sizedelas testdata från training_data innan valideringsdata delas upp. Om till exempel validation_data_size=0.1, test_data_size=0.1 och de ursprungliga träningsdata har 1 000 rader, kommer testdata att ha 100 rader, valideringsdata innehåller 90 rader och träningsdata har 810 rader.

För regressionsbaserade uppgifter används slumpmässig sampling. För klassificeringsuppgifter används stratifierad sampling. Prognostisering stöder för närvarande inte att ange en testdatauppsättning med hjälp av en tränings-/testdelning.

Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data har slutförts.

Standardvärdet är Ingen

Returer

Ett jobbobjekt som kan skickas till en Azure ML-beräkning för körning.

Returtyp

text_classification

Funktion för att skapa ett TextClassificationJob.

Ett textklassificeringsjobb används för att träna en modell som kan förutsäga klass/kategori för textdata. Träningsdata för indata bör innehålla en målkolumn som klassificerar texten till exakt en klass.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.

target_column_name
str

Namnet på målkolumnen.

validation_data
Input

Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Primärt mått för uppgiften. Godtagbara värden: noggrannhet, AUC_weighted, precision_score_weighted

log_verbosity
str

Loggveroalitetsnivå.

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

Objektet TextClassificationJob.

Returtyp

text_classification_multilabel

Funktion för att skapa en TextClassificationMultilabelJob.

Ett multilabel-jobb för textklassificering används för att träna en modell som kan förutsäga klasser/kategorier för textdata. Träningsdata för indata bör innehålla en målkolumn som klassificerar texten till klass(es). Mer information om formatet för multilabeldata finns i: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.

target_column_name
str

Namnet på målkolumnen.

validation_data
Input

Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.

primary_metric
str

Primärt mått för uppgiften. Godtagbara värden: noggrannhet

log_verbosity
str

Loggveroalitetsnivå.

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

Objektet TextClassificationMultilabelJob.

Returtyp

text_ner

Funktion för att skapa ett TextNerJob.

En text med namnet entitetsigenkänningsjobb används för att träna en modell som kan förutsäga de namngivna entiteterna i texten. Träningsdata för indata ska vara en textfil i CoNLL-format. Mer information om text-NER-data finns i: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parametrar

training_data
Input

Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.

validation_data
Input

Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.

primary_metric
str

Primärt mått för uppgiften. Godtagbara värden: noggrannhet

log_verbosity
str

Loggveroalitetsnivå.

kwargs
dict

En ordlista med ytterligare konfigurationsparametrar.

Returer

TextNerJob-objektet.

Returtyp