automl Paket
Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2.
Huvudområden är att hantera AutoML-uppgifter.
Klasser
ClassificationJob |
Konfiguration för AutoML-klassificeringsjobb. Initiera en ny AutoML-klassificeringsaktivitet. |
ColumnTransformer |
Inställningar för kolumntransformatorer. |
ForecastingJob |
Konfiguration för AutoML-prognostiseringsaktivitet. Initiera en ny AutoML-prognostiseringsaktivitet. |
ForecastingSettings |
Prognostiseringsinställningar för ett AutoML-jobb. |
ImageClassificationJob |
Konfiguration för AutoML-jobb för bildklassificering i flera klasser. Initiera ett nytt AutoML-jobb för bildklassificering i flera klasser. |
ImageClassificationMultilabelJob |
Konfiguration för AutoML-jobb för bildklassificering med flera etiketter. Initiera ett nytt AutoML-jobb med flera etiketter för bildklassificering. |
ImageClassificationSearchSpace |
Sök efter autoML-bildklassificering och bildklassificerings-multilabeluppgifter. |
ImageInstanceSegmentationJob |
Konfiguration för autoML-avbildningsinstanssegmenteringsjobb. Initiera ett nytt AutoML-avbildningsinstanssegmenteringsjobb. |
ImageLimitSettings |
Begränsa inställningarna för AutoML Image Verticals. ImageLimitSettings är en klass som innehåller följande parametrar: max_concurrent_trials, max_trials och timeout_minutes. Det här är en valfri konfigurationsmetod för att konfigurera begränsningsparametrar, till exempel tidsgränser osv. Anteckning Antalet samtidiga körningar är gated för de resurser som är tillgängliga i det angivna beräkningsmålet. Kontrollera att beräkningsmålet har tillgängliga resurser för önskad samtidighet. Tips Det är en bra idé att matcha max_concurrent_trials antal med antalet noder i klustret. Om du till exempel har ett kluster med 4 noder anger du max_concurrent_trials till 4. Exempel på användning Konfiguration av ImageLimitSettings
Initiera ett ImageLimitSettings-objekt. Konstruktor för ImageLimitSettings för AutoML Image Verticals. |
ImageModelSettingsClassification |
Modellinställningar för AutoML-bildklassificeringsuppgifter. |
ImageModelSettingsObjectDetection |
Modellinställningar för AutoML-avbildningsobjektidentifieringsaktivitet. |
ImageObjectDetectionJob |
Konfiguration för AutoML-avbildningsobjektidentifieringsjobb. Initiera ett nytt AutoML-jobb för avbildningsobjektidentifiering. |
ImageObjectDetectionSearchSpace |
Sökutrymme för autoML-objektidentifiering och segmentering av bildinstanser. |
ImageSweepSettings |
Rensa inställningar för alla AutoML Image Verticals. |
NlpFeaturizationSettings |
Funktionaliseringsinställningar för alla AutoML NLP Verticals. |
NlpFixedParameters |
Objekt för att inrymma fasta parametrar för NLP-jobb. |
NlpLimitSettings |
Begränsa inställningarna för alla AutoML NLP Verticals. |
NlpSearchSpace |
Sök efter AutoML NLP-uppgifter. |
NlpSweepSettings |
Rensa inställningar för alla AutoML NLP-uppgifter. |
RegressionJob |
Konfiguration för AutoML-regressionsjobb. Initiera en ny AutoML Regression-uppgift. |
SearchSpace |
SearchSpace-klass för AutoML-lodräta. |
StackEnsembleSettings |
Förhandsinställning för att anpassa StackEnsemble-körning. |
TabularFeaturizationSettings |
Funktionaliseringsinställningar för ett AutoML-jobb. |
TabularLimitSettings |
Begränsa inställningarna för autoML-tabell lodräta. |
TextClassificationJob |
Konfiguration för AutoML-textklassificeringsjobb. Initierar en ny AutoML-textklassificeringsaktivitet. |
TextClassificationMultilabelJob |
Konfiguration för AutoML-textklassificeringsjobb för flera etiketter. Initierar en ny AutoML-textklassificeringsaktivitet med flera etiketter. |
TextNerJob |
Konfiguration för AutoML Text NER-jobb. Initierar en ny AutoML Text NER-uppgift. |
TrainingSettings |
TrainingSettings-klass för Azure Machine Learning. TrainingSettings-klass för Azure Machine Learning. |
Uppräkningar
BlockedTransformers |
Räkna upp alla klassificeringsmodeller som stöds av AutoML. |
ClassificationModels |
Räkna upp alla klassificeringsmodeller som stöds av AutoML. |
ClassificationMultilabelPrimaryMetrics |
Primära mått för klassificering av multilabeluppgifter. |
ClassificationPrimaryMetrics |
Primära mått för klassificeringsuppgifter. |
FeaturizationMode |
Funktionaliseringsläge – avgör datafunktionaliseringsläge. |
ForecastHorizonMode |
Räkna upp för att fastställa läget för val av prognoshorisont. |
ForecastingModels |
Räkna upp alla prognosmodeller som stöds av AutoML. |
ForecastingPrimaryMetrics |
Primära mått för prognostiseringsaktivitet. |
InstanceSegmentationPrimaryMetrics |
Primära mått för InstanceSegmentation-uppgifter. |
LearningRateScheduler |
Uppräkning av inlärningsfrekvensschema. |
LogTrainingMetrics |
Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2. Huvudområden är att hantera AutoML-uppgifter. |
LogValidationLoss |
Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2. Huvudområden är att hantera AutoML-uppgifter. |
NCrossValidationsMode |
Avgör hur värdet för N-Korsvalidering bestäms. |
ObjectDetectionPrimaryMetrics |
Primära mått för Image ObjectDetection-uppgift. |
RegressionModels |
Räkna upp alla regressionsmodeller som stöds av AutoML. |
RegressionPrimaryMetrics |
Primära mått för regressionsaktivitet. |
SamplingAlgorithmType |
Innehåller automatiserade maskininlärningsklasser för Azure Machine Learning SDKv2. Huvudområden är att hantera AutoML-uppgifter. |
ShortSeriesHandlingConfiguration |
Parametern som definierar hur AutoML ska hantera korta tidsserier. |
StochasticOptimizer |
Stokastisk optimerare för bildmodeller. |
TargetAggregationFunction |
Funktionen Målaggregat. |
TargetLagsMode |
Målet släpar efter urvalslägen. |
TargetRollingWindowSizeMode |
Målläge för rullande fönsterstorlek. |
UseStl |
Konfigurera STL-nedbrytning av tidsseriemålkolumnen. |
ValidationMetricType |
Beräkningsmetod för mått som ska användas för valideringsmått i bilduppgifter. |
Funktioner
classification
Funktion för att skapa ett klassificeringsjobb.
Ett klassificeringsjobb används för att träna en modell som bäst förutsäger klassen för ett dataexempel. Olika modeller tränas med träningsdata. Modellen med bästa prestanda på valideringsdata baserat på det primära måttet väljs som den slutliga modellen.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en etikettkolumn (valfritt en kolumn med exempelvikter).
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna och validation_data
test_data
- primary_metric
Måttet som Automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godtagbara värden: noggrannhet, AUC_weighted, norm_macro_recall, average_precision_score_weighted och precision_score_weighted Standardvärden för noggrannhet
- enable_model_explainability
- bool
Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-tränings iterationer. Standardvärdet är Ingen. Mer information finns i Tolka: modellförklaringar i automatiserad maskininlärning.
- weight_column_name
- str
Namnet på exempelviktkolumnen. Automatiserad ML stöder en viktad kolumn som indata, vilket gör att rader i data viktas upp eller ned. Om indata kommer från en Pandas. DataFrame som inte har kolumnnamn, kolumnindex kan användas i stället, uttryckt som heltal.
Den här parametern gäller för training_data
och validation_data
parametrar
- validation_data
- Input
Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och etikettkolumn (valfritt en kolumn med exempelvikter).
Standardvärdet är Ingen
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarvalideringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, ange n_cross_validations
på annat sätt eller validation_data_size
extrahera valideringsdata från angivna träningsdata.
Använd för anpassad korsvalideringsdelegering cv_split_column_names
.
Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.
Standardvärdet är Ingen
Hur många korsvalideringar som ska utföras när användarverifieringsdata inte har angetts.
Ange validation_data
för att tillhandahålla valideringsdata, annars ange n_cross_validations
eller validation_data_size
extrahera valideringsdata från angivna träningsdata.
För anpassad korsvalideringsdelegering använder du cv_split_column_names
.
Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.
Standardvärdet är Ingen
Lista över namnen på kolumnerna som innehåller anpassad korsvalideringsdelning. Var och en av CV-delade kolumner representerar en CV-delning där varje rad antingen är markerad 1 för träning eller 0 för validering.
Standardvärdet är Ingen
- test_data
- Input
Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Testdata som ska användas för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.
Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data_size
har slutförts.
Testdata ska innehålla både funktioner och etikettkolumnen.
Om test_data
anges måste parametern target_column_name
anges.
Standardvärdet är Ingen
- test_data_size
- float
Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Vilken del av träningsdata som ska lagras för testdata för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.
Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Om test_data_size
anges samtidigt som validation_data_size
delas testdata från training_data
innan valideringsdata delas upp.
Om till exempel validation_data_size=0.1
, test_data_size=0.1
och de ursprungliga träningsdata har 1 000 rader, kommer testdata att ha 100 rader, valideringsdata innehåller 90 rader och träningsdata har 810 rader.
För regressionsbaserade uppgifter används slumpmässig sampling. För klassificeringsuppgifter används stratifierad sampling. Prognostisering stöder för närvarande inte att ange en testdatauppsättning med hjälp av en tränings-/testdelning.
Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data
har slutförts.
Standardvärdet är Ingen
Returer
Ett jobbobjekt som kan skickas till en Azure ML-beräkning för körning.
Returtyp
forecasting
Funktion för att skapa ett prognostiseringsjobb.
En prognostiseringsaktivitet används för att förutsäga målvärden för en framtida tidsperiod baserat på historiska data. Olika modeller tränas med träningsdata. Modellen med bästa prestanda på valideringsdata baserat på det primära måttet väljs som den slutliga modellen.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en etikettkolumn (valfritt en exempelviktkolumn).
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna , validation_data
och test_data
- primary_metric
Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godkända värden: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Standardvärden för att normalized_root_mean_squared_error
- enable_model_explainability
- bool
Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-träningsiterationer. Standardvärdet är Ingen. Mer information finns i Tolkningsbarhet: modellförklaringar i automatiserad maskininlärning.
- weight_column_name
- str
Namnet på exempelviktkolumnen. Automatiserad ML stöder en viktad kolumn som indata, vilket gör att rader i data viktas upp eller ned. Om indata kommer från en Pandas. DataFrame som inte har kolumnnamn, kolumnindex kan användas i stället, uttryckt som heltal.
Den här parametern gäller för training_data
parametrarna och validation_data
- validation_data
- Input
Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och etikettkolumn (om du vill kan du välja en exempelviktkolumn).
Standardvärdet är Ingen
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, annars ange n_cross_validations
eller validation_data_size
extrahera valideringsdata från angivna träningsdata.
För anpassad korsvalideringsdelegering använder du cv_split_column_names
.
Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.
Standardvärdet är Ingen
Hur många korsvalideringar som ska utföras när användarverifieringsdata inte har angetts.
Ange validation_data
för att tillhandahålla valideringsdata, annars ange n_cross_validations
eller validation_data_size
extrahera valideringsdata från angivna träningsdata.
För anpassad korsvalideringsdelegering använder du cv_split_column_names
.
Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.
Standardvärdet är Ingen
Lista över namnen på kolumnerna som innehåller anpassad korsvalideringsdelning. Var och en av CV-delade kolumner representerar en CV-delning där varje rad antingen är markerad 1 för träning eller 0 för validering.
Standardvärdet är Ingen
- test_data
- Input
Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Testdata som ska användas för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.
Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data_size
har slutförts.
Testdata ska innehålla både funktioner och etikettkolumnen.
Om test_data
anges måste parametern target_column_name
anges.
Standardvärdet är Ingen
- test_data_size
- float
Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Vilken del av träningsdata som ska lagras för testdata för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.
Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Om test_data_size
anges samtidigt som validation_data_size
delas testdata från training_data
innan valideringsdata delas upp.
Om till exempel validation_data_size=0.1
, test_data_size=0.1
och de ursprungliga träningsdata har 1 000 rader, kommer testdata att ha 100 rader, valideringsdata innehåller 90 rader och träningsdata har 810 rader.
För regressionsbaserade uppgifter används slumpmässig sampling. För klassificeringsuppgifter används stratifierad sampling. Prognostisering stöder för närvarande inte att ange en testdatauppsättning med hjälp av en tränings-/testdelning.
Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data
har slutförts.
Standardvärdet är Ingen
- forecasting_settings
- ForecastingSettings
Inställningarna för prognostiseringsaktiviteten
Returer
Ett jobbobjekt som kan skickas till en Azure ML-beräkning för körning.
Returtyp
image_classification
Skapar ett objekt för autoML-avbildningsjobb med flera klasser.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet.
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna och validation_data
.
- primary_metric
Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godtagbara värden: noggrannhet, AUC_weighted, norm_macro_recall, average_precision_score_weighted och precision_score_weighted Standardinställningar för noggrannhet.
- validation_data
- Input
Valideringsdata som ska användas i experimentet.
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, annars inställt validation_data_size
på att extrahera valideringsdata från angivna träningsdata.
Standardvärdet är .2
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
Jobbobjekt för bildklassificering som kan skickas till en Azure ML-beräkning för körning.
Returtyp
image_classification_multilabel
Skapar ett objekt för autoML-bild med flera etiketter klassificeringsjobb.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet.
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna och validation_data
.
- primary_metric
Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godtagbara värden: noggrannhet, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted och Iou Standardvärden för Iou.
- validation_data
- Input
Valideringsdata som ska användas i experimentet.
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, annars inställt validation_data_size
på att extrahera valideringsdata från angivna träningsdata.
Standardvärdet är .2
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
Avbilda jobbobjekt med flera etiketter som kan skickas till en Azure ML-beräkning för körning.
Returtyp
image_instance_segmentation
Skapar ett objekt för autoML-avbildningsinstanssegmenteringsjobbet.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet.
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna och validation_data
.
- primary_metric
Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godtagbara värden: MeanAveragePrecision använder MeanAveragePrecision som standard.
- validation_data
- Input
Valideringsdata som ska användas i experimentet.
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, annars inställt validation_data_size
på att extrahera valideringsdata från angivna träningsdata.
Standardvärdet är .2
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
Segmenteringsjobb för bildinstans
Returtyp
image_object_detection
Skapar ett -objekt för autoML-avbildningsobjektidentifieringsjobb.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet.
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna och validation_data
.
- primary_metric
Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godtagbara värden: MeanAveragePrecision använder MeanAveragePrecision som standard.
- validation_data
- Input
Valideringsdata som ska användas i experimentet.
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, annars inställt validation_data_size
på att extrahera valideringsdata från angivna träningsdata.
Standardvärdet är .2
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
Jobbobjekt för identifiering av bildobjekt som kan skickas till en Azure ML-beräkning för körning.
Returtyp
regression
Funktion för att skapa ett regressionsjobb.
Ett regressionsjobb används för att träna en modell för att förutsäga kontinuerliga värden för en målvariabel från en datauppsättning. Olika modeller tränas med träningsdata. Modellen med bästa prestanda för valideringsdata baserat på det primära måttet väljs som den slutliga modellen.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en etikettkolumn (valfritt en exempelviktkolumn).
- target_column_name
- str
Namnet på etikettkolumnen.
Den här parametern gäller för training_data
parametrarna , validation_data
och test_data
- primary_metric
Det mått som automatiserad maskininlärning optimerar för modellval. Automatiserad maskininlärning samlar in fler mått än vad som kan optimeras. Mer information om hur mått beräknas finns i https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Godkända värden: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. Standardvärdet är normalized_root_mean_squared_error
- enable_model_explainability
- bool
Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-träningsiterationer. Standardvärdet är Ingen. Mer information finns i Tolkningsbarhet: modellförklaringar i automatiserad maskininlärning.
- weight_column_name
- str
Namnet på exempelviktkolumnen. Automatiserad ML stöder en viktad kolumn som indata, vilket gör att rader i data viktas upp eller ned. Om indata kommer från en Pandas. DataFrame som inte har kolumnnamn, kolumnindex kan användas i stället, uttryckt som heltal.
Den här parametern gäller för training_data
parametrarna och validation_data
- validation_data
- Input
Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och etikettkolumn (om du vill kan du välja en exempelviktkolumn).
Standardvärdet är Ingen
- validation_data_size
- float
Vilken del av data som ska lagras för validering när användarverifieringsdata inte har angetts. Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Ange validation_data
för att tillhandahålla valideringsdata, annars ange n_cross_validations
eller validation_data_size
extrahera valideringsdata från angivna träningsdata.
För anpassad korsvalideringsdelegering använder du cv_split_column_names
.
Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.
Standardvärdet är Ingen
Hur många korsvalideringar som ska utföras när användarverifieringsdata inte har angetts.
Ange validation_data
för att tillhandahålla valideringsdata, annars ange n_cross_validations
eller validation_data_size
extrahera valideringsdata från angivna träningsdata.
För anpassad korsvalideringsdelegering använder du cv_split_column_names
.
Mer information finns i Konfigurera datadelningar och korsvalidering i automatiserad maskininlärning.
Standardvärdet är Ingen
Lista över namnen på kolumnerna som innehåller anpassad korsvalideringsdelning. Var och en av CV-delade kolumner representerar en CV-delning där varje rad antingen är markerad 1 för träning eller 0 för validering.
Standardvärdet är Ingen
- test_data
- Input
Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Testdata som ska användas för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.
Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data_size
har slutförts.
Testdata ska innehålla både funktioner och etikettkolumnen.
Om test_data
anges måste parametern target_column_name
anges.
Standardvärdet är Ingen
- test_data_size
- float
Funktionen Modelltest med hjälp av testdatamängder eller delningar av testdata är en funktion i förhandsversionstillstånd och kan ändras när som helst. Vilken del av träningsdata som ska lagras för testdata för en testkörning som startas automatiskt när modellträningen är klar. Testkörningen får förutsägelser med den bästa modellen och beräknar mått baserat på dessa förutsägelser.
Detta bör vara mellan 0.0 och 1.0 icke-inkluderande.
Om test_data_size
anges samtidigt som validation_data_size
delas testdata från training_data
innan valideringsdata delas upp.
Om till exempel validation_data_size=0.1
, test_data_size=0.1
och de ursprungliga träningsdata har 1 000 rader, kommer testdata att ha 100 rader, valideringsdata innehåller 90 rader och träningsdata har 810 rader.
För regressionsbaserade uppgifter används slumpmässig sampling. För klassificeringsuppgifter används stratifierad sampling. Prognostisering stöder för närvarande inte att ange en testdatauppsättning med hjälp av en tränings-/testdelning.
Om den här parametern eller parametern inte anges körs ingen testkörning automatiskt när modellträningen test_data
har slutförts.
Standardvärdet är Ingen
Returer
Ett jobbobjekt som kan skickas till en Azure ML-beräkning för körning.
Returtyp
text_classification
Funktion för att skapa ett TextClassificationJob.
Ett textklassificeringsjobb används för att träna en modell som kan förutsäga klass/kategori för textdata. Träningsdata för indata bör innehålla en målkolumn som klassificerar texten till exakt en klass.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.
- target_column_name
- str
Namnet på målkolumnen.
- validation_data
- Input
Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Primärt mått för uppgiften. Godtagbara värden: noggrannhet, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Loggveroalitetsnivå.
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
Objektet TextClassificationJob.
Returtyp
text_classification_multilabel
Funktion för att skapa en TextClassificationMultilabelJob.
Ett multilabel-jobb för textklassificering används för att träna en modell som kan förutsäga klasser/kategorier för textdata. Träningsdata för indata bör innehålla en målkolumn som klassificerar texten till klass(es). Mer information om formatet för multilabeldata finns i: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.
- target_column_name
- str
Namnet på målkolumnen.
- validation_data
- Input
Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.
- primary_metric
- str
Primärt mått för uppgiften. Godtagbara värden: noggrannhet
- log_verbosity
- str
Loggveroalitetsnivå.
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
Objektet TextClassificationMultilabelJob.
Returtyp
text_ner
Funktion för att skapa ett TextNerJob.
En text med namnet entitetsigenkänningsjobb används för att träna en modell som kan förutsäga de namngivna entiteterna i texten. Träningsdata för indata ska vara en textfil i CoNLL-format. Mer information om text-NER-data finns i: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parametrar
- training_data
- Input
Träningsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.
- validation_data
- Input
Valideringsdata som ska användas i experimentet. Den bör innehålla både träningsfunktioner och en målkolumn.
- primary_metric
- str
Primärt mått för uppgiften. Godtagbara värden: noggrannhet
- log_verbosity
- str
Loggveroalitetsnivå.
- kwargs
- dict
En ordlista med ytterligare konfigurationsparametrar.
Returer
TextNerJob-objektet.
Returtyp
Azure SDK for Python