RegressionJob Klass
Konfiguration för AutoML-regressionsjobb.
Initiera en ny AutoML Regression-uppgift.
- Arv
-
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabularRegressionJob
Konstruktor
RegressionJob(*, primary_metric: str | None = None, **kwargs)
Parametrar
Metoder
dump |
Dumpar jobbinnehållet till en fil i YAML-format. |
set_data |
Definiera datakonfiguration. |
set_featurization |
Definiera konfiguration av funktionsframställning. |
set_limits |
Ange begränsningar för jobbet. |
set_training |
Metoden för att konfigurera träningsrelaterade inställningar. |
dump
Dumpar jobbinnehållet till en fil i YAML-format.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametrar
Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.
- kwargs
- dict
Ytterligare argument som ska skickas till YAML-serialiseraren.
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_data
Definiera datakonfiguration.
set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None
Parametrar
- training_data
- Input
Träningsdata.
- target_column_name
- str
Kolumnnamnet för målkolumnen.
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_featurization
Definiera konfiguration av funktionsframställning.
set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None
Parametrar
- blocked_transformers
- Optional[List[Union[BlockedTransformers, str]]]
En lista över transformerarnamn som ska blockeras under funktionalisering, som standard ingen
En ordlista med kolumnnamn och funktionstyper som används för att uppdatera kolumnsyftet , som standard till Ingen
Iso 639-3-kod med tre tecken för de språk som finns i datauppsättningen. Andra språk än engelska stöds bara om du använder GPU-aktiverad beräkning. Language_code "mul" ska användas om datauppsättningen innehåller flera språk. Om du vill hitta ISO 639-3-koder för olika språk kan du läsa https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, standardvärdet är Ingen
- transformer_params
- Optional[Dict[str, List[ColumnTransformer]]]
En ordlista med transformerare och motsvarande anpassningsparametrar , som standard ingen
Om du vill inkludera DNN-baserade metoder för funktionsframställning är standardinställningen Ingen
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_limits
Ange begränsningar för jobbet.
set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Parametrar
Om du vill aktivera tidig avslutning om poängen inte förbättras på kort sikt, är standardvärdet Ingen.
Tidig stopplogik:
Inget tidigt stopp för de första 20 iterationerna (landmärken).
Tidigt stoppfönster startar den 21:a iterationen och söker efter early_stopping_n_iters iterationer
(anges för närvarande till 10). Det innebär att den första iterationen där stopp kan ske är den 31:a.
AutoML schemalägger fortfarande 2 ensembleiterationer EFTER tidig stoppning, vilket kan resultera i högre poäng.
Tidig stoppning utlöses om det absoluta värdet för bästa poäng som beräknas är detsamma för tidigare
early_stopping_n_iters iterationer, d.v.s. om det inte finns någon förbättring i poäng för early_stopping_n_iters iterationer.
Målpoäng för experiment. Experimentet avslutas när den här poängen har uppnåtts. Om det inte anges (inga kriterier) körs experimentet tills inga ytterligare framsteg görs för det primära måttet. Mer information om avslutsvillkor finns i den här artikeln , standardvärdet är Ingen
Det här är det maximala antalet iterationer som skulle köras parallellt. Standardvärdet är 1.
- AmlCompute-kluster stöder en iteration som körs per nod.
För flera överordnade AutoML-experimentkörningar som körs parallellt i ett enda AmlCompute-kluster ska summan av max_concurrent_trials
värdena för alla experiment vara mindre än eller lika med det maximala antalet noder. Annars placeras körningar i kö tills noder är tillgängliga.
- DSVM stöder flera iterationer per nod.
max_concurrent_trials
Bör
vara mindre än eller lika med antalet kärnor på DSVM. För flera experiment som körs parallellt på en enda DSVM ska summan av max_concurrent_trials
värdena för alla experiment vara mindre än eller lika med det maximala antalet noder.
- Databricks –
max_concurrent_trials
ska vara mindre än eller lika med antalet
arbetsnoder på Databricks.
max_concurrent_trials
gäller inte för lokala körningar. Den här parametern hette concurrent_iterations
tidigare .
Det maximala antalet trådar som ska användas för en viss tränings iteration. Godtagbara värden:
Större än 1 och mindre än eller lika med det maximala antalet kärnor i beräkningsmålet.
Lika med -1, vilket innebär att använda alla möjliga kärnor per iteration per underordnad körning.
Lika med 1, standardvärdet.
[Experimentellt] Det maximala antalet noder som ska användas för distribuerad träning.
För prognostisering tränas varje modell med max(2, int(max_nodes/max_concurrent_trials)) noder.
För klassificering/regression tränas varje modell med max_nodes noder.
Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.
Det totala antalet olika kombinationer av algoritmer och parametrar som ska testas under ett automatiserat ML-experiment. Om inget anges är standardvärdet 1 000 iterationer.
Maximal tid i minuter som alla iterationer tillsammans kan ta innan experimentet avslutas. Om det inte anges är standardtidsgränsen för experimentet 6 dagar. Om du vill ange en tidsgräns som är mindre än eller lika med 1 timme kontrollerar du att datauppsättningens storlek inte är större än 10 000 000 (kolumnen rader gånger) eller ett felresultat, standardvärdet Ingen
Maximal tid i minuter som varje iteration kan köras för innan den avslutas. Om inget anges används värdet 1 månad eller 4 3200 minuter, standardvärdet Ingen
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_training
Metoden för att konfigurera träningsrelaterade inställningar.
set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None
Parametrar
Om du vill aktivera eller inaktivera framtvingande av ONNX-kompatibla modeller. Standardvärdet är Falskt. Mer information om Open Neural Network Exchange (ONNX) och Azure Machine Learning finns i den här artikeln.
Om DNN-baserade modeller ska inkluderas under modellval. Standardvärdet är dock Sant för DNN NLP-uppgifter, och det är falskt för alla andra AutoML-uppgifter.
Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-tränings iterationer. Mer information finns i Tolka: modellförklaringar i automatiserad maskininlärning. , standardvärdet Ingen
Om stackEnsemble-iteration ska aktiveras/inaktiveras. Om enable_onnx_compatible_models flagga anges inaktiveras StackEnsemble-iteration. På samma sätt inaktiveras StackEnsemble-iteration som standard för Timeseries-uppgifter för att undvika risker för överanpassning på grund av små träningsuppsättningar som används för att passa metainläraren. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen
Om du vill aktivera/inaktivera VotingEnsemble-iteration. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen
- stack_ensemble_settings
- Optional[StackEnsembleSettings]
Inställningar för StackEnsemble-iteration, standardinställningar för None
Under VotingEnsemble- och StackEnsemble-modellgenereringen laddas flera anpassade modeller från tidigare underordnade körningar ned. Konfigurera den här parametern med ett högre värde än 300 sekunder, om mer tid behövs, standardvärdet Ingen
En lista över modellnamn för att söka efter ett experiment. Om inte anges används alla modeller som stöds för uppgiften minus alla angivna i blocked_training_algorithms
eller inaktuella TensorFlow-modeller, standardvärdet Ingen
En lista över algoritmer som ska ignoreras för ett experiment, standardvärdet Ingen
- training_mode
- Optional[Union[str, TabularTrainingMode]]
[Experimentellt] Träningsläget som ska användas. Möjliga värden är-
distribuerad – möjliggör distribuerad träning för algoritmer som stöds.
non_distributed inaktiverar distribuerad träning.
auto - För närvarande är det samma som non_distributed. I framtiden kan detta ändras.
Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
Attribut
base_path
creation_context
featurization
Hämta inställningarna för tabellfunktionalisering för AutoML-jobbet.
Returer
Inställningar för tabellfunktionalisering för AutoML-jobbet
Returtyp
id
Resurs-ID:t.
Returer
Resursens globala ID, ett ARM-ID (Azure Resource Manager).
Returtyp
inputs
limits
Hämta tabellgränserna för AutoML-jobbet.
Returer
Tabellgränser för AutoML-jobbet
Returtyp
log_files
log_verbosity
Hämta loggverositeten för AutoML-jobbet.
Returer
log verbosity för AutoML-jobbet
Returtyp
outputs
primary_metric
status
Jobbets status.
Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:
NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Startar – Körningen har börjat bearbetas i molnet. Anroparen har nu ett körnings-ID.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
Docker-avbildningsversion
konfiguration av conda-miljö
I kö – jobbet köas på beräkningsmålet. I BatchAI är till exempel jobbet i ett köat tillstånd
i väntan på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutfört – körningen har slutförts. Detta omfattar både körning av användarkod och körning
efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbruten – följer en annulleringsbegäran och anger att körningen nu har avbrutits.
Svarar inte – inga pulsslag har skickats nyligen för körningar som har pulsslag aktiverade.
Returer
Jobbets status.
Returtyp
studio_url
task_type
Hämta aktivitetstyp.
Returer
Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".
Returtyp
test_data
training
training_data
type
validation_data
Azure SDK for Python
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för