RegressionJob Klass

Referens

Konfiguration för AutoML-regressionsjobb.

Initiera en ny AutoML Regression-uppgift.

Arv: azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular

RegressionJob

Konstruktor

RegressionJob(*, primary_metric: str | None = None, **kwargs)

Parametrar

primary_metric: str

Obligatorisk

Det primära måttet som ska användas för optimering

kwargs: dict

Obligatorisk

Jobbspecifika argument

Metoder

dump	Dumpar jobbinnehållet till en fil i YAML-format.
set_data	Definiera datakonfiguration.
set_featurization	Definiera konfiguration av funktionsframställning.
set_limits	Ange begränsningar för jobbet.
set_training	Metoden för att konfigurera träningsrelaterade inställningar.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs: dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_data

Definiera datakonfiguration.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

Parametrar

training_data: Input

Träningsdata.

target_column_name: str

Kolumnnamnet för målkolumnen.

weight_column_name: Optional[str]

Namn på viktkolumn, standardinställningen Ingen

validation_data: Optional[Input]

Valideringsdata, standardvärdet är Ingen

validation_data_size: Optional[float]

Storlek på valideringsdata, standardvärdet är Ingen

n_cross_validations: Optional[Union[str, int]]

n_cross_validations är standardinställningen Ingen

cv_split_column_names: Optional[List[str]]

cv_split_column_names är standardinställningen Ingen

test_data: Optional[Input]

Testdata, standardvärdet är Ingen

test_data_size: Optional[float]

Testdatastorlek, standardvärdet är Ingen

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_featurization

Definiera konfiguration av funktionsframställning.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

Parametrar

blocked_transformers: Optional[List[Union[BlockedTransformers, str]]]

En lista över transformerarnamn som ska blockeras under funktionalisering, som standard ingen

column_name_and_types: Optional[Dict[str, str]]

En ordlista med kolumnnamn och funktionstyper som används för att uppdatera kolumnsyftet , som standard till Ingen

dataset_language: Optional[str]

Iso 639-3-kod med tre tecken för de språk som finns i datauppsättningen. Andra språk än engelska stöds bara om du använder GPU-aktiverad beräkning. Language_code "mul" ska användas om datauppsättningen innehåller flera språk. Om du vill hitta ISO 639-3-koder för olika språk kan du läsa https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, standardvärdet är Ingen

transformer_params: Optional[Dict[str, List[ColumnTransformer]]]

En ordlista med transformerare och motsvarande anpassningsparametrar , som standard ingen

mode: Optional[str]

"off", "auto", defaults to "auto", defaults to None

enable_dnn_featurization: Optional[bool]

Om du vill inkludera DNN-baserade metoder för funktionsframställning är standardinställningen Ingen

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_limits

Ange begränsningar för jobbet.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Parametrar

enable_early_termination: Optional[bool]

Om du vill aktivera tidig avslutning om poängen inte förbättras på kort sikt, är standardvärdet Ingen.

Tidig stopplogik:

Inget tidigt stopp för de första 20 iterationerna (landmärken).
Tidigt stoppfönster startar den 21:a iterationen och söker efter early_stopping_n_iters iterationer

(anges för närvarande till 10). Det innebär att den första iterationen där stopp kan ske är den 31:a.
AutoML schemalägger fortfarande 2 ensembleiterationer EFTER tidig stoppning, vilket kan resultera i högre poäng.
Tidig stoppning utlöses om det absoluta värdet för bästa poäng som beräknas är detsamma för tidigare

early_stopping_n_iters iterationer, d.v.s. om det inte finns någon förbättring i poäng för early_stopping_n_iters iterationer.

exit_score: Optional[float]

Målpoäng för experiment. Experimentet avslutas när den här poängen har uppnåtts. Om det inte anges (inga kriterier) körs experimentet tills inga ytterligare framsteg görs för det primära måttet. Mer information om avslutsvillkor finns i den här artikeln , standardvärdet är Ingen

max_concurrent_trials: Optional[int]

Det här är det maximala antalet iterationer som skulle köras parallellt. Standardvärdet är 1.

AmlCompute-kluster stöder en iteration som körs per nod.

För flera överordnade AutoML-experimentkörningar som körs parallellt i ett enda AmlCompute-kluster ska summan av max_concurrent_trials värdena för alla experiment vara mindre än eller lika med det maximala antalet noder. Annars placeras körningar i kö tills noder är tillgängliga.

DSVM stöder flera iterationer per nod. max_concurrent_trials Bör

vara mindre än eller lika med antalet kärnor på DSVM. För flera experiment som körs parallellt på en enda DSVM ska summan av max_concurrent_trials värdena för alla experiment vara mindre än eller lika med det maximala antalet noder.

Databricks – max_concurrent_trials ska vara mindre än eller lika med antalet

arbetsnoder på Databricks.

max_concurrent_trials gäller inte för lokala körningar. Den här parametern hette concurrent_iterationstidigare .

max_cores_per_trial: Optional[int]

Det maximala antalet trådar som ska användas för en viss tränings iteration. Godtagbara värden:

Större än 1 och mindre än eller lika med det maximala antalet kärnor i beräkningsmålet.
Lika med -1, vilket innebär att använda alla möjliga kärnor per iteration per underordnad körning.
Lika med 1, standardvärdet.

max_nodes: Optional[int]

[Experimentellt] Det maximala antalet noder som ska användas för distribuerad träning.

För prognostisering tränas varje modell med max(2, int(max_nodes/max_concurrent_trials)) noder.
För klassificering/regression tränas varje modell med max_nodes noder.

Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.

max_trials: Optional[int]

Det totala antalet olika kombinationer av algoritmer och parametrar som ska testas under ett automatiserat ML-experiment. Om inget anges är standardvärdet 1 000 iterationer.

timeout_minutes: Optional[int]

Maximal tid i minuter som alla iterationer tillsammans kan ta innan experimentet avslutas. Om det inte anges är standardtidsgränsen för experimentet 6 dagar. Om du vill ange en tidsgräns som är mindre än eller lika med 1 timme kontrollerar du att datauppsättningens storlek inte är större än 10 000 000 (kolumnen rader gånger) eller ett felresultat, standardvärdet Ingen

trial_timeout_minutes: Optional[int]

Maximal tid i minuter som varje iteration kan köras för innan den avslutas. Om inget anges används värdet 1 månad eller 4 3200 minuter, standardvärdet Ingen

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_training

Metoden för att konfigurera träningsrelaterade inställningar.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

Parametrar

enable_onnx_compatible_models: Optional[bool]

Om du vill aktivera eller inaktivera framtvingande av ONNX-kompatibla modeller. Standardvärdet är Falskt. Mer information om Open Neural Network Exchange (ONNX) och Azure Machine Learning finns i den här artikeln.

enable_dnn_training: Optional[bool]

Om DNN-baserade modeller ska inkluderas under modellval. Standardvärdet är dock Sant för DNN NLP-uppgifter, och det är falskt för alla andra AutoML-uppgifter.

enable_model_explainability: Optional[bool]

Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-tränings iterationer. Mer information finns i Tolka: modellförklaringar i automatiserad maskininlärning. , standardvärdet Ingen

enable_stack_ensemble: Optional[bool]

Om stackEnsemble-iteration ska aktiveras/inaktiveras. Om enable_onnx_compatible_models flagga anges inaktiveras StackEnsemble-iteration. På samma sätt inaktiveras StackEnsemble-iteration som standard för Timeseries-uppgifter för att undvika risker för överanpassning på grund av små träningsuppsättningar som används för att passa metainläraren. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen

enable_vote_ensemble: Optional[bool]

Om du vill aktivera/inaktivera VotingEnsemble-iteration. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen

stack_ensemble_settings: Optional[StackEnsembleSettings]

Inställningar för StackEnsemble-iteration, standardinställningar för None

ensemble_model_download_timeout: Optional[int]

Under VotingEnsemble- och StackEnsemble-modellgenereringen laddas flera anpassade modeller från tidigare underordnade körningar ned. Konfigurera den här parametern med ett högre värde än 300 sekunder, om mer tid behövs, standardvärdet Ingen

allowed_training_algorithms: Optional[List[str]]

En lista över modellnamn för att söka efter ett experiment. Om inte anges används alla modeller som stöds för uppgiften minus alla angivna i blocked_training_algorithms eller inaktuella TensorFlow-modeller, standardvärdet Ingen

blocked_training_algorithms: Optional[List[str]]

En lista över algoritmer som ska ignoreras för ett experiment, standardvärdet Ingen

training_mode: Optional[Union[str, TabularTrainingMode]]

[Experimentellt] Träningsläget som ska användas. Möjliga värden är-

distribuerad – möjliggör distribuerad träning för algoritmer som stöds.
non_distributed inaktiverar distribuerad träning.
auto - För närvarande är det samma som non_distributed. I framtiden kan detta ändras.

Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

Attribut

base_path

Resursens grundläggande sökväg.

Returer

Resursens grundläggande sökväg.

Returtyp

str

creation_context

Resursens skapandekontext.

Returer

Skapandemetadata för resursen.

Returtyp

Optional[SystemData]

featurization

Hämta inställningarna för tabellfunktionalisering för AutoML-jobbet.

Returer

Inställningar för tabellfunktionalisering för AutoML-jobbet

Returtyp

TabularFeaturizationSettings

id

Resurs-ID:t.

Returer

Resursens globala ID, ett ARM-ID (Azure Resource Manager).

Returtyp

Optional[str]

inputs

limits

Hämta tabellgränserna för AutoML-jobbet.

Returer

Tabellgränser för AutoML-jobbet

Returtyp

TabularLimitSettings

log_files

Utdatafiler för jobb.

Returer

Ordlistan med loggnamn och URL:er.

Returtyp

Optional[Dict[str, str]]

log_verbosity

Hämta loggverositeten för AutoML-jobbet.

Returer

log verbosity för AutoML-jobbet

Returtyp

<xref:LogVerbosity>

outputs

primary_metric

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Startar – Körningen har börjat bearbetas i molnet. Anroparen har nu ett körnings-ID.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
- Docker-avbildningsversion
- konfiguration av conda-miljö
I kö – jobbet köas på beräkningsmålet. I BatchAI är till exempel jobbet i ett köat tillstånd

i väntan på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutfört – körningen har slutförts. Detta omfattar både körning av användarkod och körning

efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbruten – följer en annulleringsbegäran och anger att körningen nu har avbrutits.
Svarar inte – inga pulsslag har skickats nyligen för körningar som har pulsslag aktiverade.

Returer

Jobbets status.

Returtyp

Optional[str]

studio_url

Azure ML Studio-slutpunkt.

Returer

URL:en till jobbinformationssidan.

Returtyp

Optional[str]

task_type

Hämta aktivitetstyp.

Returer

Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".

Returtyp

str

test_data

Hämta testdata.

Returer

Testa indata

Returtyp

Input

training

training_data

Hämta träningsdata.

Returer

Indata för träningsdata

Returtyp

Input

type

Jobbets typ.

Returer

Jobbets typ.

Returtyp

Optional[str]

validation_data

Hämta valideringsdata.

Returer

Indata för valideringsdata

Returtyp

Input

Dela via

RegressionJob Klass

Konstruktor

Parametrar

Metoder

dump

Parametrar

Undantag

set_data

Parametrar

Undantag

set_featurization

Parametrar

Undantag

set_limits

Parametrar

Undantag

set_training

Parametrar

Undantag

Attribut

base_path

Returer

Returtyp

creation_context

Returer

Returtyp

featurization

Returer

Returtyp

id

Returer

Returtyp

inputs

limits

Returer

Returtyp

log_files

Returer

Returtyp

log_verbosity

Returer

Returtyp

outputs

primary_metric

status

Returer

Returtyp

studio_url

Returer

Returtyp

task_type

Returer

Returtyp

test_data

Returer

Returtyp

training

training_data

Returer

Returtyp

type

Returer

Returtyp

validation_data

Returer

Returtyp

Feedback

Ytterligare resurser