Dela via


ClassificationJob Klass

Konfiguration för AutoML-klassificeringsjobb.

Initiera en ny AutoML-klassificeringsaktivitet.

Arv
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular
ClassificationJob

Konstruktor

ClassificationJob(*, primary_metric: str | None = None, positive_label: str | None = None, **kwargs)

Parametrar

primary_metric
Optional[str]

Det primära måttet som ska användas för optimering, standardvärdet Ingen

positive_label
Optional[str]

Positiv etikett för beräkning av binära mått, standardvärdet Ingen

featurization
Optional[TabularFeaturizationSettings]

Funktionaliseringsinställningar. Standardvärdet är Ingen.

limits
Optional[TabularLimitSettings]

Inställningar för begränsningar. Standardvärdet är Ingen.

training
Optional[TrainingSettings]

Träningsinställningar. Standardvärdet är Ingen.

primary_metric
Optional[str]

Det primära måttet som ska användas för optimering, standardvärdet Ingen

positive_label
Optional[str]

Positiv etikett för beräkning av binära mått, standardvärdet Ingen

featurization
Optional[TabularFeaturizationSettings]

funktionaliseringsinställningar. Standardvärdet är Ingen.

limits
Optional[TabularLimitSettings]

begränsningsinställningar. Standardvärdet är Ingen.

training
Optional[TrainingSettings]

träningsinställningar. Standardvärdet är Ingen.

Metoder

dump

Dumpar jobbinnehållet till en fil i YAML-format.

set_data

Definiera datakonfiguration.

set_featurization

Definiera funktionsframställningskonfiguration.

set_limits

Ange begränsningar för jobbet.

set_training

Metoden för att konfigurera träningsrelaterade inställningar.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs
dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_data

Definiera datakonfiguration.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

Parametrar

training_data
Input

Träningsdata.

target_column_name
str

Kolumnnamn för målkolumnen.

weight_column_name
Optional[str]

Namn på viktkolumn, standardvärdet Ingen

validation_data
Optional[Input]

Valideringsdata, standardvärdet Ingen

validation_data_size
Optional[float]

Valideringsdatastorlek, standardvärdet Ingen

n_cross_validations
Optional[Union[str, int]]

n_cross_validations standardvärdet Ingen

cv_split_column_names
Optional[List[str]]

cv_split_column_names, standardvärdet Ingen

test_data
Optional[Input]

Testdata, standardvärdet Ingen

test_data_size
Optional[float]

Testdatastorlek, standardvärdet Ingen

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_featurization

Definiera funktionsframställningskonfiguration.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

Parametrar

blocked_transformers
Optional[List[Union[BlockedTransformers, str]]]

En lista över transformatornamn som ska blockeras under funktionalisering, standardvärdet Ingen

column_name_and_types
Optional[Dict[str, str]]

En ordlista med kolumnnamn och funktionstyper som används för att uppdatera kolumnsyftet , standardvärdet Ingen

dataset_language
Optional[str]

Tre tecken ISO 639-3-kod för de språk som finns i datauppsättningen. Andra språk än engelska stöds bara om du använder GPU-aktiverad beräkning. Language_code "mul" ska användas om datauppsättningen innehåller flera språk. Information om hur du hittar ISO 639-3-koder för olika språk finns i https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, standardvärden för Ingen

transformer_params
Optional[Dict[str, List[ColumnTransformer]]]

En ordlista med transformerare och motsvarande anpassningsparametrar , standardvärdet Ingen

mode
Optional[str]

"off", "auto", defaults to "auto", defaults to None

enable_dnn_featurization
Optional[bool]

Om du vill inkludera DNN-baserade metoder för funktionsframställning, är standardinställningen Ingen

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_limits

Ange begränsningar för jobbet.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Parametrar

enable_early_termination
Optional[bool]

Om du vill aktivera tidig avslutning om poängen inte förbättras på kort sikt, är standardvärdet Ingen.

Tidig stopplogik:

  • Inget tidigt stopp för de första 20 iterationerna (landmärken).

  • Tidigt stoppfönster startar den 21:a iterationen och letar efter early_stopping_n_iters iterationer

    (för närvarande inställd på 10). Det innebär att den första iterationen där stopp kan ske är den 31:a.

  • AutoML schemalägger fortfarande 2 ensemble-iterationer EFTER tidig stoppning, vilket kan resultera i högre poäng.

  • Tidig stoppning utlöses om det absoluta värdet för bästa beräknade poäng är detsamma för tidigare

    early_stopping_n_iters iterationer, d.v.s. om det inte finns någon förbättring i poäng för early_stopping_n_iters iterationer.

exit_score
Optional[float]

Målpoäng för experiment. Experimentet avslutas när den här poängen har uppnåtts. Om det inte anges (inga kriterier) körs experimentet tills inga ytterligare framsteg har gjorts för det primära måttet. Mer information om avslutsvillkor finns i den här artikeln , standardvärdet Ingen

max_concurrent_trials
Optional[int]

Det här är det maximala antalet iterationer som skulle köras parallellt. Standardvärdet är 1.

  • AmlCompute-kluster stöder en iteration som körs per nod.

För flera överordnade AutoML-experimentkörningar som körs parallellt i ett enda AmlCompute-kluster ska summan av max_concurrent_trials värdena för alla experiment vara mindre än eller lika med det maximala antalet noder. Annars placeras körningar i kö tills noder är tillgängliga.

  • DSVM stöder flera iterationer per nod. max_concurrent_trials Bör

vara mindre än eller lika med antalet kärnor på DSVM. För flera experiment som körs parallellt på en enda DSVM ska summan av max_concurrent_trials värdena för alla experiment vara mindre än eller lika med det maximala antalet noder.

  • Databricks – max_concurrent_trials ska vara mindre än eller lika med antalet

arbetsnoder på Databricks.

max_concurrent_trials gäller inte för lokala körningar. Den här parametern hette concurrent_iterationstidigare .

max_cores_per_trial
Optional[int]

Det maximala antalet trådar som ska användas för en viss tränings iteration. Godtagbara värden:

  • Större än 1 och mindre än eller lika med det maximala antalet kärnor i beräkningsmålet.

  • Lika med -1, vilket innebär att använda alla möjliga kärnor per iteration per underordnad körning.

  • Lika med 1, standardvärdet.

max_nodes
Optional[int]

[Experimentellt] Det maximala antalet noder som ska användas för distribuerad träning.

  • För prognostisering tränas varje modell med max(2, int(max_nodes/max_concurrent_trials)) noder.

  • För klassificering/regression tränas varje modell med max_nodes noder.

Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.

max_trials
Optional[int]

Det totala antalet olika kombinationer av algoritmer och parametrar som ska testas under ett automatiserat ML-experiment. Om inget anges är standardvärdet 1 000 iterationer.

timeout_minutes
Optional[int]

Maximal tid i minuter som alla iterationer tillsammans kan ta innan experimentet avslutas. Om det inte anges är standardtidsgränsen för experimentet 6 dagar. Om du vill ange en tidsgräns som är mindre än eller lika med 1 timme kontrollerar du att datauppsättningens storlek inte är större än 10 000 000 (kolumnen rader gånger) eller ett felresultat, standardvärdet Ingen

trial_timeout_minutes
Optional[int]

Maximal tid i minuter som varje iteration kan köras för innan den avslutas. Om inget anges används värdet 1 månad eller 4 3200 minuter, standardvärdet Ingen

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_training

Metoden för att konfigurera träningsrelaterade inställningar.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

Parametrar

enable_onnx_compatible_models
Optional[bool]

Om du vill aktivera eller inaktivera framtvingande av ONNX-kompatibla modeller. Standardvärdet är Falskt. Mer information om Open Neural Network Exchange (ONNX) och Azure Machine Learning finns i den här artikeln.

enable_dnn_training
Optional[bool]

Om DNN-baserade modeller ska inkluderas under modellval. Standardvärdet är dock Sant för DNN NLP-uppgifter, och det är falskt för alla andra AutoML-uppgifter.

enable_model_explainability
Optional[bool]

Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-tränings iterationer. Mer information finns i Tolka: modellförklaringar i automatiserad maskininlärning. , standardvärdet Ingen

enable_stack_ensemble
Optional[bool]

Om stackEnsemble-iteration ska aktiveras/inaktiveras. Om enable_onnx_compatible_models flagga anges inaktiveras StackEnsemble-iteration. På samma sätt inaktiveras StackEnsemble-iteration som standard för Timeseries-uppgifter för att undvika risker för överanpassning på grund av små träningsuppsättningar som används för att passa metainläraren. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen

enable_vote_ensemble
Optional[bool]

Om du vill aktivera/inaktivera VotingEnsemble-iteration. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen

stack_ensemble_settings
Optional[StackEnsembleSettings]

Inställningar för StackEnsemble-iteration, standardinställningar för None

ensemble_model_download_timeout
Optional[int]

Under VotingEnsemble- och StackEnsemble-modellgenereringen laddas flera anpassade modeller från tidigare underordnade körningar ned. Konfigurera den här parametern med ett högre värde än 300 sekunder, om mer tid behövs, standardvärdet Ingen

allowed_training_algorithms
Optional[List[str]]

En lista över modellnamn för att söka efter ett experiment. Om inte anges används alla modeller som stöds för uppgiften minus alla angivna i blocked_training_algorithms eller inaktuella TensorFlow-modeller, standardvärdet Ingen

blocked_training_algorithms
Optional[List[str]]

En lista över algoritmer som ska ignoreras för ett experiment, standardvärdet Ingen

training_mode
Optional[Union[str, TabularTrainingMode]]

[Experimentellt] Träningsläget som ska användas. Möjliga värden är-

  • distribuerad – möjliggör distribuerad träning för algoritmer som stöds.

  • non_distributed inaktiverar distribuerad träning.

  • auto - För närvarande är det samma som non_distributed. I framtiden kan detta ändras.

Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

Attribut

base_path

Resursens grundläggande sökväg.

Returer

Resursens grundläggande sökväg.

Returtyp

str

creation_context

Resursens skapandekontext.

Returer

Skapandemetadata för resursen.

Returtyp

featurization

Hämta inställningarna för tabellfunktionalisering för AutoML-jobbet.

Returer

Tabellkonfigurationsinställningar för AutoML-jobbet

Returtyp

id

Resurs-ID:t.

Returer

Resursens globala ID, ett ARM-ID (Azure Resource Manager).

Returtyp

inputs

limits

Hämta tabellgränserna för AutoML-jobbet.

Returer

Tabellgränser för AutoML-jobbet

Returtyp

log_files

Jobbutdatafiler.

Returer

Ordlistan med loggnamn och URL:er.

Returtyp

log_verbosity

Hämta loggverositeten för AutoML-jobbet.

Returer

log verbosity för AutoML-jobbet

Returtyp

<xref:LogVerbosity>

outputs

primary_metric

Det primära måttet som ska användas för optimering.

Returer

Det primära måttet som ska användas för optimering.

Returtyp

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

  • NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.

  • Start – Körningen har börjat bearbetas i molnet. Anroparen har ett körnings-ID just nu.

  • Etablering – beräkning på begäran skapas för en viss jobböverföring.

  • Förbereder – Körningsmiljön förbereds och är i ett av två steg:

    • Docker-avbildningsversion

    • konfiguration av conda-miljö

  • I kö – Jobbet placeras i kö på beräkningsmålet. I BatchAI är jobbet till exempel i ett köat tillstånd

    medan du väntar på att alla begärda noder ska vara klara.

  • Körs – Jobbet har börjat köras på beräkningsmålet.

  • Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.

  • CancelRequested – Annullering har begärts för jobbet.

  • Slutförd – körningen har slutförts. Detta omfattar både körning och körning av användarkod

    efterbearbetningssteg.

  • Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.

  • Avbryts – följer en begäran om annullering och anger att körningen nu har avbrutits.

  • Svarar inte – För körningar som har Pulsslag aktiverat har inga pulsslag nyligen skickats.

Returer

Status för jobbet.

Returtyp

studio_url

Azure ML Studio-slutpunkt.

Returer

URL:en till jobbinformationssidan.

Returtyp

task_type

Hämta aktivitetstyp.

Returer

Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".

Returtyp

str

test_data

Hämta testdata.

Returer

Testa indata

Returtyp

training

Träningsinställningar för AutoML-klassificeringsjobb.

Returer

Träningsinställningar som används för AutoML-klassificeringsjobb.

Returtyp

<xref:ClassificationTrainingSettings>

training_data

Hämta träningsdata.

Returer

Indata för träningsdata

Returtyp

type

Typen av jobb.

Returer

Typen av jobb.

Returtyp

validation_data

Hämta valideringsdata.

Returer

Indata för valideringsdata

Returtyp