ClassificationJob Klass

Referens

Konfiguration för AutoML-klassificeringsjobb.

Initiera en ny AutoML-klassificeringsaktivitet.

Arv: azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular

ClassificationJob

Konstruktor

ClassificationJob(*, primary_metric: str | None = None, positive_label: str | None = None, **kwargs)

Parametrar

primary_metric: Optional[str]

Det primära måttet som ska användas för optimering, standardvärdet Ingen

positive_label: Optional[str]

Positiv etikett för beräkning av binära mått, standardvärdet Ingen

featurization: Optional[TabularFeaturizationSettings]

Funktionaliseringsinställningar. Standardvärdet är Ingen.

limits: Optional[TabularLimitSettings]

Inställningar för begränsningar. Standardvärdet är Ingen.

training: Optional[TrainingSettings]

Träningsinställningar. Standardvärdet är Ingen.

primary_metric: Optional[str]

Det primära måttet som ska användas för optimering, standardvärdet Ingen

positive_label: Optional[str]

Positiv etikett för beräkning av binära mått, standardvärdet Ingen

featurization: Optional[TabularFeaturizationSettings]

funktionaliseringsinställningar. Standardvärdet är Ingen.

limits: Optional[TabularLimitSettings]

begränsningsinställningar. Standardvärdet är Ingen.

training: Optional[TrainingSettings]

träningsinställningar. Standardvärdet är Ingen.

Metoder

dump	Dumpar jobbinnehållet till en fil i YAML-format.
set_data	Definiera datakonfiguration.
set_featurization	Definiera funktionsframställningskonfiguration.
set_limits	Ange begränsningar för jobbet.
set_training	Metoden för att konfigurera träningsrelaterade inställningar.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs: dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_data

Definiera datakonfiguration.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

Parametrar

training_data: Input

Träningsdata.

target_column_name: str

Kolumnnamn för målkolumnen.

weight_column_name: Optional[str]

Namn på viktkolumn, standardvärdet Ingen

validation_data: Optional[Input]

Valideringsdata, standardvärdet Ingen

validation_data_size: Optional[float]

Valideringsdatastorlek, standardvärdet Ingen

n_cross_validations: Optional[Union[str, int]]

n_cross_validations standardvärdet Ingen

cv_split_column_names: Optional[List[str]]

cv_split_column_names, standardvärdet Ingen

test_data: Optional[Input]

Testdata, standardvärdet Ingen

test_data_size: Optional[float]

Testdatastorlek, standardvärdet Ingen

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_featurization

Definiera funktionsframställningskonfiguration.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

Parametrar

blocked_transformers: Optional[List[Union[BlockedTransformers, str]]]

En lista över transformatornamn som ska blockeras under funktionalisering, standardvärdet Ingen

column_name_and_types: Optional[Dict[str, str]]

En ordlista med kolumnnamn och funktionstyper som används för att uppdatera kolumnsyftet , standardvärdet Ingen

dataset_language: Optional[str]

Tre tecken ISO 639-3-kod för de språk som finns i datauppsättningen. Andra språk än engelska stöds bara om du använder GPU-aktiverad beräkning. Language_code "mul" ska användas om datauppsättningen innehåller flera språk. Information om hur du hittar ISO 639-3-koder för olika språk finns i https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, standardvärden för Ingen

transformer_params: Optional[Dict[str, List[ColumnTransformer]]]

En ordlista med transformerare och motsvarande anpassningsparametrar , standardvärdet Ingen

mode: Optional[str]

"off", "auto", defaults to "auto", defaults to None

enable_dnn_featurization: Optional[bool]

Om du vill inkludera DNN-baserade metoder för funktionsframställning, är standardinställningen Ingen

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_limits

Ange begränsningar för jobbet.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Parametrar

enable_early_termination: Optional[bool]

Om du vill aktivera tidig avslutning om poängen inte förbättras på kort sikt, är standardvärdet Ingen.

Tidig stopplogik:

Inget tidigt stopp för de första 20 iterationerna (landmärken).
Tidigt stoppfönster startar den 21:a iterationen och letar efter early_stopping_n_iters iterationer

(för närvarande inställd på 10). Det innebär att den första iterationen där stopp kan ske är den 31:a.
AutoML schemalägger fortfarande 2 ensemble-iterationer EFTER tidig stoppning, vilket kan resultera i högre poäng.
Tidig stoppning utlöses om det absoluta värdet för bästa beräknade poäng är detsamma för tidigare

early_stopping_n_iters iterationer, d.v.s. om det inte finns någon förbättring i poäng för early_stopping_n_iters iterationer.

exit_score: Optional[float]

Målpoäng för experiment. Experimentet avslutas när den här poängen har uppnåtts. Om det inte anges (inga kriterier) körs experimentet tills inga ytterligare framsteg har gjorts för det primära måttet. Mer information om avslutsvillkor finns i den här artikeln , standardvärdet Ingen

max_concurrent_trials: Optional[int]

Det här är det maximala antalet iterationer som skulle köras parallellt. Standardvärdet är 1.

AmlCompute-kluster stöder en iteration som körs per nod.

För flera överordnade AutoML-experimentkörningar som körs parallellt i ett enda AmlCompute-kluster ska summan av max_concurrent_trials värdena för alla experiment vara mindre än eller lika med det maximala antalet noder. Annars placeras körningar i kö tills noder är tillgängliga.

DSVM stöder flera iterationer per nod. max_concurrent_trials Bör

vara mindre än eller lika med antalet kärnor på DSVM. För flera experiment som körs parallellt på en enda DSVM ska summan av max_concurrent_trials värdena för alla experiment vara mindre än eller lika med det maximala antalet noder.

Databricks – max_concurrent_trials ska vara mindre än eller lika med antalet

arbetsnoder på Databricks.

max_concurrent_trials gäller inte för lokala körningar. Den här parametern hette concurrent_iterationstidigare .

max_cores_per_trial: Optional[int]

Det maximala antalet trådar som ska användas för en viss tränings iteration. Godtagbara värden:

Större än 1 och mindre än eller lika med det maximala antalet kärnor i beräkningsmålet.
Lika med -1, vilket innebär att använda alla möjliga kärnor per iteration per underordnad körning.
Lika med 1, standardvärdet.

max_nodes: Optional[int]

[Experimentellt] Det maximala antalet noder som ska användas för distribuerad träning.

För prognostisering tränas varje modell med max(2, int(max_nodes/max_concurrent_trials)) noder.
För klassificering/regression tränas varje modell med max_nodes noder.

Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.

max_trials: Optional[int]

Det totala antalet olika kombinationer av algoritmer och parametrar som ska testas under ett automatiserat ML-experiment. Om inget anges är standardvärdet 1 000 iterationer.

timeout_minutes: Optional[int]

Maximal tid i minuter som alla iterationer tillsammans kan ta innan experimentet avslutas. Om det inte anges är standardtidsgränsen för experimentet 6 dagar. Om du vill ange en tidsgräns som är mindre än eller lika med 1 timme kontrollerar du att datauppsättningens storlek inte är större än 10 000 000 (kolumnen rader gånger) eller ett felresultat, standardvärdet Ingen

trial_timeout_minutes: Optional[int]

Maximal tid i minuter som varje iteration kan köras för innan den avslutas. Om inget anges används värdet 1 månad eller 4 3200 minuter, standardvärdet Ingen

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_training

Metoden för att konfigurera träningsrelaterade inställningar.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

Parametrar

enable_onnx_compatible_models: Optional[bool]

Om du vill aktivera eller inaktivera framtvingande av ONNX-kompatibla modeller. Standardvärdet är Falskt. Mer information om Open Neural Network Exchange (ONNX) och Azure Machine Learning finns i den här artikeln.

enable_dnn_training: Optional[bool]

Om DNN-baserade modeller ska inkluderas under modellval. Standardvärdet är dock Sant för DNN NLP-uppgifter, och det är falskt för alla andra AutoML-uppgifter.

enable_model_explainability: Optional[bool]

Om du vill aktivera förklaring av den bästa AutoML-modellen i slutet av alla AutoML-tränings iterationer. Mer information finns i Tolka: modellförklaringar i automatiserad maskininlärning. , standardvärdet Ingen

enable_stack_ensemble: Optional[bool]

Om stackEnsemble-iteration ska aktiveras/inaktiveras. Om enable_onnx_compatible_models flagga anges inaktiveras StackEnsemble-iteration. På samma sätt inaktiveras StackEnsemble-iteration som standard för Timeseries-uppgifter för att undvika risker för överanpassning på grund av små träningsuppsättningar som används för att passa metainläraren. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen

enable_vote_ensemble: Optional[bool]

Om du vill aktivera/inaktivera VotingEnsemble-iteration. Mer information om ensembler finns i Ensemblekonfiguration , standardvärden till Ingen

stack_ensemble_settings: Optional[StackEnsembleSettings]

Inställningar för StackEnsemble-iteration, standardinställningar för None

ensemble_model_download_timeout: Optional[int]

Under VotingEnsemble- och StackEnsemble-modellgenereringen laddas flera anpassade modeller från tidigare underordnade körningar ned. Konfigurera den här parametern med ett högre värde än 300 sekunder, om mer tid behövs, standardvärdet Ingen

allowed_training_algorithms: Optional[List[str]]

En lista över modellnamn för att söka efter ett experiment. Om inte anges används alla modeller som stöds för uppgiften minus alla angivna i blocked_training_algorithms eller inaktuella TensorFlow-modeller, standardvärdet Ingen

blocked_training_algorithms: Optional[List[str]]

En lista över algoritmer som ska ignoreras för ett experiment, standardvärdet Ingen

training_mode: Optional[Union[str, TabularTrainingMode]]

[Experimentellt] Träningsläget som ska användas. Möjliga värden är-

distribuerad – möjliggör distribuerad träning för algoritmer som stöds.
non_distributed inaktiverar distribuerad träning.
auto - För närvarande är det samma som non_distributed. I framtiden kan detta ändras.

Obs! Den här parametern är i offentlig förhandsversion och kan komma att ändras i framtiden.

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

Optional[str]

<xref:LogVerbosity>

outputs

primary_metric

Det primära måttet som ska användas för optimering.

Returer

Det primära måttet som ska användas för optimering.

Returtyp

Union[str, ClassificationPrimaryMetrics]

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Start – Körningen har börjat bearbetas i molnet. Anroparen har ett körnings-ID just nu.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
- Docker-avbildningsversion
- konfiguration av conda-miljö
I kö – Jobbet placeras i kö på beräkningsmålet. I BatchAI är jobbet till exempel i ett köat tillstånd

medan du väntar på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutförd – körningen har slutförts. Detta omfattar både körning och körning av användarkod

efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbryts – följer en begäran om annullering och anger att körningen nu har avbrutits.
Svarar inte – För körningar som har Pulsslag aktiverat har inga pulsslag nyligen skickats.

Konstruktor

Parametrar

Metoder

dump

Parametrar

Undantag

set_data

Parametrar

Undantag

set_featurization

Parametrar

Undantag

set_limits

Parametrar

Undantag

set_training

Parametrar

Undantag

Attribut

base_path

Returer

Returtyp

creation_context

Returer

Returtyp

featurization

Returer

Returtyp

id

Returer

Returtyp

inputs

limits

Returer

Returtyp

log_files

Returer

Returtyp

log_verbosity

Returer

Returtyp

outputs

primary_metric

Returer

Returtyp

status

Returer

Returtyp

studio_url

Returer

Returtyp

task_type

Returer

Returtyp

test_data

Returer

Returtyp

training

Returer

Returtyp

training_data

Returer

Returtyp

type

Returer

Returtyp

validation_data

Returer

Returtyp

Feedback

Ytterligare resurser