Megosztás a következőn keresztül:


RegressionJob Osztály

Az AutoML regressziós feladatának konfigurálása.

Új AutoML regressziós feladat inicializálása.

Öröklődés
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular
RegressionJob

Konstruktor

RegressionJob(*, primary_metric: str | None = None, **kwargs)

Paraméterek

primary_metric
str
Kötelező

Az optimalizáláshoz használandó elsődleges metrika

kwargs
dict
Kötelező

Feladatspecifikus argumentumok

Metódusok

dump

A feladat tartalmát YAML formátumú fájlba menti.

set_data

Adatkonfiguráció definiálása.

set_featurization

Funkciómérnöki konfiguráció definiálása.

set_limits

Állítsa be a feladat korlátait.

set_training

A betanítással kapcsolatos beállítások konfigurálásának módja.

dump

A feladat tartalmát YAML formátumú fájlba menti.

dump(dest: str | PathLike | IO, **kwargs) -> None

Paraméterek

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Kötelező

A YAML-tartalom írásához használt helyi elérési út vagy fájlstream. Ha a dest fájlelérési út, a rendszer új fájlt hoz létre. Ha a dest egy megnyitott fájl, a fájl közvetlenül a fájlba lesz megírva.

kwargs
dict

A YAML szerializálónak átadandó további argumentumok.

Kivételek

Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.

Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.

set_data

Adatkonfiguráció definiálása.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

Paraméterek

training_data
Input

Betanítási adatok.

target_column_name
str

A céloszlop oszlopneve.

weight_column_name
Optional[str]

Súlyozási oszlop neve, alapértelmezés szerint Nincs

validation_data
Optional[Input]

Érvényesítési adatok, alapértelmezés szerint Nincs

validation_data_size
Optional[float]

Érvényesítési adatok mérete, alapértelmezés szerint Nincs

n_cross_validations
Optional[Union[str, int]]

n_cross_validations alapértelmezés szerint Nincs

cv_split_column_names
Optional[List[str]]

cv_split_column_names alapértelmezés szerint Nincs

test_data
Optional[Input]

Tesztadatok, alapértelmezés szerint Nincs

test_data_size
Optional[float]

Adatméret tesztelése, alapértelmezés szerint Nincs

Kivételek

Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.

Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.

set_featurization

Funkciómérnöki konfiguráció definiálása.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

Paraméterek

blocked_transformers
Optional[List[Union[BlockedTransformers, str]]]

A featurizáció során letiltandó transzformátornevek listája, alapértelmezés szerint Nincs

column_name_and_types
Optional[Dict[str, str]]

Az oszlop céljának frissítéséhez használt oszlopnevek és szolgáltatástípusok szótára, alapértelmezés szerint Nincs értékre

dataset_language
Optional[str]

Három karakteres ISO 639-3 kód az adatkészletben található nyelv(ek)hez. Az angoltól eltérő nyelvek csak AKKOR támogatottak, ha GPU-kompatibilis számítást használ. Ha az adatkészlet több nyelvet tartalmaz, akkor a "mul" language_code kell használni. A különböző nyelvek ISO 639-3-kódjainak megkereséséhez tekintse meg a https://en.wikipedia.org/wiki/List_of_ISO_639-3_codeskövetkezőt: , alapértelmezés szerint Nincs

transformer_params
Optional[Dict[str, List[ColumnTransformer]]]

A transzformátor szótára és a megfelelő testreszabási paraméterek , alapértelmezés szerint Nincs

mode
Optional[str]

"off", "auto", defaults to "auto", defaults to None

enable_dnn_featurization
Optional[bool]

DNN-alapú szolgáltatástervezési módszerek belefoglalása, alapértelmezés szerint Nincs

Kivételek

Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.

Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.

set_limits

Állítsa be a feladat korlátait.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Paraméterek

enable_early_termination
Optional[bool]

Ha a pontszám rövid távon nem javul, engedélyezze-e a korai leállítást, alapértelmezés szerint Nincs.

Korai leállítási logika:

  • Nincs korai leállítás az első 20 iterációhoz (nevezetességekhez).

  • A korai leállítási ablak a 21. iterációban kezdődik, és early_stopping_n_iters iterációkat keres

    (jelenleg 10 értékre van állítva). Ez azt jelenti, hogy az első iteráció, ahol leállítás történhet, a 31.

  • Az AutoML a korai leállítás után is 2 együttes iterációt ütemez, ami magasabb pontszámot eredményezhet.

  • A korai leállítás akkor aktiválódik, ha a kiszámított legjobb pontszám abszolút értéke megegyezik a múlttal

    early_stopping_n_iters iterációk, azaz ha nincs javulás az early_stopping_n_iters iterációk pontszámában.

exit_score
Optional[float]

A kísérlet célpontszáma. A kísérlet a pontszám elérése után leáll. Ha nincs megadva (nincs feltétel), a kísérlet addig fut, amíg az elsődleges metrika nem halad tovább. A kilépési feltételekről további információt ebben a cikkben talál: , alapértelmezés szerint Nincs

max_concurrent_trials
Optional[int]

Ez a párhuzamosan végrehajtható iterációk maximális száma. Az alapértelmezett érték az 1.

  • Az AmlCompute-fürtök csomópontonként egy iterációt támogatnak.

Ha több AutoML-kísérlet szülőfuttatása fut párhuzamosan egyetlen AmlCompute-fürtön, az összes kísérlet értékeinek összege max_concurrent_trials nem haladhatja meg a csomópontok maximális számát. Ellenkező esetben a futtatások várólistára kerülnek, amíg a csomópontok elérhetővé nem válnak.

  • A DSVM csomópontonként több iterációt is támogat. max_concurrent_trials Kell

kisebbnek vagy egyenlőnek kell lennie a DSVM magjainak számával. Ha több kísérlet fut párhuzamosan egyetlen DSVM-en, az összes kísérlet értékeinek összege max_concurrent_trials nem haladhatja meg a csomópontok maximális számát.

  • Databricks – max_concurrent_trials nem lehet kisebb, mint a

feldolgozó csomópontok a Databricksben.

max_concurrent_trials nem vonatkozik a helyi futtatásokra. Korábban ezt a paramétert nevezték el concurrent_iterations.

max_cores_per_trial
Optional[int]

Az adott betanítási iterációhoz használandó szálak maximális száma. Elfogadható értékek:

  • Nagyobb, mint 1 és kisebb, mint a számítási célmagok maximális száma.

  • Egyenlő -1-sel, ami azt jelenti, hogy az összes lehetséges magot iterációnként kell használni gyermekfuttatásonként.

  • Az alapértelmezett érték 1.

max_nodes
Optional[int]

[Kísérleti] Az elosztott betanításhoz használandó csomópontok maximális száma.

  • Az előrejelzéshez az egyes modellek betanítása max(2, int(max_nodes/max_concurrent_trials)) csomópontokkal történik.

  • Besorolás/regresszió esetén az egyes modellek betanítása max_nodes csomópontok használatával történik.

Megjegyzés – Ez a paraméter nyilvános előzetes verzióban érhető el, és a jövőben változhat.

max_trials
Optional[int]

Az automatizált gépi tanulási kísérlet során tesztelendő különböző algoritmus- és paraméterkombinációk teljes száma. Ha nincs megadva, az alapértelmezett érték 1000 iteráció.

timeout_minutes
Optional[int]

A kísérlet befejezése előtt az összes iteráció legfeljebb percek alatt befejeződhet. Ha nincs megadva, a kísérlet alapértelmezett időtúllépése 6 nap. Ha 1 óránál rövidebb vagy egyenlő időtúllépést szeretne megadni, győződjön meg arról, hogy az adathalmaz mérete nem nagyobb 10 000 000-nél (sorok száma oszlopban) vagy hibaeredménynél, alapértelmezés szerint Nincs

trial_timeout_minutes
Optional[int]

Az egyes iterációk futásának maximális időtartama percekben, mielőtt befejeződik. Ha nincs megadva, a rendszer 1 hónapos vagy 43200 perces értéket használ, alapértelmezés szerint Nincs értékre.

Kivételek

Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.

Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.

set_training

A betanítással kapcsolatos beállítások konfigurálásának módja.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

Paraméterek

enable_onnx_compatible_models
Optional[bool]

Engedélyezi vagy letiltja az ONNX-kompatibilis modellek kényszerítését. Az alapértelmezett érték a Hamis. Az Open Neural Network Exchange (ONNX) és az Azure Machine Learning szolgáltatással kapcsolatos további információkért tekintse meg ezt a cikket.

enable_dnn_training
Optional[bool]

DNN-alapú modellek belefoglalása a modell kiválasztása során. Az alapértelmezett érték azonban Igaz a DNN NLP-tevékenységek esetében, és az összes többi AutoML-tevékenység esetén hamis.

enable_model_explainability
Optional[bool]

Engedélyezi-e a legjobb AutoML-modell magyarázatát az autoML betanítási iterációinak végén. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban. , alapértelmezés szerint Nincs

enable_stack_ensemble
Optional[bool]

A StackEnsemble iteráció engedélyezése/letiltása. Ha enable_onnx_compatible_models jelző van beállítva, a StackEnsemble iteráció le lesz tiltva. Hasonlóképpen, az Időzített feladatok esetében a StackEnsemble iteráció alapértelmezés szerint le lesz tiltva, hogy elkerülje a túlillesztés kockázatát a metatanuló illesztéséhez használt kis betanítási készlet miatt. További információ az együttesekről: Együttes konfigurációja , alapértelmezett értéke Nincs

enable_vote_ensemble
Optional[bool]

A VotingEnsemble iteráció engedélyezése/letiltása. További információ az együttesekről: Együttes konfigurációja , alapértelmezett értéke Nincs

stack_ensemble_settings
Optional[StackEnsembleSettings]

A StackEnsemble iteráció beállításai, alapértelmezés szerint Nincs

ensemble_model_download_timeout
Optional[int]

A VotingEnsemble és a StackEnsemble modell létrehozása során a rendszer az előző gyermekfuttatások több illesztett modelljét tölti le. Konfigurálja ezt a paramétert 300 másodpercnél nagyobb értékkel, ha több időre van szükség, alapértelmezés szerint Nincs

allowed_training_algorithms
Optional[List[str]]

Modellnevek listája egy kísérlet kereséséhez. Ha nincs megadva, akkor a rendszer a tevékenységhez támogatott összes modellt használja a TensorFlow-modellekben blocked_training_algorithms megadott vagy elavult modellek nélkül, alapértelmezés szerint Nincs értékre

blocked_training_algorithms
Optional[List[str]]

A kísérletben figyelmen kívül hagyandó algoritmusok listája, alapértelmezés szerint Nincs

training_mode
Optional[Union[str, TabularTrainingMode]]

[Kísérleti] A használni kívánt betanítási mód. A lehetséges értékek a következők:

  • distributed – lehetővé teszi az elosztott betanítást a támogatott algoritmusokhoz.

  • non_distributed – letiltja az elosztott betanítást.

  • auto – Jelenleg ugyanaz, mint non_distributed. A jövőben ez megváltozhat.

Megjegyzés: Ez a paraméter nyilvános előzetes verzióban érhető el, és a jövőben változhat.

Kivételek

Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.

Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.

Attribútumok

base_path

Az erőforrás alapútvonala.

Válaszok

Az erőforrás alapútvonala.

Visszatérési típus

str

creation_context

Az erőforrás létrehozási környezete.

Válaszok

Az erőforrás létrehozási metaadatai.

Visszatérési típus

featurization

Kérje le az AutoML-feladat táblázatos featurizációs beállításait.

Válaszok

Az AutoML-feladat táblázatos featurizációs beállításai

Visszatérési típus

id

Az erőforrás-azonosító.

Válaszok

Az erőforrás globális azonosítója, egy Azure Resource Manager (ARM) azonosító.

Visszatérési típus

inputs

limits

Kérje le az AutoML-feladat táblázatos korlátait.

Válaszok

Az AutoML-feladat táblázatos korlátai

Visszatérési típus

log_files

Feladat kimeneti fájljai.

Válaszok

A naplónevek és URL-címek szótára.

Visszatérési típus

log_verbosity

Kérje le az AutoML-feladat naplórészletességét.

Válaszok

napló részletessége az AutoML-feladathoz

Visszatérési típus

<xref:LogVerbosity>

outputs

primary_metric

status

A feladat állapota.

A visszaadott értékek közé tartozik a "Running", a "Completed" és a "Failed" (Sikertelen). Minden lehetséges érték a következő:

  • NotStarted – Ez egy ideiglenes állapot, amelyben az ügyféloldali Run objektumok a felhőbeküldés előtt találhatók.

  • Indítás – A futtatás megkezdődött a felhőben való feldolgozásban. A hívó ezen a ponton futtatási azonosítóval rendelkezik.

  • Kiépítés – Egy adott feladatbeküldéshez igény szerinti számítás jön létre.

  • Előkészítés – A futtatási környezet előkészítése folyamatban van, és a következő két szakasz egyikében van:

    • Docker-rendszerkép összeállítása

    • conda-környezet beállítása

  • Queued – A feladat várólistára van helyezve a számítási célon. A BatchAI-ban például a feladat várólistás állapotban van

    amíg az összes kért csomópont készen áll.

  • Futtatás – A feladat elkezdett futni a számítási célon.

  • Véglegesítés – A felhasználói kód végrehajtása befejeződött, a futtatás pedig a feldolgozás utáni fázisokban van.

  • CancelRequested – A feladat lemondását kérték.

  • Befejeződött – A futtatás sikeresen befejeződött. Ez magában foglalja a felhasználói kód végrehajtását és a futtatást is

    utófeldolgozási fázisok.

  • Sikertelen – A futtatás sikertelen volt. A futtatáskor általában az Error tulajdonság adja meg a hiba okát.

  • Megszakítva – Egy lemondási kérést követ, és azt jelzi, hogy a futtatás sikeresen megszakadt.

  • NotKiszolgáló – Azon futtatások esetében, amelyeken engedélyezve van a szívverés, a rendszer nem küldött szívverést a közelmúltban.

Válaszok

A feladat állapota.

Visszatérési típus

studio_url

Azure ML Studio-végpont.

Válaszok

A feladat részleteit tartalmazó lap URL-címe.

Visszatérési típus

task_type

Feladattípus lekérése.

Válaszok

A futtatni kívánt feladat típusa. Lehetséges értékek: "besorolás", "regresszió", "előrejelzés".

Visszatérési típus

str

test_data

Tesztadatok lekérése.

Válaszok

Adatbevitel tesztelése

Visszatérési típus

training

training_data

Betanítási adatok lekérése.

Válaszok

Betanítási adatok bemenete

Visszatérési típus

type

A feladat típusa.

Válaszok

A feladat típusa.

Visszatérési típus

validation_data

Érvényesítési adatok lekérése.

Válaszok

Érvényesítési adatbevitel

Visszatérési típus