ClassificationJob Osztály
Az AutoML-besorolási feladat konfigurációja.
Új AutoML-besorolási feladat inicializálása.
- Öröklődés
-
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabularClassificationJob
Konstruktor
ClassificationJob(*, primary_metric: str | None = None, positive_label: str | None = None, **kwargs)
Paraméterek
Az optimalizáláshoz használandó elsődleges metrika alapértelmezés szerint Nincs
Pozitív címke a bináris metrikák kiszámításához, alapértelmezés szerint Nincs
- featurization
- Optional[TabularFeaturizationSettings]
A featurizációs beállítások. Alapértelmezés szerint Nincs.
- limits
- Optional[TabularLimitSettings]
Korlátok beállításai. Alapértelmezés szerint Nincs.
- training
- Optional[TrainingSettings]
Betanítási beállítások. Alapértelmezés szerint Nincs.
Az optimalizáláshoz használandó elsődleges metrika alapértelmezés szerint Nincs
Pozitív címke a bináris metrikák kiszámításához, alapértelmezés szerint Nincs
- featurization
- Optional[TabularFeaturizationSettings]
a featurizációs beállításokat. Alapértelmezés szerint Nincs.
- limits
- Optional[TabularLimitSettings]
korlátozási beállításokat. Alapértelmezés szerint Nincs.
- training
- Optional[TrainingSettings]
betanítási beállítások. Alapértelmezés szerint Nincs.
Metódusok
dump |
A feladat tartalmát YAML formátumú fájlba menti. |
set_data |
Adatkonfiguráció definiálása. |
set_featurization |
Funkciómérnöki konfiguráció definiálása. |
set_limits |
Állítsa be a feladat korlátait. |
set_training |
A betanítással kapcsolatos beállítások konfigurálásának módja. |
dump
A feladat tartalmát YAML formátumú fájlba menti.
dump(dest: str | PathLike | IO, **kwargs) -> None
Paraméterek
A YAML-tartalom írásához használt helyi elérési út vagy fájlstream. Ha a dest fájlelérési út, a rendszer új fájlt hoz létre. Ha a dest egy megnyitott fájl, a fájl közvetlenül a fájlba lesz megírva.
- kwargs
- dict
A YAML szerializálónak átadandó további argumentumok.
Kivételek
Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.
Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.
set_data
Adatkonfiguráció definiálása.
set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None
Paraméterek
- training_data
- Input
Betanítási adatok.
- target_column_name
- str
A céloszlop oszlopneve.
Kivételek
Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.
Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.
set_featurization
Funkciómérnöki konfiguráció definiálása.
set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None
Paraméterek
- blocked_transformers
- Optional[List[Union[BlockedTransformers, str]]]
A featurizáció során letiltandó transzformátornevek listája, alapértelmezés szerint Nincs
Az oszlop céljának frissítéséhez használt oszlopnevek és szolgáltatástípusok szótára, alapértelmezés szerint Nincs értékre
Három karakteres ISO 639-3 kód az adatkészletben található nyelv(ek)hez. Az angoltól eltérő nyelvek csak AKKOR támogatottak, ha GPU-kompatibilis számítást használ. Ha az adatkészlet több nyelvet tartalmaz, akkor a "mul" language_code kell használni. A különböző nyelvek ISO 639-3-kódjainak megkereséséhez tekintse meg a https://en.wikipedia.org/wiki/List_of_ISO_639-3_codeskövetkezőt: , alapértelmezés szerint Nincs
- transformer_params
- Optional[Dict[str, List[ColumnTransformer]]]
A transzformátor szótára és a megfelelő testreszabási paraméterek , alapértelmezés szerint Nincs
DNN-alapú szolgáltatástervezési módszerek belefoglalása, alapértelmezés szerint Nincs
Kivételek
Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.
Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.
set_limits
Állítsa be a feladat korlátait.
set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Paraméterek
Ha a pontszám rövid távon nem javul, engedélyezze-e a korai leállítást, alapértelmezés szerint Nincs.
Korai leállítási logika:
Nincs korai leállítás az első 20 iterációhoz (nevezetességekhez).
A korai leállítási ablak a 21. iterációban kezdődik, és early_stopping_n_iters iterációkat keres
(jelenleg 10 értékre van állítva). Ez azt jelenti, hogy az első iteráció, ahol leállítás történhet, a 31.
Az AutoML a korai leállítás után is 2 együttes iterációt ütemez, ami magasabb pontszámot eredményezhet.
A korai leállítás akkor aktiválódik, ha a kiszámított legjobb pontszám abszolút értéke megegyezik a múlttal
early_stopping_n_iters iterációk, azaz ha nincs javulás az early_stopping_n_iters iterációk pontszámában.
A kísérlet célpontszáma. A kísérlet a pontszám elérése után leáll. Ha nincs megadva (nincs feltétel), a kísérlet addig fut, amíg az elsődleges metrika nem halad tovább. A kilépési feltételekről további információt ebben a cikkben talál: , alapértelmezés szerint Nincs
Ez a párhuzamosan végrehajtható iterációk maximális száma. Az alapértelmezett érték az 1.
- Az AmlCompute-fürtök csomópontonként egy iterációt támogatnak.
Ha több AutoML-kísérlet szülőfuttatása fut párhuzamosan egyetlen AmlCompute-fürtön, az összes kísérlet értékeinek összege max_concurrent_trials
nem haladhatja meg a csomópontok maximális számát. Ellenkező esetben a futtatások várólistára kerülnek, amíg a csomópontok elérhetővé nem válnak.
- A DSVM csomópontonként több iterációt is támogat.
max_concurrent_trials
Kell
kisebbnek vagy egyenlőnek kell lennie a DSVM magjainak számával. Ha több kísérlet fut párhuzamosan egyetlen DSVM-en, az összes kísérlet értékeinek összege max_concurrent_trials
nem haladhatja meg a csomópontok maximális számát.
- Databricks –
max_concurrent_trials
nem lehet kisebb, mint a
feldolgozó csomópontok a Databricksben.
max_concurrent_trials
nem vonatkozik a helyi futtatásokra. Korábban ezt a paramétert nevezték el concurrent_iterations
.
Az adott betanítási iterációhoz használandó szálak maximális száma. Elfogadható értékek:
Nagyobb, mint 1 és kisebb, mint a számítási célmagok maximális száma.
Egyenlő -1-sel, ami azt jelenti, hogy az összes lehetséges magot iterációnként kell használni gyermekfuttatásonként.
Az alapértelmezett érték 1.
[Kísérleti] Az elosztott betanításhoz használandó csomópontok maximális száma.
Az előrejelzéshez az egyes modellek betanítása max(2, int(max_nodes/max_concurrent_trials)) csomópontokkal történik.
Besorolás/regresszió esetén az egyes modellek betanítása max_nodes csomópontok használatával történik.
Megjegyzés – Ez a paraméter nyilvános előzetes verzióban érhető el, és a jövőben változhat.
Az automatizált gépi tanulási kísérlet során tesztelendő különböző algoritmus- és paraméterkombinációk teljes száma. Ha nincs megadva, az alapértelmezett érték 1000 iteráció.
A kísérlet befejezése előtt az összes iteráció legfeljebb percek alatt befejeződhet. Ha nincs megadva, a kísérlet alapértelmezett időtúllépése 6 nap. Ha 1 óránál rövidebb vagy egyenlő időtúllépést szeretne megadni, győződjön meg arról, hogy az adathalmaz mérete nem nagyobb 10 000 000-nél (sorok száma oszlopban) vagy hibaeredménynél, alapértelmezés szerint Nincs
Az egyes iterációk futásának maximális időtartama percekben, mielőtt befejeződik. Ha nincs megadva, a rendszer 1 hónapos vagy 43200 perces értéket használ, alapértelmezés szerint Nincs értékre.
Kivételek
Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.
Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.
set_training
A betanítással kapcsolatos beállítások konfigurálásának módja.
set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None
Paraméterek
Engedélyezi vagy letiltja az ONNX-kompatibilis modellek kényszerítését. Az alapértelmezett érték a Hamis. Az Open Neural Network Exchange (ONNX) és az Azure Machine Learning szolgáltatással kapcsolatos további információkért tekintse meg ezt a cikket.
DNN-alapú modellek belefoglalása a modell kiválasztása során. Az alapértelmezett érték azonban Igaz a DNN NLP-tevékenységek esetében, és az összes többi AutoML-tevékenység esetén hamis.
Engedélyezi-e a legjobb AutoML-modell magyarázatát az autoML betanítási iterációinak végén. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban. , alapértelmezés szerint Nincs
A StackEnsemble iteráció engedélyezése/letiltása. Ha enable_onnx_compatible_models jelző van beállítva, a StackEnsemble iteráció le lesz tiltva. Hasonlóképpen, az Időzített feladatok esetében a StackEnsemble iteráció alapértelmezés szerint le lesz tiltva, hogy elkerülje a túlillesztés kockázatát a metatanuló illesztéséhez használt kis betanítási készlet miatt. További információ az együttesekről: Együttes konfigurációja , alapértelmezett értéke Nincs
A VotingEnsemble iteráció engedélyezése/letiltása. További információ az együttesekről: Együttes konfigurációja , alapértelmezett értéke Nincs
- stack_ensemble_settings
- Optional[StackEnsembleSettings]
A StackEnsemble iteráció beállításai, alapértelmezés szerint Nincs
A VotingEnsemble és a StackEnsemble modell létrehozása során a rendszer az előző gyermekfuttatások több illesztett modelljét tölti le. Konfigurálja ezt a paramétert 300 másodpercnél nagyobb értékkel, ha több időre van szükség, alapértelmezés szerint Nincs
Modellnevek listája egy kísérlet kereséséhez. Ha nincs megadva, akkor a rendszer a tevékenységhez támogatott összes modellt használja a TensorFlow-modellekben blocked_training_algorithms
megadott vagy elavult modellek nélkül, alapértelmezés szerint Nincs értékre
A kísérletben figyelmen kívül hagyandó algoritmusok listája, alapértelmezés szerint Nincs
- training_mode
- Optional[Union[str, TabularTrainingMode]]
[Kísérleti] A használni kívánt betanítási mód. A lehetséges értékek a következők:
distributed – lehetővé teszi az elosztott betanítást a támogatott algoritmusokhoz.
non_distributed – letiltja az elosztott betanítást.
auto – Jelenleg ugyanaz, mint non_distributed. A jövőben ez megváltozhat.
Megjegyzés: Ez a paraméter nyilvános előzetes verzióban érhető el, és a jövőben változhat.
Kivételek
Akkor jön létre, ha a dest fájlelérési út, és a fájl már létezik.
Akkor jön létre, ha a dest egy megnyitott fájl, és a fájl nem írható.
Attribútumok
base_path
creation_context
Az erőforrás létrehozási környezete.
Válaszok
Az erőforrás létrehozási metaadatai.
Visszatérési típus
featurization
Kérje le az AutoML-feladat táblázatos featurizációs beállításait.
Válaszok
Az AutoML-feladat táblázatos featurizációs beállításai
Visszatérési típus
id
Az erőforrás-azonosító.
Válaszok
Az erőforrás globális azonosítója, egy Azure Resource Manager (ARM) azonosító.
Visszatérési típus
inputs
limits
Kérje le az AutoML-feladat táblázatos korlátait.
Válaszok
Az AutoML-feladat táblázatos korlátai
Visszatérési típus
log_files
Feladat kimeneti fájljai.
Válaszok
A naplónevek és URL-címek szótára.
Visszatérési típus
log_verbosity
Kérje le az AutoML-feladat naplórészletességét.
Válaszok
napló részletessége az AutoML-feladathoz
Visszatérési típus
outputs
primary_metric
Az optimalizáláshoz használandó elsődleges metrika.
Válaszok
Az optimalizáláshoz használandó elsődleges metrika.
Visszatérési típus
status
A feladat állapota.
A visszaadott értékek közé tartozik a "Running", a "Completed" és a "Failed" (Sikertelen). Minden lehetséges érték a következő:
NotStarted – Ez egy ideiglenes állapot, amelyben az ügyféloldali Run objektumok a felhőbeküldés előtt találhatók.
Indítás – A futtatás megkezdődött a felhőben való feldolgozásban. A hívó ezen a ponton futtatási azonosítóval rendelkezik.
Kiépítés – Egy adott feladatbeküldéshez igény szerinti számítás jön létre.
Előkészítés – A futtatási környezet előkészítése folyamatban van, és a következő két szakasz egyikében van:
Docker-rendszerkép összeállítása
conda-környezet beállítása
Queued – A feladat várólistára van helyezve a számítási célon. A BatchAI-ban például a feladat várólistás állapotban van
amíg az összes kért csomópont készen áll.
Futtatás – A feladat elkezdett futni a számítási célon.
Véglegesítés – A felhasználói kód végrehajtása befejeződött, a futtatás pedig a feldolgozás utáni fázisokban van.
CancelRequested – A feladat lemondását kérték.
Befejeződött – A futtatás sikeresen befejeződött. Ez magában foglalja a felhasználói kód végrehajtását és a futtatást is
utófeldolgozási fázisok.
Sikertelen – A futtatás sikertelen volt. A futtatáskor általában az Error tulajdonság adja meg a hiba okát.
Megszakítva – Egy lemondási kérést követ, és azt jelzi, hogy a futtatás sikeresen megszakadt.
NotKiszolgáló – Azon futtatások esetében, amelyeken engedélyezve van a szívverés, a rendszer nem küldött szívverést a közelmúltban.
Válaszok
A feladat állapota.
Visszatérési típus
studio_url
Azure ML Studio-végpont.
Válaszok
A feladat részleteit tartalmazó lap URL-címe.
Visszatérési típus
task_type
Feladattípus lekérése.
Válaszok
A futtatni kívánt feladat típusa. Lehetséges értékek: "besorolás", "regresszió", "előrejelzés".
Visszatérési típus
test_data
training
AutoML-besorolási feladat betanítási beállításai.
Válaszok
Az AutoML-besorolási feladathoz használt betanítási beállítások.
Visszatérési típus
training_data
type
validation_data
Azure SDK for Python