Hiperparaméterek számítógépes látási feladatokhoz az automatizált gépi tanulásban

2024-09-01

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Megtudhatja, hogy mely hiperparaméterek érhetők el kifejezetten számítógépes látási feladatokhoz automatizált gépi tanulási kísérletekben.

A számítógépes látási feladatok támogatásával szabályozhatja a modellarchitektúrát és a hiperparaméterek takarítását. Ezek a modellarchitektúrák és hiperparaméterek a takarítás paraméterterületeként kerülnek átadásra. Bár a közzétett hiperparaméterek többsége modellfüggő, vannak olyan példányok, ahol a hiperparaméterek modellspecifikusak vagy feladatspecifikusak.

Modellspecifikus hiperparaméterek

Ez a táblázat az architektúrára yolov5 jellemző hiperparamétereket foglalja össze.

Paraméter neve	Leírás	Alapértelmezett
`validation_metric_type`	Metrikaszámítási módszer az érvényesítési metrikákhoz. `none`Lehet , `coco`vagy `voccoco_voc`.	`voc`
`validation_iou_threshold`	IOU-küszöbérték a dobozegyezéshez az érvényesítési metrikák kiszámításakor. Úszónak kell lennie a tartományban [0.1, 1].	0,5
`image_size`	Képméret betanítása és ellenőrzése. Pozitív egész számnak kell lennie. Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.	640
`model_size`	Modell mérete. `small`Lehet , `medium`vagy `largeextra_large`. Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a modell mérete túl nagy.	`medium`
`multi_scale`	Több léptékű rendszerkép engedélyezése a képek méretének +/- 50%-kal történő variálásával 0 vagy 1 lehet. Megjegyzés: A betanítási futtatás akkor kerülhet a CUDA OOM-ba, ha nincs elegendő GPU-memória.	0
`box_score_threshold`	A következtetés során csak olyan javaslatokat ad vissza, amelyek pontszáma nagyobb, mint `box_score_threshold`. A pontszám az objektumérték és a besorolási valószínűség szorzása. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,1
`nms_iou_threshold`	A következtetés során használt IOU-küszöbérték a nem maximális letiltás utáni feldolgozás során. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,5
`tile_grid_size`	Az egyes képek burkolásához használandó rácsméret. Megjegyzés: a kis objektumészlelési logika engedélyezéséhez tile_grid_size nem lehet Nincs "3x2" formátumú sztringként kell átadni. Példa: --tile_grid_size '3x2'	Nincs alapértelmezett
`tile_overlap_ratio`	Átfedés aránya a szomszédos csempék között az egyes dimenziókban. A(z) [0, 1) tartományban kell lebegnie	0,25
`tile_predictions_nms_threshold`	Az NMS végrehajtásához használandó IOU-küszöbérték a csempékből és a rendszerképből származó előrejelzések egyesítése során. Érvényesítéshez/ következtetéshez használatos. A(z) [0, 1] tartományban kell lebegnie	0,25

Ez a táblázat a következtetés során a maskrcnn_* példány szegmentálására jellemző hiperparamétereket foglalja össze.

Paraméter neve	Leírás	Alapértelmezett
`mask_pixel_score_threshold`	Pontkivágás egy képpontnak az objektum maszkjának részeként való figyelembe vételéhez.	0,5
`max_number_of_polygon_points`	A (x, y) koordinátapárok maximális száma sokszögben a maszkból való átalakítás után.	100
`export_as_image`	Maszkok exportálása képként.	Hamis
`image_type`	A maszk exportálásához használt kép típusa (a beállítások jpg, png, bmp).	JPG

Modell agnosztikus hiperparaméterek

Az alábbi táblázat a modell agnosztikus hiperparamétereit ismerteti.

Paraméter neve	Leírás	Alapértelmezett
`number_of_epochs`	A betanítási korszakok száma. Pozitív egész számnak kell lennie.	15 (kivéve `yolov5`: 30)
`training_batch_size`	Betanítási köteg mérete. Pozitív egész számnak kell lennie.	Többosztályos/többcímke: 78 (a vit-variánsok kivételével: `vits16r224`: 128 `vitb16r224`: 48 `vitl16r224`:10) Objektumészlelés: 2 (kivéve `yolov5`: 16) Példány szegmentációja: 2 Megjegyzés: Az alapértelmezett érték a legnagyobb kötegméret, amely 12 GiB GPU-memórián használható.
`validation_batch_size`	Érvényesítési köteg mérete. Pozitív egész számnak kell lennie.	Többosztályos/többcímke: 78 (a vit-variánsok kivételével: `vits16r224`: 128 `vitb16r224`: 48 `vitl16r224`:10) Objektumészlelés: 1 (kivéve `yolov5`: 16) Példány szegmentációja: 1 Megjegyzés: Az alapértelmezett érték a legnagyobb kötegméret, amely 12 GiB GPU-memórián használható.
`gradient_accumulation_step`	A színátmenet-felhalmozás azt jelenti, hogy konfigurált számú futtatás a modell súlyainak `gradient_accumulation_step` frissítése nélkül, a lépések színátmeneteinek halmozása közben, majd a halmozott színátmenetek használatával kiszámítja a súlyfrissítéseket. Pozitív egész számnak kell lennie.	0
`early_stopping`	A korai leállítási logika engedélyezése a betanítás során. 0 vagy 1 lehet.	0
`early_stopping_patience`	Az érvényességi vagy érvényesítési értékelések minimális száma a következővel: nincs elsődleges metrikafejlesztés a futtatás leállítása előtt. Pozitív egész számnak kell lennie.	5
`early_stopping_delay`	Várakozási idő vagy érvényesítési értékelések minimális száma az elsődleges metrikafejlesztés nyomon követése a korai leállítás érdekében. Pozitív egész számnak kell lennie.	5
`learning_rate`	Kezdeti tanulási arány. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	Többosztályos: 0.01 (a vit-variánsok kivételével: `vits16r224`: 0.0125 `vitb16r224`: 0.0125 `vitl16r224`: 0.001) Többcímke: 0,035 (a vit-variánsok kivételével: `vits16r224`: 0.025 `vitb16r224`: 0.025 `vitl16r224`: 0.002) Objektumészlelés: 0.005 (kivéve `yolov5`: 0,01) Példány szegmentálása: 0.005
`learning_rate_scheduler`	A tanulási sebességütemező típusa. Kell lennie vagy `warmup_cosinestep`.	`warmup_cosine`
`step_lr_gamma`	A gamma értéke, ha a tanulási sebességütemező a `step`. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,5
`step_lr_step_size`	A lépésméret értéke, ha a tanulási sebességütemező a `step`. Pozitív egész számnak kell lennie.	5
`warmup_cosine_lr_cycles`	A koszinuszciklus értéke, ha a tanulási sebességütemező a `warmup_cosine`. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,45
`warmup_cosine_lr_warmup_epochs`	A bemelegítési időszak értéke, ha a tanulási sebességütemező a `warmup_cosine`. Pozitív egész számnak kell lennie.	2
`optimizer`	Az optimalizáló típusa. Vagy `sgd`annak kell lennie , `adam`. `adamw`	`sgd`
`momentum`	A lendület értéke, ha az optimalizáló .`sgd` Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,9
`weight_decay`	A súlycsökkenés értéke, ha az optimalizáló az `sgd`, `adam`vagy `adamw`. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	1e-4
`nesterov`	Engedélyezze `nesterov` , ha az optimalizáló a `sgd`. 0 vagy 1 lehet.	0
`beta1`	`beta1` Annak az értéke, hogy az optimalizáló vagy a `adamadamw`. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,9
`beta2`	`beta2` Annak az értéke, hogy az optimalizáló vagy a `adamadamw`. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,999
`ams_gradient`	Engedélyezve `ams_gradient` van, ha az optimalizáló vagy `adam`a `adamw` . 0 vagy 1 lehet.	0
`evaluation_frequency`	Az érvényesítési adatkészlet kiértékelésének gyakorisága a metrika pontszámainak lekéréséhez. Pozitív egész számnak kell lennie.	0
`checkpoint_frequency`	A modell ellenőrzőpontjainak tárolási gyakorisága. Pozitív egész számnak kell lennie.	Ellenőrzőpont a korszakban a legjobb elsődleges metrikával az ellenőrzés során.
`checkpoint_run_id`	Annak a kísérletnek a futtatási azonosítója, amely előre betanított ellenőrzőponttal rendelkezik a növekményes betanításhoz.	nincs alapértelmezett
`layers_to_freeze`	Hány réteget kell rögzíteni a modellhez. Például a 2 `seresnext` érték átadása a 0. réteg és az 1. réteg befagyasztását jelenti, amely az alábbi támogatott modellréteg-információkra hivatkozik. Pozitív egész számnak kell lennie. - `'resnet'`: `[('conv1.', 'bn1.'), 'layer1.', 'layer2.', 'layer3.', 'layer4.']` - `'mobilenetv2'`: `['features.0.', 'features.1.', 'features.2.', 'features.3.', 'features.4.', 'features.5.', 'features.6.', 'features.7.', 'features.8.', 'features.9.', 'features.10.', 'features.11.', 'features.12.', 'features.13.', 'features.14.', 'features.15.', 'features.16.', 'features.17.', 'features.18.']` - `'seresnext'`: `['layer0.', 'layer1.', 'layer2.', 'layer3.', 'layer4.']` * : `'vit'['patch_embed', 'blocks.0.', 'blocks.1.', 'blocks.2.', 'blocks.3.', 'blocks.4.', 'blocks.5.', 'blocks.6.','blocks.7.', 'blocks.8.', 'blocks.9.', 'blocks.10.', 'blocks.11.']` * `'yolov5_backbone'['model.0.', 'model.1.', 'model.2.', 'model.3.', 'model.4.','model.5.', 'model.6.', 'model.7.', 'model.8.', 'model.9.']` - `'resnet_backbone'`: `['backbone.body.conv1.', 'backbone.body.layer1.', 'backbone.body.layer2.','backbone.body.layer3.', 'backbone.body.layer4.']`	nincs alapértelmezett

Képosztályozás (többosztályos és többcímkés) specifikus hiperparaméterek

Az alábbi táblázat a képosztályozási (többosztályos és többcímkés) feladatok hiperparmétereit foglalja össze.

Paraméter neve	Leírás	Alapértelmezett
`model_name`	A képbesorolási feladathoz használandó modellnév. Az egyik `mobilenetv2`, , , `resnet18`, `resnet34resnet50`, `resnet101`, `resnet152resnest50resnest101seresnext`, `vits16r224vitb16r224`. `vitl16r224`	`seresnext`
`weighted_loss`	- 0 súlyozás nélkül. - 1 a súlyozott veszteség sqrt. (class_weights) - 2 a súlyozott veszteség class_weights. - 0 vagy 1 vagy 2 lehet.	0
`validation_resize_size`	– Képméret, amelyre az érvényesítési adathalmaz körülvágása előtt átméretezendő. - Pozitív egész számnak kell lennie. Notes: - `seresnext` nem vesz fel tetszőleges méretet. - A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.	256
`validation_crop_size`	– Kép körülvágási mérete, amely a neurális hálózatba ad be érvényesítési adatkészletet. - Pozitív egész számnak kell lennie. Notes: - `seresnext` nem vesz fel tetszőleges méretet. - A ViT-variánsoknak azonosnak `validation_crop_sizetraining_crop_size` és . - A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.	224
`training_crop_size`	- A kép körülvágási mérete, amely a neurális hálózatba a betanítási adathalmazhoz van beadva. - Pozitív egész számnak kell lennie. Notes: - `seresnext` nem vesz fel tetszőleges méretet. - A ViT-variánsoknak azonosnak `validation_crop_sizetraining_crop_size` és . - A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.	224

Objektumészlelés és példányszegmentálási feladatspecifikus hiperparaméterek

Az alábbi hiperparaméterek objektumészlelési és példányszegmentálási feladatokhoz használhatók.

Figyelmeztetés

Ezeket a paramétereket az yolov5 architektúra nem támogatja. A támogatott hiperparmétereket a modellspecifikus hiperparaméterek szakaszában yolov5 találja.

Paraméter neve	Leírás	Alapértelmezett
`model_name`	A képbesorolási feladathoz használandó modellnév. - Az objektumészlelési feladathoz az egyik `yolov5`, `fasterrcnn_resnet18_fpn`, , `fasterrcnn_resnet34_fpn`, `fasterrcnn_resnet50_fpn`, `fasterrcnn_resnet101_fpn`, `fasterrcnn_resnet152_fpnretinanet_resnet50_fpn`. - Például szegmentálási tevékenységnek kell lennie az `maskrcnn_resnet18_fpn`egyik , `maskrcnn_resnet34_fpn`, `maskrcnn_resnet50_fpn`, , , `maskrcnn_resnet101_fpnmaskrcnn_resnet152_fpn`	- Objektumészlelési feladat esetén: `fasterrcnn_resnet50_fpn` – Például szegmentálási feladat, `maskrcnn_resnet50_fpn`
`validation_metric_type`	Metrikaszámítási módszer az érvényesítési metrikákhoz. `none`Lehet , `coco`vagy `voccoco_voc`.	`voc`
`validation_iou_threshold`	IOU-küszöbérték a dobozegyezéshez az érvényesítési metrikák kiszámításakor. Úszónak kell lennie a tartományban [0.1, 1].	0,5
`min_size`	Az újraskálázandó kép minimális mérete, mielőtt a gerinchez táplálja. Pozitív egész számnak kell lennie. Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.	600
`max_size`	Az újraskálázandó kép maximális mérete, mielőtt a gerinchez táplálja. Pozitív egész számnak kell lennie. Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.	1333
`box_score_threshold`	A következtetés során csak olyan javaslatokat ad vissza, amelyek besorolási pontszáma nagyobb, mint `box_score_threshold`. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,3
`nms_iou_threshold`	Az előrejelzési vezető számára a nem maximális elnyomásban (NMS) használt IOU (metszet az unióval szemben) küszöbérték. A következtetés során használatos. Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.	0,5
`box_detections_per_image`	Az észlelések maximális száma képenként, minden osztály esetében. Pozitív egész számnak kell lennie.	100
`tile_grid_size`	Az egyes képek burkolásához használandó rácsméret. - `tile_grid_size`a kis objektumészlelési logika engedélyezéséhez nem lehet Nincs. - `tile_grid_size` a példányszegmentálási feladatok esetében nem támogatott. "3x2" formátumú sztringként kell átadni. Példa: --tile_grid_size '3x2'	Nincs alapértelmezett
`tile_overlap_ratio`	Átfedés aránya a szomszédos csempék között az egyes dimenziókban. A(z) [0, 1) tartományban kell lebegnie	0,25
`tile_predictions_nms_threshold`	Az NMS végrehajtásához használandó IOU-küszöbérték a csempékből és a rendszerképből származó előrejelzések egyesítése során. Érvényesítéshez/ következtetéshez használatos. A(z) [0, 1] tartományban kell lebegnie	0,25

Következő lépések

Megtudhatja, hogyan állíthatja be az AutoML-t a számítógépes látásmodellek Pythonnal való betanítása érdekében.
Oktatóanyag: Objektumészlelési modell betanítása az AutoML és a Python használatával.