Megosztás a következőn keresztül:


Hiperparaméterek számítógépes látási feladatokhoz az automatizált gépi tanulásban

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Megtudhatja, hogy mely hiperparaméterek érhetők el kifejezetten számítógépes látási feladatokhoz automatizált gépi tanulási kísérletekben.

A számítógépes látási feladatok támogatásával szabályozhatja a modellarchitektúrát és a hiperparaméterek takarítását. Ezek a modellarchitektúrák és hiperparaméterek a takarítás paraméterterületeként kerülnek átadásra. Bár a közzétett hiperparaméterek többsége modellfüggő, vannak olyan példányok, ahol a hiperparaméterek modellspecifikusak vagy feladatspecifikusak.

Modellspecifikus hiperparaméterek

Ez a táblázat az architektúrára yolov5 jellemző hiperparamétereket foglalja össze.

Paraméter neve Leírás Alapértelmezett
validation_metric_type Metrikaszámítási módszer az érvényesítési metrikákhoz.
noneLehet , cocovagy voccoco_voc.
voc
validation_iou_threshold IOU-küszöbérték a dobozegyezéshez az érvényesítési metrikák kiszámításakor.
Úszónak kell lennie a tartományban [0.1, 1].
0,5
image_size Képméret betanítása és ellenőrzése.
Pozitív egész számnak kell lennie.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.
640
model_size Modell mérete.
smallLehet , mediumvagy largeextra_large.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a modell mérete túl nagy.
medium
multi_scale Több léptékű rendszerkép engedélyezése a képek méretének +/- 50%-kal történő variálásával
0 vagy 1 lehet.

Megjegyzés: A betanítási futtatás akkor kerülhet a CUDA OOM-ba, ha nincs elegendő GPU-memória.
0
box_score_threshold A következtetés során csak olyan javaslatokat ad vissza, amelyek pontszáma nagyobb, mint box_score_threshold. A pontszám az objektumérték és a besorolási valószínűség szorzása.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,1
nms_iou_threshold A következtetés során használt IOU-küszöbérték a nem maximális letiltás utáni feldolgozás során.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,5
tile_grid_size Az egyes képek burkolásához használandó rácsméret.
Megjegyzés: a kis objektumészlelési logika engedélyezéséhez tile_grid_size nem lehet Nincs
"3x2" formátumú sztringként kell átadni. Példa: --tile_grid_size '3x2'
Nincs alapértelmezett
tile_overlap_ratio Átfedés aránya a szomszédos csempék között az egyes dimenziókban.
A(z) [0, 1) tartományban kell lebegnie
0,25
tile_predictions_nms_threshold Az NMS végrehajtásához használandó IOU-küszöbérték a csempékből és a rendszerképből származó előrejelzések egyesítése során. Érvényesítéshez/ következtetéshez használatos.
A(z) [0, 1] tartományban kell lebegnie
0,25

Ez a táblázat a következtetés során a maskrcnn_* példány szegmentálására jellemző hiperparamétereket foglalja össze.

Paraméter neve Leírás Alapértelmezett
mask_pixel_score_threshold Pontkivágás egy képpontnak az objektum maszkjának részeként való figyelembe vételéhez. 0,5
max_number_of_polygon_points A (x, y) koordinátapárok maximális száma sokszögben a maszkból való átalakítás után. 100
export_as_image Maszkok exportálása képként. Hamis
image_type A maszk exportálásához használt kép típusa (a beállítások jpg, png, bmp). JPG

Modell agnosztikus hiperparaméterek

Az alábbi táblázat a modell agnosztikus hiperparamétereit ismerteti.

Paraméter neve Leírás Alapértelmezett
number_of_epochs A betanítási korszakok száma.
Pozitív egész számnak kell lennie.
15
(kivéve yolov5: 30)
training_batch_size Betanítási köteg mérete.
Pozitív egész számnak kell lennie.
Többosztályos/többcímke: 78
(a vit-variánsok kivételével:
vits16r224: 128
vitb16r224: 48
vitl16r224:10)

Objektumészlelés: 2
(kivéve yolov5: 16)

Példány szegmentációja: 2

Megjegyzés: Az alapértelmezett érték a legnagyobb kötegméret, amely 12 GiB GPU-memórián használható.
validation_batch_size Érvényesítési köteg mérete.
Pozitív egész számnak kell lennie.
Többosztályos/többcímke: 78
(a vit-variánsok kivételével:
vits16r224: 128
vitb16r224: 48
vitl16r224:10)

Objektumészlelés: 1
(kivéve yolov5: 16)

Példány szegmentációja: 1

Megjegyzés: Az alapértelmezett érték a legnagyobb kötegméret, amely 12 GiB GPU-memórián használható.
gradient_accumulation_step A színátmenet-felhalmozás azt jelenti, hogy konfigurált számú futtatás a modell súlyainak gradient_accumulation_step frissítése nélkül, a lépések színátmeneteinek halmozása közben, majd a halmozott színátmenetek használatával kiszámítja a súlyfrissítéseket.
Pozitív egész számnak kell lennie.
0
early_stopping A korai leállítási logika engedélyezése a betanítás során.
0 vagy 1 lehet.
0
early_stopping_patience Az érvényességi vagy érvényesítési értékelések minimális száma a következővel:
nincs elsődleges metrikafejlesztés a futtatás leállítása előtt.
Pozitív egész számnak kell lennie.
5
early_stopping_delay Várakozási idő vagy érvényesítési értékelések minimális száma
az elsődleges metrikafejlesztés nyomon követése a korai leállítás érdekében.
Pozitív egész számnak kell lennie.
5
learning_rate Kezdeti tanulási arány.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
Többosztályos: 0.01
(a vit-variánsok kivételével:
vits16r224: 0.0125
vitb16r224: 0.0125
vitl16r224: 0.001)

Többcímke: 0,035
(a vit-variánsok kivételével:
vits16r224: 0.025
vitb16r224: 0.025
vitl16r224: 0.002)

Objektumészlelés: 0.005
(kivéve yolov5: 0,01)

Példány szegmentálása: 0.005
learning_rate_scheduler A tanulási sebességütemező típusa.
Kell lennie vagy warmup_cosinestep.
warmup_cosine
step_lr_gamma A gamma értéke, ha a tanulási sebességütemező a step.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,5
step_lr_step_size A lépésméret értéke, ha a tanulási sebességütemező a step.
Pozitív egész számnak kell lennie.
5
warmup_cosine_lr_cycles A koszinuszciklus értéke, ha a tanulási sebességütemező a warmup_cosine.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,45
warmup_cosine_lr_warmup_epochs A bemelegítési időszak értéke, ha a tanulási sebességütemező a warmup_cosine.
Pozitív egész számnak kell lennie.
2
optimizer Az optimalizáló típusa.
Vagy sgdannak kell lennie , adam. adamw
sgd
momentum A lendület értéke, ha az optimalizáló .sgd
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,9
weight_decay A súlycsökkenés értéke, ha az optimalizáló az sgd, adamvagy adamw.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
1e-4
nesterov Engedélyezze nesterov , ha az optimalizáló a sgd.
0 vagy 1 lehet.
0
beta1 beta1 Annak az értéke, hogy az optimalizáló vagy a adamadamw.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,9
beta2 beta2 Annak az értéke, hogy az optimalizáló vagy a adamadamw.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,999
ams_gradient Engedélyezve ams_gradient van, ha az optimalizáló vagy adama adamw .
0 vagy 1 lehet.
0
evaluation_frequency Az érvényesítési adatkészlet kiértékelésének gyakorisága a metrika pontszámainak lekéréséhez.
Pozitív egész számnak kell lennie.
0
checkpoint_frequency A modell ellenőrzőpontjainak tárolási gyakorisága.
Pozitív egész számnak kell lennie.
Ellenőrzőpont a korszakban a legjobb elsődleges metrikával az ellenőrzés során.
checkpoint_run_id Annak a kísérletnek a futtatási azonosítója, amely előre betanított ellenőrzőponttal rendelkezik a növekményes betanításhoz. nincs alapértelmezett
layers_to_freeze Hány réteget kell rögzíteni a modellhez. Például a 2 seresnext érték átadása a 0. réteg és az 1. réteg befagyasztását jelenti, amely az alábbi támogatott modellréteg-információkra hivatkozik.
Pozitív egész számnak kell lennie.

- 'resnet': [('conv1.', 'bn1.'), 'layer1.', 'layer2.', 'layer3.', 'layer4.']
- 'mobilenetv2': ['features.0.', 'features.1.', 'features.2.', 'features.3.', 'features.4.', 'features.5.', 'features.6.', 'features.7.', 'features.8.', 'features.9.', 'features.10.', 'features.11.', 'features.12.', 'features.13.', 'features.14.', 'features.15.', 'features.16.', 'features.17.', 'features.18.']
- 'seresnext': ['layer0.', 'layer1.', 'layer2.', 'layer3.', 'layer4.'] * : 'vit'['patch_embed', 'blocks.0.', 'blocks.1.', 'blocks.2.', 'blocks.3.', 'blocks.4.', 'blocks.5.', 'blocks.6.','blocks.7.', 'blocks.8.', 'blocks.9.', 'blocks.10.', 'blocks.11.'] * 'yolov5_backbone'['model.0.', 'model.1.', 'model.2.', 'model.3.', 'model.4.','model.5.', 'model.6.', 'model.7.', 'model.8.', 'model.9.']
- 'resnet_backbone': ['backbone.body.conv1.', 'backbone.body.layer1.', 'backbone.body.layer2.','backbone.body.layer3.', 'backbone.body.layer4.']
nincs alapértelmezett

Képosztályozás (többosztályos és többcímkés) specifikus hiperparaméterek

Az alábbi táblázat a képosztályozási (többosztályos és többcímkés) feladatok hiperparmétereit foglalja össze.

Paraméter neve Leírás Alapértelmezett
model_name A képbesorolási feladathoz használandó modellnév.

Az egyik mobilenetv2, , , resnet18, resnet34resnet50, resnet101, resnet152resnest50resnest101seresnext, vits16r224vitb16r224. vitl16r224
seresnext
weighted_loss - 0 súlyozás nélkül.
- 1 a súlyozott veszteség sqrt. (class_weights)
- 2 a súlyozott veszteség class_weights.
- 0 vagy 1 vagy 2 lehet.
0
validation_resize_size – Képméret, amelyre az érvényesítési adathalmaz körülvágása előtt átméretezendő.
- Pozitív egész számnak kell lennie.

Notes:
- seresnext nem vesz fel tetszőleges méretet.
- A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy
.
256
validation_crop_size – Kép körülvágási mérete, amely a neurális hálózatba ad be érvényesítési adatkészletet.
- Pozitív egész számnak kell lennie.

Notes:
- seresnext nem vesz fel tetszőleges méretet.
- A ViT-variánsoknak azonosnak validation_crop_sizetraining_crop_size és .
- A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy
.
224
training_crop_size - A kép körülvágási mérete, amely a neurális hálózatba a betanítási adathalmazhoz van beadva.
- Pozitív egész számnak kell lennie.

Notes:
- seresnext nem vesz fel tetszőleges méretet.
- A ViT-variánsoknak azonosnak validation_crop_sizetraining_crop_size és .
- A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy
.
224

Objektumészlelés és példányszegmentálási feladatspecifikus hiperparaméterek

Az alábbi hiperparaméterek objektumészlelési és példányszegmentálási feladatokhoz használhatók.

Figyelmeztetés

Ezeket a paramétereket az yolov5 architektúra nem támogatja. A támogatott hiperparmétereket a modellspecifikus hiperparaméterek szakaszában yolov5 találja.

Paraméter neve Leírás Alapértelmezett
model_name A képbesorolási feladathoz használandó modellnév.
- Az objektumészlelési feladathoz az egyik yolov5, fasterrcnn_resnet18_fpn, , fasterrcnn_resnet34_fpn, fasterrcnn_resnet50_fpn, fasterrcnn_resnet101_fpn, fasterrcnn_resnet152_fpnretinanet_resnet50_fpn.
- Például szegmentálási tevékenységnek kell lennie az maskrcnn_resnet18_fpnegyik , maskrcnn_resnet34_fpn, maskrcnn_resnet50_fpn, , , maskrcnn_resnet101_fpnmaskrcnn_resnet152_fpn
- Objektumészlelési feladat esetén: fasterrcnn_resnet50_fpn
– Például szegmentálási feladat, maskrcnn_resnet50_fpn
validation_metric_type Metrikaszámítási módszer az érvényesítési metrikákhoz.
noneLehet , cocovagy voccoco_voc.
voc
validation_iou_threshold IOU-küszöbérték a dobozegyezéshez az érvényesítési metrikák kiszámításakor.
Úszónak kell lennie a tartományban [0.1, 1].
0,5
min_size Az újraskálázandó kép minimális mérete, mielőtt a gerinchez táplálja.
Pozitív egész számnak kell lennie.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.
600
max_size Az újraskálázandó kép maximális mérete, mielőtt a gerinchez táplálja.
Pozitív egész számnak kell lennie.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.
1333
box_score_threshold A következtetés során csak olyan javaslatokat ad vissza, amelyek besorolási pontszáma nagyobb, mint box_score_threshold.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,3
nms_iou_threshold Az előrejelzési vezető számára a nem maximális elnyomásban (NMS) használt IOU (metszet az unióval szemben) küszöbérték. A következtetés során használatos.
Az [0, 1] tartományban lévő lebegőpontosnak kell lennie.
0,5
box_detections_per_image Az észlelések maximális száma képenként, minden osztály esetében.
Pozitív egész számnak kell lennie.
100
tile_grid_size Az egyes képek burkolásához használandó rácsméret.
- tile_grid_sizea kis objektumészlelési logika engedélyezéséhez nem lehet Nincs.
- tile_grid_size a példányszegmentálási feladatok esetében nem támogatott.
"3x2" formátumú sztringként kell átadni. Példa: --tile_grid_size '3x2'
Nincs alapértelmezett
tile_overlap_ratio Átfedés aránya a szomszédos csempék között az egyes dimenziókban.
A(z) [0, 1) tartományban kell lebegnie
0,25
tile_predictions_nms_threshold Az NMS végrehajtásához használandó IOU-küszöbérték a csempékből és a rendszerképből származó előrejelzések egyesítése során. Érvényesítéshez/ következtetéshez használatos.
A(z) [0, 1] tartományban kell lebegnie
0,25

Következő lépések