設定 AutoML，以定型電腦視覺模型

發行項
03/20/2024

適用於：Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)

在本文中，您會了解如何使用自動化 ML，在映像資料上定型電腦視覺模型。您可以使用 Azure Machine Learning CLI 延伸模組 v2 或 Azure Machine Learning Python SDK v2 來定型模型。

自動化 ML 支援對電腦視覺工作 (例如影像分類、物件偵測和執行個體分割) 進行模型定型。目前透過 Azure Machine Learning Python SDK 支援編寫電腦視覺工作的 AutoML 模型。可以從 Azure Machine Learning 工作室 UI 存取產生的實驗試用、模型和輸出。深入了解影像資料上電腦視覺工作的自動化 ML。

工作類型	AutoML 作業語法
影像分類	CLI 第 2 版：`image_classification` SDK 第 2 版：`image_classification()`
影像分類多標籤	CLI 第 2 版：`image_classification_multilabel` SDK 第 2 版：`image_classification_multilabel()`
影像物件偵測	CLI 第 2 版：`image_object_detection` SDK 第 2 版：`image_object_detection()`
影像執行個體分割	CLI 第 2 版：`image_instance_segmentation` SDK 第 2 版：`image_instance_segmentation()`

欄位	描述
`image_url`	包含檔案路徑作為 StreamInfo 物件
`image_details`	影像中繼資料資訊由高度、寬度和格式組成。這是選擇性欄位，因此不一定存在。
`label`	影像標籤的 JSONL 表示法 (以工作類型為基礎)。

參數	詳細資料
`max_trials`	要掃掠的試用數目上限的參數。必須為介於 1 到 1000 之間的整數。只探索給定模型結構的預設超參數時，請將此參數設定為 1。預設值是 1。
`max_concurrent_trials`	可同時執行的試用數目上限。如果已指定，必須是介於 1 到 100 之間的整數。預設值是 1。注意：同時試用的數目受限於指定的計算目標中可用的資源。請確保計算目標有資源可用於所需的並行作業。在內部，`max_concurrent_trials` 會限制在 `max_trials`。例如，如果使用者設定 `max_concurrent_trials=4`、`max_trials=2`，則值會在內部更新為 `max_concurrent_trials=2`、`max_trials=2`。
`timeout_minutes`	實驗終止前的時間量 (以分鐘為單位)。如果未指定，則預設實驗逾時分鐘數為七天 (最長 60 天)。

Task	模型結構	字串常值語法以 * 表示的 `default_model`*
影像分類 (多類別和多標籤)	MobileNet：行動應用程式的輕加權模型 ResNet：殘差網路 ResNeSt：分散注意力網路 SE-ResNeXt50：Squeeze-and-Excitation 網路 ViT：視覺轉換器網路	`mobilenetv2` `resnet18` `resnet34` `resnet50` `resnet101` `resnet152` `resnest50` `resnest101` `seresnext` `vits16r224` (小型) `vitb16r224`* (基礎) `vitl16r224` (大型)
物件偵測	YOLOv5：一個階段物件偵測模型更快的 RCNN ResNet FPN：兩個階段物件偵測模型 RetinaNet ResNet FPN：失去焦點的位址類別不平衡注意：如需 YOLOv5 模型大小，請參閱`model_size`超參數。	`yolov5`* `fasterrcnn_resnet18_fpn` `fasterrcnn_resnet34_fpn` `fasterrcnn_resnet50_fpn` `fasterrcnn_resnet101_fpn` `fasterrcnn_resnet152_fpn` `retinanet_resnet50_fpn`
執行個體分割	MaskRCNN ResNet FPN	`maskrcnn_resnet18_fpn` `maskrcnn_resnet34_fpn` `maskrcnn_resnet50_fpn`* `maskrcnn_resnet101_fpn` `maskrcnn_resnet152_fpn`

Task	模型結構	字串常值語法
影像分類 (多類別和多標籤)	BEiT ViT DeiT SwinV2	`microsoft/beit-base-patch16-224-pt22k-ft22k` `google/vit-base-patch16-224` `facebook/deit-base-patch16-224` `microsoft/swinv2-base-patch4-window12-192-22k`
物件偵測	疏鬆 R-CNN 可變形 DETR VFNet YOLOF Swin	`mmd-3x-sparse-rcnn_r50_fpn_300-proposals_crop-ms-480-800-3x_coco` `mmd-3x-sparse-rcnn_r101_fpn_300-proposals_crop-ms-480-800-3x_coco` `mmd-3x-deformable-detr_refine_twostage_r50_16xb2-50e_coco` `mmd-3x-vfnet_r50-mdconv-c3-c5_fpn_ms-2x_coco` `mmd-3x-vfnet_x101-64x4d-mdconv-c3-c5_fpn_ms-2x_coco` `mmd-3x-yolof_r50_c5_8x8_1x_coco`
執行個體分割	Swin	`mmd-3x-mask-rcnn_swin-t-p4-w7_fpn_1x_coco`

取樣類型	AutoML 作業語法
隨機取樣	`random`
格線取樣	`grid`
貝氏取樣	`bayesian`

提前終止原則	AutoML 作業語法
Bandit 原則	CLI 第 2 版：`bandit` SDK 第 2 版：`BanditPolicy()`
中位數停止原則	CLI 第 2 版：`median_stopping` SDK 第 2 版：`MedianStoppingPolicy()`
截斷選取原則	CLI 第 2 版：`truncation_selection` SDK 第 2 版：`TruncationSelectionPolicy()`

Task	受影響的資料集	已套用資料增強技巧
影像分類 (多類別和多標籤)	訓練驗證和測試	隨機大小調整和裁切、水平翻轉、色彩抖動 (亮度、對比、飽和度和色調)、使用全通道 ImageNet 平均值和標準差的正規化調整大小、置中裁切、正規化
物件偵測、執行個體分割	訓練驗證和測試	隨機裁切周框方塊、展開、水平翻轉、正規化、調整大小正規化、調整大小
使用 yolov5 的物件偵測	訓練驗證和測試	馬賽克、隨機仿射 (旋轉、平移、縮放、剪切)、水平翻轉上下黑邊調整大小

Task	參數名稱	預設
影像分類 (多類別和多標籤)	`valid_resize_size` `valid_crop_size`	256 224
物件偵測	`min_size` `max_size` `box_score_thresh` `nms_iou_thresh` `box_detections_per_img`	600 1333 0.3 0.5 100
使用 `yolov5` 的物件偵測	`img_size` `model_size` `box_score_thresh` `nms_iou_thresh`	640 medium 0.1 0.5
執行個體分割	`min_size` `max_size` `box_score_thresh` `nms_iou_thresh` `box_detections_per_img` `mask_pixel_score_threshold` `max_number_of_polygon_points` `export_as_image` `image_type`	600 1333 0.3 0.5 100 0.5 100 False JPG

XAI 演算法	演算法特有參數	預設值
`xrai`	1. `n_steps`：逼近方法所使用的步驟數。較大的步驟數會導致屬性 (說明) 的逼近。 n_steps 的範圍是 [2, inf)，但屬性的效能在 50 個步驟之後開始收斂。 `Optional, Int` 2. `xrai_fast`：是否要使用更快的 XRAI 版本。若為 `True`，說明的計算時間較快，但導致較不精確的說明 (屬性) `Optional, Bool`	`n_steps = 50` `xrai_fast = True`
`integrated_gradients`	1. `n_steps`：逼近方法所使用的步驟數。較大的步驟數會導致屬性 (說明)。 n_steps 的範圍是 [2, inf)，但屬性的效能在 50 個步驟之後開始收斂。 `Optional, Int` 2. `approximation_method`：逼近整數的方法。可用的逼近方法為 `riemann_middle` 與 `gausslegendre`。 `Optional, String`	`n_steps = 50` `approximation_method = riemann_middle`

共用方式為

設定 AutoML，以定型電腦視覺模型

必要條件

選取您的工作類型

定型及驗證資料

JSONL 結構描述範例

取用資料

計算要執行的實驗

設定實驗

主要計量

作業限制

自動掃掠模型超參數 (AutoMode)

正在觸發 AutoMode

個別試用

支援的模型結構

支援的模型結構 - HuggingFace 和 MMDetection (預覽)

手動掃掠模型超參數

定義參數搜尋空間

用於掃掠的取樣方法

提前終止原則

已修正設定

資料增強

累加式定型 (選用)

透過作業識別碼傳遞檢查點

提交 AutoML 作業

輸出和評估計量

註冊和部署模型

獲得最佳試用

註冊模型

設定線上端點

建立端點

設定線上部署

建立部署

更新流量：

更新推斷設定

測試部署

產生預測的說明

解釋

解譯視覺效果

解譯屬性

大型資料集

多 GPU 和多節點定型

從儲存體串流處理影像檔

Notebook 範例

程式碼範例

下一步

意見反應

意見反應

其他資源