Computer Vision 모델을 학습시키도록 AutoML 설정

아티클
02/29/2024

적용 대상:Azure CLI ml 확장 v2(현재)Python SDK azure-ai-ml v2(현재)

이 문서에서는 자동화된 ML을 사용하여 이미지 데이터에 대한 Computer Vision 모델을 학습하는 방법을 알아봅니다. Azure Machine Learning CLI 확장 v2 또는 Azure Machine Learning Python SDK v2를 사용하여 모델을 학습할 수 있습니다.

자동화된 ML은 이미지 분류, 개체 감지 및 인스턴스 분할과 같은 Computer Vision 작업에 대한 모델 학습을 지원합니다. Computer Vision 작업을 위한 AutoML 모델 작성은 현재 Azure Machine Learning Python SDK를 통해 지원됩니다. 결과 실험 체험, 모델 및 출력은 Azure Machine Learning 스튜디오 UI에서 액세스할 수 있습니다. 이미지 데이터에 대한 Computer Vision 작업을 위한 자동화된 ML에 대해 자세히 알아보기.

작업 유형	AutoML 작업 구문
이미지 분류	CLI v2: `image_classification` SDK v2: `image_classification()`
이미지 분류 다중 레이블	CLI v2: `image_classification_multilabel` SDK v2: `image_classification_multilabel()`
이미지 개체 감지	CLI v2: `image_object_detection` SDK v2: `image_object_detection()`
이미지 인스턴스 분할	CLI v2: `image_instance_segmentation` SDK v2: `image_instance_segmentation()`

필드	설명
`image_url`	StreamInfo 개체로 파일 경로를 포함합니다.
`image_details`	이미지 메타데이터 정보는 높이, 너비, 형식으로 구성됩니다. 이 필드는 선택 사항이므로 존재할 수도 있고 없을 수도 있습니다.
`label`	작업 종류를 기반으로 하는 이미지 레이블의 json 표현입니다.

매개 변수	세부 정보
`max_trials`	스윕할 최대 체험 수에 대한 매개 변수입니다. 1~1000 사이의 정수여야 합니다. 주어진 모델 아키텍처에 대한 기본 하이퍼 매개 변수만 탐색할 때 이 매개 변수를 1로 설정합니다. 기본값은 1입니다.
`max_concurrent_trials`	동시에 실행할 수 있는 최대 체험 수입니다. 지정한 경우 1~100 사이의 정수여야 합니다. 기본값은 1입니다. 참고: 동시 체험 수는 지정된 컴퓨팅 대상에서 사용할 수 있는 리소스에서 제어됩니다. 원하는 동시성에 사용할 수 있는 리소스가 컴퓨팅 대상에 있는지 확인합니다. `max_concurrent_trials`는 `max_trials`에서 내부적으로 제한됩니다. 예를 들어 사용자가 `max_concurrent_trials=4`, `max_trials=2`를 설정하는 경우 값은 내부적으로 `max_concurrent_trials=2`, `max_trials=2`로 업데이트됩니다.
`timeout_minutes`	실험이 종료되기까지 남은 시간(분)입니다. 지정되지 않은 경우 기본 실험 timeout_minutes는 7일(최대 60일)입니다.

작업	모델 아키텍처	문자열 리터럴 구문 `default_model`은 로 표시됨
이미지 분류 (다중 클래스 및 다중 레이블)	MobileNet: 모바일 애플리케이션용 경량 모델 ResNet: Residual Network ResNeSt: Split Attention Network SE-ResNeXt50: Squeeze-and-Excitation Network ViT: 비전 변환기 네트워크	`mobilenetv2` `resnet18` `resnet34` `resnet50` `resnet101` `resnet152` `resnest50` `resnest101` `seresnext` `vits16r224`(소형) `vitb16r224`*(기본) `vitl16r224`(대형)
개체 감지	YOLOv5: 1단계 개체 감지 모델 더 빠른 RCNN ResNet FPN: 2단계 개체 감지 모델 RetinaNet ResNet FPN: 초점 손실로 클래스 불균형 해결 참고: YOLOv5 모델 크기는 `model_size`하이퍼 매개 변수를 참조하세요.	`yolov5`* `fasterrcnn_resnet18_fpn` `fasterrcnn_resnet34_fpn` `fasterrcnn_resnet50_fpn` `fasterrcnn_resnet101_fpn` `fasterrcnn_resnet152_fpn` `retinanet_resnet50_fpn`
인스턴스 구분	MaskRCNN ResNet FPN	`maskrcnn_resnet18_fpn` `maskrcnn_resnet34_fpn` `maskrcnn_resnet50_fpn`* `maskrcnn_resnet101_fpn` `maskrcnn_resnet152_fpn`

작업	모델 아키텍처	문자열 리터럴 구문
이미지 분류 (다중 클래스 및 다중 레이블)	BEiT ViT DeiT SwinV2	`microsoft/beit-base-patch16-224-pt22k-ft22k` `google/vit-base-patch16-224` `facebook/deit-base-patch16-224` `microsoft/swinv2-base-patch4-window12-192-22k`
개체 감지	Sparse R-CNN 변형 가능한 DETR VFNet YOLOF Swin	`mmd-3x-sparse-rcnn_r50_fpn_300-proposals_crop-ms-480-800-3x_coco` `mmd-3x-sparse-rcnn_r101_fpn_300-proposals_crop-ms-480-800-3x_coco` `mmd-3x-deformable-detr_refine_twostage_r50_16xb2-50e_coco` `mmd-3x-vfnet_r50-mdconv-c3-c5_fpn_ms-2x_coco` `mmd-3x-vfnet_x101-64x4d-mdconv-c3-c5_fpn_ms-2x_coco` `mmd-3x-yolof_r50_c5_8x8_1x_coco`
인스턴스 세그먼트화	Swin	`mmd-3x-mask-rcnn_swin-t-p4-w7_fpn_1x_coco`

샘플링 유형	AutoML 작업 구문
무작위 샘플링	`random`
그리드 샘플링	`grid`
Bayesian 샘플링	`bayesian`

조기 종료 정책	AutoML 작업 구문
산적 정책	CLI v2: `bandit` SDK v2: `BanditPolicy()`
중앙값 중지 정책	CLI v2: `median_stopping` SDK v2: `MedianStoppingPolicy()`
잘림 선택 영역 정책	CLI v2: `truncation_selection` SDK v2: `TruncationSelectionPolicy()`

작업	영향을 받는 데이터 세트	데이터 증강 기법 적용
이미지 분류(다중 클래스 및 다중 레이블)	교육 유효성 검사 및 테스트	임의 크기 조정 및 자르기, 수평 뒤집기, 색상 지터(밝기, 대비, 채도 및 색조), 채널별 ImageNet 평균 및 표준 편차를 사용한 정규화 크기 조정, 중앙 자르기, 정규화
개체 감지, 인스턴스 분할	교육 유효성 검사 및 테스트	경계 상자 주변의 임의 자르기, 확장, 수평 뒤집기, 정규화, 크기 조정 정규화, 크기 조정
yolov5를 사용한 개체 감지	교육 유효성 검사 및 테스트	모자이크, 임의 아핀(회전, 이동, 스케일링, 전단), 수평 뒤집기 레터박스 크기 조정

작업	매개 변수 이름	기본값
이미지 분류(다중 클래스 및 다중 레이블)	`valid_resize_size` `valid_crop_size`	256 224
개체 감지	`min_size` `max_size` `box_score_thresh` `nms_iou_thresh` `box_detections_per_img`	600 1333 0.3 0.5 100
`yolov5`를 사용한 개체 감지	`img_size` `model_size` `box_score_thresh` `nms_iou_thresh`	640 보통 0.1 0.5
인스턴스 구분	`min_size` `max_size` `box_score_thresh` `nms_iou_thresh` `box_detections_per_img` `mask_pixel_score_threshold` `max_number_of_polygon_points` `export_as_image` `image_type`	600 1333 0.3 0.5 100 0.5 100 False JPG

XAI 알고리즘	알고리즘별 매개 변수	기본값
`xrai`	1. `n_steps`: 근사치 메서드에서 사용하는 단계 수입니다. 단계 수가 많을수록 특성의 근사값이 향상됩니다(설명). n_steps 범위는 [2, inf)이지만 특성의 성능은 50단계 후에 수렴하기 시작합니다. `Optional, Int` 2. `xrai_fast`: 더 빠른 버전의 XRAI를 사용할지 여부입니다. `True`이면 설명에 대한 계산 시간이 더 빠르지만 덜 정확한 설명(특성)으로 이어집니다. `Optional, Bool`	`n_steps = 50` `xrai_fast = True`
`integrated_gradients`	1. `n_steps`: 근사치 메서드에서 사용하는 단계 수입니다. 단계 수가 많을수록 특성이 향상됩니다(설명). n_steps 범위는 [2, inf)이지만 특성의 성능은 50단계 후에 수렴하기 시작합니다. `Optional, Int` 2. `approximation_method`: 정수에 근접하는 메서드입니다. 사용 가능한 근사치 메서드는 `riemann_middle` 및 `gausslegendre`입니다. `Optional, String`	`n_steps = 50` `approximation_method = riemann_middle`

Computer Vision 모델을 학습시키도록 AutoML 설정

필수 조건

작업 종류 선택

학습 및 유효성 검사 데이터

JSONL 스키마 샘플

데이터 사용

실험 실행 컴퓨팅

실험 구성

기본 메트릭

작업 한도

자동 스윕 모델 하이퍼 매개 변수(AutoMode)

AutoMode 트리거

개별 체험

지원되는 모델 아키텍처

지원되는 모델 아키텍처 - HuggingFace 및 MMDetection(미리 보기)

수동으로 모델 하이퍼 매개 변수 스위핑

매개 변수 검색 공간 정의

스윕을 위한 샘플링 방법

조기 종료 정책

고정 설정

데이터 증강

증분 학습(선택 사항)

작업 ID를 통해 검사점 전달

AutoML 작업 제출

출력 및 평가 메트릭

모델 등록 및 배포

최상의 평가판 가져오기

모델 등록

온라인 엔드포인트 구성

엔드포인트 만들기

온라인 배포 구성

배포 만들기

트래픽 업데이트:

유추 설정 업데이트

배포 테스트

예측에 대한 설명 생성

설명

시각화 해석

특성 해석

큰 데이터 세트

다중 GPU 및 다중 노드 학습

스토리지에서 이미지 파일 스트리밍

예제 Notebook

코드 예제

다음 단계

추가 리소스