모델을 프로파일링하여 리소스 사용률 확인

2025-05-02

적용 대상:Azure CLI ml 확장 v1 Python SDK azureml v1

중요합니다

이 문서에서는 Azure Machine Learning SDK v1 사용에 대한 정보를 제공합니다. SDK v1은 2025년 3월 31일부터 더 이상 사용되지 않습니다. 지원은 2026년 6월 30일에 종료됩니다. 해당 날짜까지 SDK v1을 설치하고 사용할 수 있습니다.

2026년 6월 30일 이전에 SDK v2로 전환하는 것이 좋습니다. SDK v2에 대한 자세한 내용은 Azure Machine Learning CLI 및 Python SDK v2란? 및 SDK v2 참조를 참조하세요.

이 문서에서는 모델을 모델링하도록 기계 학습을 프로파일링하여 모델을 웹 서비스로 배포할 때 모델에 할당해야 하는 CPU 및 메모리의 양을 결정하는 방법을 보여 줍니다.

중요합니다

이 문서는 CLI v1 및 SDK v1에 적용됩니다. 이 프로파일링 기술은 CLI 또는 SDK의 v2에 사용할 수 없습니다.

중요합니다

이 문서의 일부 Azure CLI 명령에서는 azure-cli-ml 또는 v1(Azure Machine Learning용 확장)을 사용합니다. v1 확장에 대한 지원은 2025년 9월 30일에 종료됩니다. 해당 날짜까지 v1 확장을 설치하고 사용할 수 있습니다.

2025년 9월 30일 이전에 ml 또는 v2 확장으로 전환하는 것이 좋습니다. v2 확장에 대한 자세한 내용은 Azure Machine Learning CLI 확장 및 Python SDK v2를 참조 하세요.

필수 조건

이 문서에서는 Azure Machine Learning을 사용하여 모델을 학습하고 등록하는 것으로 가정합니다. Azure Machine Learning을 사용하여 사이킷런 모델을 학습하고 등록하는 방법에 대한 예제는 여기의 샘플 자습서를 참조하세요.

제한 사항

작업 영역에 대한 ACR(Azure Container Registry)이 가상 네트워크 뒤에 있으면 프로파일링이 작동하지 않습니다.

프로파일러 실행

모델을 등록하고 배포에 필요한 다른 구성 요소를 준비한 후에는 배포된 서비스에 필요한 CPU 및 메모리를 확인할 수 있습니다. 프로파일링은 모델을 실행하는 서비스를 테스트하고 CPU 사용량, 메모리 사용량, 응답 대기 시간 등의 정보를 반환합니다. 또한 리소스 사용량에 따라 CPU 및 메모리에 대한 권장 사항을 제공합니다.

모델을 프로파일하려면 다음이 필요합니다.

등록된 모델
항목 스크립트 및 유추 환경 정의에 따른 유추 구성
단일 열 표 형식 데이터 집합. 각 행에는 샘플 요청 데이터를 나타내는 문자열이 포함됩니다.

중요합니다

Azure Machine Learning은 요청 데이터가 문자열로 예상되는 서비스 프로파일링만 지원합니다(예: 문자열 직렬화된 json, 텍스트, 문자열 직렬화된 이미지 등). 데이터 세트(문자열)의 각 행의 콘텐츠는 HTTP 요청의 본문에 배치되고 점수 매기기 모델을 캡슐화하는 서비스로 전송됩니다.

중요합니다

ChinaEast2 및 USGovArizona 지역에서는 최대 2 개의 CPU의 프로파일링만 지원됩니다.

다음은 들어오는 요청 데이터가 직렬화된 json을 포함할 것으로 예상되는 서비스를 프로파일하는 입력 데이터 세트를 생성하는 방법의 예입니다. 이 경우 동일한 요청 데이터 콘텐츠의 데이터 집합 기반의 인스턴스 100개를 만들었습니다. 실제 시나리오에서는 다양한 입력을 포함하는 규모가 더 큰 데이터 집합을 사용하는 것이 좋습니다. 특히 모델 리소스 사용량/동작이 입력에 따라 달라지는 경우에 그러합니다.

적용 대상:Python용 Azure Machine Learning SDK v1

import json
from azureml.core import Datastore
from azureml.core.dataset import Dataset
from azureml.data import dataset_type_definitions

input_json = {'data': [[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
                       [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]]}
# create a string that can be utf-8 encoded and
# put in the body of the request
serialized_input_json = json.dumps(input_json)
dataset_content = []
for i in range(100):
    dataset_content.append(serialized_input_json)
dataset_content = '\n'.join(dataset_content)
file_name = 'sample_request_data.txt'
f = open(file_name, 'w')
f.write(dataset_content)
f.close()

# upload the txt file created above to the Datastore and create a dataset from it
data_store = Datastore.get_default(ws)
data_store.upload_files(['./' + file_name], target_path='sample_request_data')
datastore_path = [(data_store, 'sample_request_data' +'/' + file_name)]
sample_request_data = Dataset.Tabular.from_delimited_files(
    datastore_path, separator='\n',
    infer_column_types=True,
    header=dataset_type_definitions.PromoteHeadersBehavior.NO_HEADERS)
sample_request_data = sample_request_data.register(workspace=ws,
                                                   name='sample_request_data',
                                                   create_new_version=True)

샘플 요청 데이터를 포함하는 데이터 집합을 준비했으면 유추 구성을 만듭니다. 유추 구성은 score.py 및 환경 정의를 기반으로 합니다. 다음 예제에서는 유추 구성을 만들고 프로파일링을 실행하는 방법을 보여 줍니다.

from azureml.core.model import InferenceConfig, Model
from azureml.core.dataset import Dataset


model = Model(ws, id=model_id)
inference_config = InferenceConfig(entry_script='path-to-score.py',
                                   environment=myenv)
input_dataset = Dataset.get_by_name(workspace=ws, name='sample_request_data')
profile = Model.profile(ws,
            'unique_name',
            [model],
            inference_config,
            input_dataset=input_dataset)

profile.wait_for_completion(True)

# see the result
details = profile.get_details()

적용 대상:Azure CLI ml extension v1

다음 명령은 CLI를 사용하여 모델을 프로파일링하는 방법을 보여 줍니다.

az ml model profile -g <resource-group-name> -w <workspace-name> --inference-config-file <path-to-inf-config.json> -m <model-id> --idi <input-dataset-id> -n <unique-name>

팁

프로파일링에서 반환되는 정보를 유지하려면 모델의 태그나 속성을 사용합니다. 태그 또는 속성을 사용하면 모델 레지스트리에 모델을 포함하여 데이터가 저장됩니다. 다음 예에서는 requestedCpu 및 requestedMemoryInGb 정보가 포함된 새 태그를 추가하는 방법을 보여 줍니다.

model.add_tags({'requestedCpu': details['requestedCpu'],
                'requestedMemoryInGb': details['requestedMemoryInGb']})

az ml model profile -g <resource-group-name> -w <workspace-name> --i <model-id> --add-tag requestedCpu=1 --add-tag requestedMemoryInGb=0.5

다음을 통해 공유

모델을 프로파일링하여 리소스 사용률 확인

필수 조건

제한 사항

프로파일러 실행

다음 단계

피드백

추가 리소스