Share via


모델을 프로파일링하여 리소스 사용률 확인

적용 대상:Azure CLI ml 확장 v1Python SDK azureml v1

이 문서에서는 모델을 기계 학습으로 프로파일링하여 모델을 웹 서비스로 배포할 때 모델에 할당해야 하는 CPU 및 메모리 양을 결정하는 방법을 보여 줍니다.

Important

이 문서는 CLI v1 및 SDK v1에 적용됩니다. 이 프로파일링 기술은 CLI 또는 SDK의 v2에서 사용할 수 없습니다.

Important

이 문서의 일부 Azure CLI 명령에서는 azure-cli-ml 또는 v1(Azure Machine Learning용 확장)을 사용합니다. v1 확장에 대한 지원은 2025년 9월 30일에 종료됩니다. v1 확장은 이 날짜까지 설치하고 사용할 수 있습니다.

2025년 9월 30일 이전에 ml 또는 v2 확장으로 전환하는 것이 좋습니다. v2 확장에 대한 자세한 내용은 Azure ML CLI 확장 및 Python SDK v2를 참조하세요.

필수 조건

이 문서에서는 Azure Machine Learning을 사용하여 모델을 학습하고 등록했다고 가정합니다. Azure Machine Learning을 사용하여 사이킷런 모델을 학습하고 등록하는 방법에 대한 예제는 여기의 샘플 자습서를 참조하세요.

제한 사항

  • 작업 영역의 ACR(Azure Container Registry)이 가상 네트워크 뒤에 있으면 프로파일링이 작동하지 않습니다.

프로파일러 실행

모델을 등록하고 모델 배포에 필요한 다른 구성 요소를 준비한 후에는 배포된 서비스에 필요한 CPU 및 메모리를 결정할 수 있습니다. 프로파일링은 모델을 실행하는 서비스를 테스트하고 CPU 사용량, 메모리 사용량, 응답 대기 시간 등의 정보를 반환합니다. 또한 리소스 사용량에 따라 CPU 및 메모리에 대한 권장 사항을 제공합니다.

모델을 프로파일링하려면 다음이 필요합니다.

  • 등록된 모델
  • 항목 스크립트 및 유추 환경 정의에 따른 유추 구성
  • 단일 열 표 형식 데이터 집합. 각 행에는 샘플 요청 데이터를 나타내는 문자열이 포함됩니다.

Important

현재는 요청 데이터를 문자열로 예상하는 서비스의 프로파일링만 지원됩니다(예: 문자열 직렬화된 json, 문자, 문자열 직렬화된 이미지 등). 데이터 집합(문자열)의 각 행의 내용이 HTTP 요청의 본문에 배치되고 채점을 위해 모델을 캡슐화하는 서비스로 전송됩니다.

Important

ChinaEast2 및 USGovArizona 지역에서는 최대 2 개의 CPU의 프로파일링만 지원됩니다.

다음은 수신하는 요청 데이터에 직렬화된 json이 포함될 것으로 예상하는 서비스를 프로파일링하기 위해 입력 데이터 집합을 생성하는 방법의 예입니다. 이 경우 동일한 요청 데이터 콘텐츠의 데이터 집합 기반의 인스턴스 100개를 만들었습니다. 실제 시나리오에서는 다양한 입력을 포함하는 규모가 더 큰 데이터 집합을 사용하는 것이 좋습니다. 특히 모델 리소스 사용량/동작이 입력에 따라 달라지는 경우에 그러합니다.

적용 대상:Python SDK azureml v1

import json
from azureml.core import Datastore
from azureml.core.dataset import Dataset
from azureml.data import dataset_type_definitions

input_json = {'data': [[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
                       [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]]}
# create a string that can be utf-8 encoded and
# put in the body of the request
serialized_input_json = json.dumps(input_json)
dataset_content = []
for i in range(100):
    dataset_content.append(serialized_input_json)
dataset_content = '\n'.join(dataset_content)
file_name = 'sample_request_data.txt'
f = open(file_name, 'w')
f.write(dataset_content)
f.close()

# upload the txt file created above to the Datastore and create a dataset from it
data_store = Datastore.get_default(ws)
data_store.upload_files(['./' + file_name], target_path='sample_request_data')
datastore_path = [(data_store, 'sample_request_data' +'/' + file_name)]
sample_request_data = Dataset.Tabular.from_delimited_files(
    datastore_path, separator='\n',
    infer_column_types=True,
    header=dataset_type_definitions.PromoteHeadersBehavior.NO_HEADERS)
sample_request_data = sample_request_data.register(workspace=ws,
                                                   name='sample_request_data',
                                                   create_new_version=True)

샘플 요청 데이터를 포함하는 데이터 집합을 준비했으면 유추 구성을 만듭니다. 유추 구성은 score.py 및 환경 정의를 기반으로 합니다. 다음 예제에서는 유추 구성을 만들고 프로파일링을 실행하는 방법을 보여 줍니다.

from azureml.core.model import InferenceConfig, Model
from azureml.core.dataset import Dataset


model = Model(ws, id=model_id)
inference_config = InferenceConfig(entry_script='path-to-score.py',
                                   environment=myenv)
input_dataset = Dataset.get_by_name(workspace=ws, name='sample_request_data')
profile = Model.profile(ws,
            'unique_name',
            [model],
            inference_config,
            input_dataset=input_dataset)

profile.wait_for_completion(True)

# see the result
details = profile.get_details()

적용 대상:Azure CLI ml 확장 v1

다음 명령은 CLI를 사용하여 모델을 프로파일링하는 방법을 보여 줍니다.

az ml model profile -g <resource-group-name> -w <workspace-name> --inference-config-file <path-to-inf-config.json> -m <model-id> --idi <input-dataset-id> -n <unique-name>

프로파일링에서 반환되는 정보를 유지하려면 모델의 태그나 속성을 사용합니다. 태그 또는 속성을 사용하면 모델 레지스트리에 모델을 포함하여 데이터가 저장됩니다. 다음 예에서는 requestedCpurequestedMemoryInGb 정보가 포함된 새 태그를 추가하는 방법을 보여 줍니다.

model.add_tags({'requestedCpu': details['requestedCpu'],
                'requestedMemoryInGb': details['requestedMemoryInGb']})
az ml model profile -g <resource-group-name> -w <workspace-name> --i <model-id> --add-tag requestedCpu=1 --add-tag requestedMemoryInGb=0.5

다음 단계