중요합니다
이 문서에 표시된 항목(미리 보기)은 현재 퍼블릭 미리 보기에서 확인할 수 있습니다. 이 미리 보기는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다. 특정 기능이 지원되지 않거나 기능이 제한될 수 있습니다. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.
이 문서에서는 Azure AI Foundry 모델을 서버리스 API 배포로 배포하는 방법을 알아봅니다. 모델 카탈로그의 특정 모델은 서버리스 API 배포로 배포할 수 있습니다. 이 종류의 배포를 활용하면 조직에 필요한 엔터프라이즈 보안 및 규정 준수를 유지하면서 구독에서 모델을 호스트하지 않고 API로 모델을 사용할 수 있습니다. 이 배포 옵션에는 구독으로부터의 할당량이 필요하지 않습니다.
서버리스 API 배포는 Azure AI Foundry 모델을 배포하기 위한 한 가지 옵션이지만, Foundry 모델을 Azure AI Foundry 리소스에 배포하는 것이 좋습니다.
비고
동일한 인증 및 스키마를 사용하여 추론을 생성하는 단일 엔드포인트를 통해 리소스의 배포를 사용할 수 있도록 Azure AI Foundry 모델을 Azure AI Foundry 리소스 에 배포하는 것이 좋습니다. 엔드포인트는 모든 Foundry 모델에서 지원하는 Azure AI 모델 유추 API 를 따릅니다. Azure AI Foundry 리소스에 Foundry 모델을 배포하는 방법을 알아보려면 Azure AI Foundry 모델에 모델 추가 및 구성을 참조하세요.
필수 조건
유효한 결제 방법을 사용하는 Azure 구독입니다. 무료 또는 평가판 Azure 구독은 작동하지 않습니다. Azure 구독이 없는 경우, 시작하려면 유료 Azure 계정을 만드세요.
없는 경우 허브 기반 프로젝트를 만듭니다.
Azure AI Foundry 포털에서 Azure AI Foundry 리소스에 모델 배포(미리 보기) 기능이 꺼져 있는지 확인합니다. 이 기능이 켜지면 포털에서 서버리스 API 배포를 사용할 수 없습니다.
파트너 및 커뮤니티의 Foundry 모델에는 Azure Marketplace에 대한 액세스 권한이 필요하지만 Azure에서 직접 판매하는 Foundry 모델에는 이 요구 사항이 없습니다. Azure Marketplace에서 모델 제품을 구독하는 데 필요한 권한이 있는지 확인합니다.
Azure RBAC(Azure 역할 기반 액세스 제어)는 Azure AI Foundry 포털에서 작업에 대한 액세스 권한을 부여하는 데 사용됩니다. 이 문서의 단계를 수행하려면 사용자 계정에 리소스 그룹에 대한 Azure AI 개발자 역할이 할당되어야 합니다. 권한에 대한 자세한 내용은 Azure AI Foundry 포털의 역할 기반 액세스 제어를 참조 하세요.
- 호환되는 웹 브라우저를 사용하여 Azure AI Foundry를 탐색 할 수 있습니다.
모델 카탈로그에서 모델 찾기
- Azure AI Foundry에 로그인합니다.
- 아직 프로젝트에 참여하지 않았다면 프로젝트를 선택합니다.
- 왼쪽 창에서 모델 카탈로그 를 선택합니다.
배포하려는 모델의 모델 카드를 선택합니다. 이 문서에서는 DeepSeek-R1 모델을 선택합니다.
이 모델을 사용 선택하여 서버리스 API 배포 창을 열면 가격 책정 및 약관 탭을 볼 수 있습니다.
배포 마법사에서 배포 이름을 지정합니다. 콘텐츠 필터(미리 보기) 옵션은 기본적으로 사용하도록 설정되어 있습니다. 증오, 자해, 성적, 폭력적인 콘텐츠와 같은 유해한 콘텐츠를 감지하려면 서비스의 기본 설정을 그대로 둡니다. 콘텐츠 필터링에 대한 자세한 내용은 Azure AI Foundry 포털의 콘텐츠 필터링을 참조하세요.
서버리스 API에 모델 배포
이 섹션에서는 모델에 대한 엔드포인트를 만듭니다.
배포 마법사에서 배포를 선택합니다. 배포가 준비되고 배포 페이지로 리디렉션될 때까지 기다립니다.
프로젝트에 배포된 엔드포인트를 보려면 왼쪽 창의 내 자산 섹션에서 모델 + 엔드포인트를 선택합니다.
만들어진 엔드포인트는 권한 부여를 위해 키 인증을 사용합니다. 지정된 엔드포인트와 연결된 키를 얻으려면 다음 단계를 수행합니다.
배포를 선택하고 엔드포인트의 대상 URI 및 키를 확인합니다.
이러한 자격 증명을 사용하여 배포를 호출하고 예측을 생성합니다.
다른 프로젝트 또는 허브에서 이 배포를 사용해야 하거나 프롬프트 흐름을 사용하여 지능형 애플리케이션을 빌드하려는 경우 서버리스 API 배포에 대한 연결을 만들어야 합니다. 새 프로젝트 또는 허브에서 기존 서버리스 API 배포를 구성하는 방법을 알아보려면 다른 프로젝트 또는 프롬프트 흐름에서 배포된 서버리스 API 배포 사용을 참조하세요.
팁 (조언)
배포가 배포된 동일한 프로젝트 또는 허브에서 프롬프트 흐름을 사용하는 경우에도 연결을 만들어야 합니다.
서버리스 API 배포 사용
서버리스 API 배포에서 Azure Machine Learning 및 Azure AI Foundry에 배포된 모델은 기본 모델에 대한 일반적인 기능 집합을 노출하고 개발자가 균일하고 일관된 방식으로 다양한 모델 집합의 예측을 사용하는 데 사용할 수 있는 Azure AI 모델 유추 API 를 지원합니다.
이 API의 기능과 애플리케이션 빌드 시 API를 사용할 수 있는 방법에 대해 자세히 알아봅니다.
엔드포인트 및 구독 삭제
팁 (조언)
Azure AI Foundry 포털에서 왼쪽 창을 사용자 지정할 수 있으므로 이러한 단계에 표시된 것과 다른 항목이 표시될 수 있습니다. 원하는 항목이 표시되지 않으면 왼쪽 창 아래쪽에 있는 ... 더 보기를 선택하십시오.
모델 구독 및 엔드포인트를 삭제할 수 있습니다. 모델 구독을 삭제하면 연결된 엔드포인트가 비정상이 되고 사용할 수 없게 됩니다.
서버리스 API 배포를 삭제하려면 다음을 수행합니다.
- Azure AI 파운드리로 이동합니다.
- 프로젝트로 이동합니다.
- 내 자산 섹션에서 모델 + 엔드포인트를 선택합니다.
- 삭제할 배포를 엽니다.
- 을 선택하고을 삭제합니다.
연결된 모델 구독을 삭제하려면 다음을 수행합니다.
- Azure Portal로 이동
- 프로젝트가 속한 리소스 그룹으로 이동합니다.
- 형식 필터에서 SaaS를 선택합니다.
- 삭제하려는 구독을 선택합니다.
- 을 선택하고을 삭제합니다.
Azure AI Foundry를 사용하려면 Azure Machine Learning용 Azure CLI 및 ml 확장을 설치합니다.
az extension add -n ml
확장 기능이 이미 설치되어 있는 경우 최신 버전이 설치되어 있는지 확인합니다.
az extension update -n ml
확장이 설치되면 다음과 같이 구성합니다.
az account set --subscription <subscription> az configure --defaults workspace=<project-name> group=<resource-group> location=<location>
모델 카탈로그에서 모델 찾기
- Azure AI Foundry에 로그인합니다.
- 아직 프로젝트에 참여하지 않았다면 프로젝트를 선택합니다.
- 왼쪽 창에서 모델 카탈로그 를 선택합니다.
문서의 이 섹션에 있는 단계에서는 딥제크-R1 모델을 사용하여 그림을 표시합니다. Azure에서 직접 판매하는 Foundry 모델을 사용하든, 파트너 및 커뮤니티의 Foundry 모델을 사용하든, 단계는 동일합니다. 예를 들어 Cohere-command-r-08-2024 모델을 대신 배포하도록 선택하는 경우 코드 조각의 모델 자격 증명을 Cohere에 대한 자격 증명으로 바꿀 수 있습니다.
서버리스 API에 모델 배포
이 섹션에서는 모델에 대한 엔드포인트를 만듭니다. 엔드포인트의 이름을 DeepSeek-R1-qwerty로 지정합니다.
서버리스 엔드포인트를 만듭니다.
endpoint.yml
name: DeepSeek-R1-qwerty model_id: azureml://registries/azureml-deepseek/models/DeepSeek-R1
endpoint.yml 파일을 사용하여 엔드포인트를 만듭니다.
az ml serverless-endpoint create -f endpoint.yml
언제든지 프로젝트에 배포된 엔드포인트를 볼 수 있습니다.
az ml serverless-endpoint list
만들어진 엔드포인트는 권한 부여를 위해 키 인증을 사용합니다. 특정 엔드포인트와 연결된 키를 가져오려면 다음 단계를 따릅니다.
az ml serverless-endpoint get-credentials -n DeepSeek-R1-qwerty
다른 프로젝트 또는 허브에서 이 배포를 사용해야 하거나 프롬프트 흐름을 사용하여 지능형 애플리케이션을 빌드하려는 경우 서버리스 API 배포에 대한 연결을 만들어야 합니다. 새 프로젝트 또는 허브에서 기존 서버리스 API 배포를 구성하는 방법을 알아보려면 다른 프로젝트 또는 프롬프트 흐름에서 배포된 서버리스 API 배포 사용을 참조하세요.
팁 (조언)
배포가 배포된 동일한 프로젝트 또는 허브에서 프롬프트 흐름을 사용하는 경우에도 연결을 만들어야 합니다.
서버리스 API 배포 사용
서버리스 API 배포에서 Azure Machine Learning 및 Azure AI Foundry에 배포된 모델은 기본 모델에 대한 일반적인 기능 집합을 노출하고 개발자가 균일하고 일관된 방식으로 다양한 모델 집합의 예측을 사용하는 데 사용할 수 있는 Azure AI 모델 유추 API 를 지원합니다.
이 API의 기능과 애플리케이션 빌드 시 API를 사용할 수 있는 방법에 대해 자세히 알아봅니다.
엔드포인트 및 구독 삭제
모델 구독 및 엔드포인트를 삭제할 수 있습니다. 모델 구독을 삭제하면 연결된 엔드포인트가 비정상이 되고 사용할 수 없게 됩니다.
서버리스 API 배포를 삭제하려면 다음을 수행합니다.
az ml serverless-endpoint delete \
--name "DeepSeek-R1-qwerty"
연결된 모델 구독을 삭제하려면 다음을 수행합니다.
az ml marketplace-subscription delete \
--name "DeepSeek-R1"
Azure AI Foundry를 사용하려면 Python용 Azure Machine Learning SDK를 설치합니다.
pip install -U azure-ai-ml
설치되면 필요한 네임스페이스를 가져오고 프로젝트에 연결된 클라이언트를 만듭니다.
from azure.ai.ml import MLClient from azure.identity import InteractiveBrowserCredential from azure.ai.ml.entities import MarketplaceSubscription, ServerlessEndpoint client = MLClient( credential=InteractiveBrowserCredential(tenant_id="<tenant-id>"), subscription_id="<subscription-id>", resource_group_name="<resource-group>", workspace_name="<project-name>", )
모델 카탈로그에서 모델 찾기
- Azure AI Foundry에 로그인합니다.
- 아직 프로젝트에 참여하지 않았다면 프로젝트를 선택합니다.
- 왼쪽 창에서 모델 카탈로그 를 선택합니다.
문서의 이 섹션에 있는 단계에서는 딥제크-R1 모델을 사용하여 그림을 표시합니다. Azure에서 직접 판매하는 Foundry 모델을 사용하든, 파트너 및 커뮤니티의 Foundry 모델을 사용하든, 단계는 동일합니다. 예를 들어 Cohere-command-r-08-2024 모델을 대신 배포하도록 선택하는 경우 코드 조각의 모델 자격 증명을 Cohere에 대한 자격 증명으로 바꿀 수 있습니다.
서버리스 API에 모델 배포
이 섹션에서는 모델에 대한 엔드포인트를 만듭니다. 엔드포인트의 이름을 DeepSeek-R1-qwerty로 지정합니다.
서버리스 엔드포인트를 만듭니다.
endpoint_name="DeepSeek-R1-qwerty" serverless_endpoint = ServerlessEndpoint( name=endpoint_name, model_id=model_id ) created_endpoint = client.serverless_endpoints.begin_create_or_update( serverless_endpoint ).result()
언제든지 프로젝트에 배포된 엔드포인트를 볼 수 있습니다.
endpoint_name="DeepSeek-R1-qwerty" serverless_endpoint = ServerlessEndpoint( name=endpoint_name, model_id=model_id ) created_endpoint = client.serverless_endpoints.begin_create_or_update( serverless_endpoint ).result()
만들어진 엔드포인트는 권한 부여를 위해 키 인증을 사용합니다. 특정 엔드포인트와 연결된 키를 가져오려면 다음 단계를 따릅니다.
endpoint_keys = client.serverless_endpoints.get_keys(endpoint_name) print(endpoint_keys.primary_key) print(endpoint_keys.secondary_key)
다른 프로젝트 또는 허브에서 이 배포를 사용해야 하거나 프롬프트 흐름을 사용하여 지능형 애플리케이션을 빌드하려는 경우 서버리스 API 배포에 대한 연결을 만들어야 합니다. 새 프로젝트 또는 허브에서 기존 서버리스 API 배포를 구성하는 방법을 알아보려면 다른 프로젝트 또는 프롬프트 흐름에서 배포된 서버리스 API 배포 사용을 참조하세요.
팁 (조언)
배포가 배포된 동일한 프로젝트 또는 허브에서 프롬프트 흐름을 사용하는 경우에도 연결을 만들어야 합니다.
서버리스 API 배포 사용
서버리스 API 배포에서 Azure Machine Learning 및 Azure AI Foundry에 배포된 모델은 기본 모델에 대한 일반적인 기능 집합을 노출하고 개발자가 균일하고 일관된 방식으로 다양한 모델 집합의 예측을 사용하는 데 사용할 수 있는 Azure AI 모델 유추 API 를 지원합니다.
이 API의 기능과 애플리케이션 빌드 시 API를 사용할 수 있는 방법에 대해 자세히 알아봅니다.
엔드포인트 및 구독 삭제
모델 구독 및 엔드포인트를 삭제할 수 있습니다. 모델 구독을 삭제하면 연결된 엔드포인트가 비정상이 되고 사용할 수 없게 됩니다.
client.serverless_endpoints.begin_delete(endpoint_name).wait()
연결된 모델 구독을 삭제하려면 다음을 수행합니다.
client.marketplace_subscriptions.begin_delete(subscription_name).wait()
Azure AI Foundry로 작업하려면 Azure CLI에 설명된 대로 Azure CLI를 설치합니다.
설정에 따라 다음 환경 변수를 구성합니다.
RESOURCE_GROUP="serverless-models-dev" LOCATION="eastus2"
모델 카탈로그에서 모델 찾기
- Azure AI Foundry에 로그인합니다.
- 아직 프로젝트에 참여하지 않았다면 프로젝트를 선택합니다.
- 왼쪽 창에서 모델 카탈로그 를 선택합니다.
문서의 이 섹션에 있는 단계에서는 딥제크-R1 모델을 사용하여 그림을 표시합니다. Azure에서 직접 판매하는 Foundry 모델을 사용하든, 파트너 및 커뮤니티의 Foundry 모델을 사용하든, 단계는 동일합니다. 예를 들어 Cohere-command-r-08-2024 모델을 대신 배포하도록 선택하는 경우 코드 조각의 모델 자격 증명을 Cohere에 대한 자격 증명으로 바꿀 수 있습니다.
서버리스 API에 모델 배포
이 섹션에서는 모델에 대한 엔드포인트를 만듭니다. 엔드포인트 이름을 myserverless-text-1234ss로 지정합니다.
서버리스 엔드포인트를 만듭니다. 엔드포인트를 만들려면 다음 템플릿을 사용합니다.
serverless-endpoint.bicep
param projectName string = 'my-project' param endpointName string = 'myserverless-text-1234ss' param location string = resourceGroup().location param modelId string = 'azureml://registries/azureml-deepseek/models/DeepSeek-R1' var modelName = substring(modelId, (lastIndexOf(modelId, '/') + 1)) var subscriptionName = '${modelName}-subscription' resource projectName_endpoint 'Microsoft.MachineLearningServices/workspaces/serverlessEndpoints@2024-04-01-preview' = { name: '${projectName}/${endpointName}' location: location sku: { name: 'Consumption' } properties: { modelSettings: { modelId: modelId } } dependsOn: [ projectName_subscription ] } output endpointUri string = projectName_endpoint.properties.inferenceEndpoint.uri
다음과 같이 배포를 만듭니다.
az deployment group create --resource-group $RESOURCE_GROUP --template-file model-subscription.bicep
언제든지 프로젝트에 배포된 엔드포인트를 볼 수 있습니다.
리소스 관리 도구를 사용하여 리소스를 쿼리할 수 있습니다. 다음 코드는 Azure CLI를 사용합니다.
az resource list \ --query "[?type=='Microsoft.MachineLearningServices/workspaces/serverlessEndpoints']"
만들어진 엔드포인트는 권한 부여를 위해 키 인증을 사용합니다. REST API를 사용하여 이 정보를 쿼리하여 지정된 엔드포인트와 연결된 키를 가져옵니다.
다른 프로젝트 또는 허브에서 이 배포를 사용해야 하거나 프롬프트 흐름을 사용하여 지능형 애플리케이션을 빌드하려는 경우 서버리스 API 배포에 대한 연결을 만들어야 합니다. 새 프로젝트 또는 허브에서 기존 서버리스 API 배포를 구성하는 방법을 알아보려면 다른 프로젝트 또는 프롬프트 흐름에서 배포된 서버리스 API 배포 사용을 참조하세요.
팁 (조언)
배포가 배포된 동일한 프로젝트 또는 허브에서 프롬프트 흐름을 사용하는 경우에도 연결을 만들어야 합니다.
서버리스 API 배포 사용
서버리스 API 배포에서 Azure Machine Learning 및 Azure AI Foundry에 배포된 모델은 기본 모델에 대한 일반적인 기능 집합을 노출하고 개발자가 균일하고 일관된 방식으로 다양한 모델 집합의 예측을 사용하는 데 사용할 수 있는 Azure AI 모델 유추 API 를 지원합니다.
이 API의 기능과 애플리케이션 빌드 시 API를 사용할 수 있는 방법에 대해 자세히 알아봅니다.
엔드포인트 및 구독 삭제
모델 구독 및 엔드포인트를 삭제할 수 있습니다. 모델 구독을 삭제하면 연결된 엔드포인트가 비정상이 되고 사용할 수 없게 됩니다.
리소스 관리 도구를 사용하여 리소스를 관리할 수 있습니다. 다음 코드는 Azure CLI를 사용합니다.
az resource delete --name <resource-name>
서버리스 API 배포로 배포된 Foundry 모델에 대한 비용 및 할당량 고려 사항
할당량은 배포당 관리됩니다. 각 배포에는 분당 200,000개의 토큰과 분당 1,000개의 API 요청의 속도 제한이 있습니다. 또한 현재 프로젝트당 모델당 하나의 배포를 제한합니다. 현재 속도 제한이 시나리오에 충분하지 않은 경우 Microsoft Azure 지원에 문의하세요.
서버리스 API 배포 창의 가격 책정 및 약관 탭에서 Azure에서 직접 판매한 모델에 대한 가격 책정 정보를 찾을 수 있습니다.
파트너 및 커뮤니티의 모델은 Azure Marketplace를 통해 제공되며 Azure AI Foundry와 통합되어 사용할 수 있습니다. 이러한 모델을 배포하거나 미세 조정할 때 Azure Marketplace 가격 책정을 확인할 수 있습니다. 프로젝트가 Azure Marketplace에서 특정 제품을 구독할 때마다 사용량과 관련된 비용을 추적하는 새 리소스가 만들어집니다. 유추 및 미세 조정과 관련된 비용을 추적하는 데는 동일한 리소스가 사용되지만 여러 미터를 사용하여 각 시나리오를 독립적으로 추적할 수 있습니다. 비용을 추적하는 방법에 대한 자세한 내용은 Azure Marketplace를 통해 제공되는 모델에 대한 비용 모니터링을 참조하세요.
모델 제품을 구독하는 데 필요한 권한
Azure RBAC(Azure 역할 기반 액세스 제어)는 Azure AI Foundry 포털에서 작업에 대한 액세스 권한을 부여하는 데 사용됩니다. 이 문서의 단계를 수행하려면 사용자 계정에 Azure 구독에 대한 소유자, 기여자 또는 Azure AI 개발자 역할이 할당되어야 합니다. 또는 계정에 다음 권한이 있는 사용자 지정 역할을 할당할 수 있습니다.
Azure 구독에서- Azure Marketplace 제품에 작업 영역을 구독하려면 각 작업 영역에 대해 제품별로 한 번씩 다음을 수행합니다.
Microsoft.MarketplaceOrdering/agreements/offers/plans/read
Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
Microsoft.SaaS/register/action
리소스 그룹에서 SaaS 리소스를 만들고 사용하려면 다음을 수행합니다.
Microsoft.SaaS/resources/read
Microsoft.SaaS/resources/write
작업 영역에서 엔드포인트를 배포하려면 다음을 수행합니다(Azure Machine Learning 데이터 과학자 역할에는 이미 이러한 권한이 포함되어 있음).
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
권한에 대한 자세한 내용은 Azure AI Foundry 포털의 역할 기반 액세스 제어를 참조 하세요.