인스턴트 모델을 사용하면 지원되는 모든 모델을 이름으로 호출할 수 있으며 배포가 필요하지 않습니다. Foundry 프로젝트를 만들고 코딩을 시작하고 사용 가능한 모든 모델을 즉시 사용합니다.
사전 요구 사항
- Azure 구독입니다. 체험 계정 만들기
-
Microsoft Foundry에 로그인합니다.
New Foundry 토글이 설정되었는지 확인합니다. 이러한 단계는 Foundry(신규)를 참조합니다.
- 미국 서부 3의 Foundry 프로젝트(미리 보기 중에 인스턴트 모델에 대해 유일하게 지원되는 지역). 프로젝트를 만들어야 하는 경우 프로젝트 만들기를 참조하세요.
- 프로젝트 또는 계정의 Foundry 사용자 역할입니다.
Important
Foundry RBAC 역할의 이름이 최근에 바뀌었습니다. Foundry User, Foundry OwnerFoundry 계정 소유자 및 Foundry Project Manager는 이전에 Azure AI 사용자, Azure AI 소유자, Azure AI 계정 소유자 및 Azure AI Project Manager로 이름이 지정되었습니다. 이름 바꾸기가 롤아웃되는 동안 일부 위치에서는 이전 이름이 계속 표시될 수 있습니다. 역할 ID 및 핵심 권한은 이름 바꾸기에 의해 변경되지 않습니다.
즉시 모델 사용 시작
인스턴트 모델을 사용하면 워크플로가 간단합니다. 코드에서 지원되는 인스턴트 모델 이름을 사용합니다. 배포가 필요하지 않습니다. 배포에 이미 사용하는 동일한 API, SDK 및 클라이언트는 인스턴트 모델에서 작동합니다. 두 번째 SDK, 별도의 클라이언트 없음, 구성 변경 없음
배포 기반 코드에서 유일한 변경 내용은 매개 변수입니다 model . 아래 코드에서 "gpt-5-mini"를 임의의 인스턴트 모델 이름으로 바꾸세요.
from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient
# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"
# Create project and openai clients to call Foundry API
project = AIProjectClient(
endpoint=PROJECT_ENDPOINT,
credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()
# Run a responses API call
response = openai.responses.create(
model="gpt-5-mini",
input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")
인스턴트 모델이 중요한 이유
-
하나의 문자열을 변경하여 모델을 전환 합니다. 배포를 만들거나 삭제하지 않고 줄에
model=있는 모든 인스턴트 모델 이름을 사용합니다. - 동일한 API 및 SDK - 인스턴트 모델과 배포 모두에서 동일한 호출이 작동합니다.
- 개발 도구와 함께 작동 합니다. 즉, 인스턴트 모델은 배포와 동일한 방식으로 Foundry CLI, VS Code 및 CI/CD 파이프라인과 통합됩니다.
배포는 없어지지 않을 것입니다. 예약된 처리량, 사용자 지정 콘텐츠 필터, 데이터 상주 또는 고급 엔터프라이즈 구성이 필요한 경우 올바른 선택으로 유지됩니다. 인스턴트 모델은 도입 과정을 단순화해, 배포가 모델을 사용하기 전에 반드시 넘어야 하는 관문이 아니라 역량이 쌓이면 도전하는 다음 단계가 되도록 합니다.
지원되는 모델
새 모델은 릴리스될 때 기본적으로 즉시 액세스를 지원합니다. 추가 모델에 대한 지원은 고객 요구에 따라 고려됩니다.
즉시 액세스를 지원하는 모든 모델을 보려면 다음을 수행합니다.
- 새 Foundry 환경에서 미국 서부 3 에서 프로젝트를 엽니다.
- 오른쪽 위 탐색에서 검색 을 선택한 다음 왼쪽 창의 모델을 선택합니다.
- 모델 카탈로그에서 개발 옵션에서 인스턴트를 선택하여 사용 가능한 인스턴트 모델을 봅니다.
프로그래밍 방식으로 인스턴트 모델을 나열할 수도 있습니다.
SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"
az rest --method get \
--url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
--output json \
| jq -r '(.value // .models // .)[]
| select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
| .model.name' \
| sort -u
메모
미리 보기 동안 인스턴트 모델은 미국 서부 3 의 프로젝트에서만 사용할 수 있습니다.
구독에 할당량이 없는 경우에도 일부 인스턴트 모델이 목록에 나타날 수 있습니다. 자세한 내용은 Foundry 모델의 할당량 및 제한을 참조하세요.
인스턴트 모델과 배포를 사용하는 경우
| Scenario | 권장되는 접근 방식 |
|---|---|
| 시작, 프로토타입 생성 또는 실험 | 인스턴트 모델 |
| 릴리스 직후 최신 모델 사용 | 인스턴트 모델 |
| 예약된 용량 또는 예측 가능한 처리량 필요 | Deployment |
| 프로비전된 처리량 필요(PTU) | Deployment |
| 특정 지역에서 데이터 보존 필요 | Deployment |
| 모델당 사용자 지정 콘텐츠 필터링 정책 | Deployment |
| 모델당 사용자 지정 가드레일 | Deployment |
| 엔드포인트별 구성(예: 엔드포인트당 버전 잠금) | Deployment |
| 팀 간 세분화된 할당량 분할 | Deployment |
| 미세 조정된 모델 | Deployment |
인스턴트 모델 및 배포는 동일한 프로젝트에서 공존할 수 있습니다. 요구 사항이 진화함에 따라 인스턴트 모델로 시작하고 나중에 배포를 만들 수 있습니다.
모델 버전
기본적으로 인스턴트 모델은 모델의 최신 상록 버전으로 라우팅됩니다. 특정 버전에 고정하려면 모델 이름에 하이픈을 넣은 접미사로 버전 날짜를 추가합니다.
model로 전달하는 항목 |
Behavior |
|---|---|
model-name |
최신 버전으로 경로 지정 |
model-name-2025-04-01 |
해당 특정 버전으로 경로 지정 |
버전 고정은 옵트인입니다. 애플리케이션에 안정성이 필요한 경우 버전 접미사를 포함합니다. 그렇지 않으면 항상 최신 버전을 자동으로 가져옵니다.
할당량 사용 방법
인스턴트 모델은 구독에 할당된 모델별 전역 할당량 풀에서 가져옵니다. 이 할당량은 표준 배포에서 사용하는 지역 할당량과 별개입니다.
- 전역 할당량을 할당하거나 분할하지 않습니다. 구독의 모든 인스턴트 모델 사용에서 자동으로 공유됩니다.
- 글로벌 표준 배포는 전역 할당량의 일부를 예약합니다. 인스턴트 모델은 남은 용량을 사용합니다.
- 다른 배포 유형(지역 표준, 프로비전됨)은 별도의 지역 할당량을 사용하며 인스턴트 모델 용량에 영향을 주지 않습니다.
- 인스턴트 모델 요청이 제한되는 경우 할당량 증가를 요청하거나 예약된 용량으로 배포를 만들 수 있습니다.
전역 및 지역 할당량이 상호 작용하는 방법에 대한 자세한 내용은 할당량 관리 및 증가를 참조하세요.
엔터프라이즈 컨트롤
| Capability | 작동 방식 |
|---|---|
| 특정 모델 또는 공급자 차단 | Azure Policy 정의는 배포에 적용되는 것과 동일한 방식으로 인스턴트 모델에 적용됩니다. |
| 모델 버전에 고정하기 | 모델 이름에 버전 접미사 추가( 모델 버전 참조) |
| 인스턴트 모델을 완전히 사용하지 않도록 설정 | 관리자는 Azure Policy 통해 구독 수준에서 인스턴트 모델을 끌 수 있습니다. |
계정에서 인스턴트 모델을 제거하려면 Bicep 또는 ARM REST를 통해 설정을 구성합니다.
다음을 사용하여 계정을 업데이트합니다.
PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json
이 요청 본문을 사용하여 인스턴트 모델 액세스를 효과적으로 차단합니다.
{
"properties": {
"instant": {
"raiPolicyName": "Microsoft.DefaultV2",
"modelAllowList": []
}
}
}
Important
모든 인스턴트 모델은 기본 가드레일 및 콘텐츠 필터를 사용합니다. 그러나 인스턴트 모델에 대해 모델별로 사용자 지정 가드레일 또는 RAI(책임 있는 AI) 정책을 구성할 수는 없습니다. API를 통해 계정 수준에서 기본 RAI 정책을 설정할 수 있지만 해당 정책은 모든 인스턴트 모델에 균일하게 적용됩니다. 개별 모델에 대해 다른 콘텐츠 필터링 정책이 필요한 경우 배포를 사용합니다.
배포 이름 충돌
새 배포는 기존 모델 이름과 일치하는 이름을 사용할 수 없습니다. 이름이 모델 이름과 충돌하는 기존 배포가 있는 경우 배포가 우선하며 해당 프로젝트에서 해당 모델 이름에 대한 인스턴트 모델 액세스를 사용할 수 없습니다.
미리 보기 중 제한 사항
- 미국 서부 3에서만 사용할 수 있습니다.
- 미세 조정된 모델은 지원되지 않습니다. 파인튜닝된 모델을 사용하려면 배포를 생성합니다.
- 가드레일, 사용자 지정 RAI 정책 및 콘텐츠 필터는 인스턴트 모델에 대해 구성할 수 없습니다.
- 지원되는 모델에 나열된 모델만 사용할 수 있습니다.