다음을 통해 공유


Microsoft Azure AI Foundry 프로비전된 처리량 예약으로 비용 절감

1개월 또는 1년 동안 Azure AI Foundry 모델에서 사용할 수 있는 모델의 프로비전된 처리량 단위(PTU) 사용량에 대한 예약을 커밋하여 Azure AI Foundry 프로비전된 처리량에 대한 비용을 절감할 수 있습니다. 이 문서에서는 Azure AI Foundry 프로비전된 처리량 예약을 사용하여 비용을 절감하는 방법을 설명합니다.

Azure AI Foundry 프로비전된 처리량 예약을 구매하려면 Azure 지역, 수량 및 적용하려는 배포 유형을 선택합니다. 그런 다음, Azure AI Foundry 프로비전된 처리량 SKU(전역, 데이터 영역 또는 지역)를 카트에 추가합니다. 그런 다음 구매하고 주문을 완료하려는 Azure AI Foundry 프로비전된 처리량 단위의 수량을 확인합니다.

예약을 구매하면 예약 특성과 일치하는 Azure AI Foundry 프로비전된 처리량 사용량이 더 이상 시간당 요금으로 청구되지 않습니다.

비고

전역, 데이터 영역 및 지역 배포에 대한 예약은 서로 교환할 수 없습니다. 각 배포 유형에 대해 별도의 예약을 구매해야 합니다. 예를 들어 Global에 대한 예약을 구매하는 경우 혜택은 데이터 영역 또는 지역에 적용되지 않고 전역 배포에만 적용됩니다.

특정 제한 사항으로 전역, 데이터 영역 및 지역 배포에 대한 예약을 교환하거나 취소할 수 있습니다. 자세한 내용은 Azure Reservations의 셀프 서비스 교환 및 환불을 참조하세요.

예약 애플리케이션

예약은 프로비전된 배포에만 적용되며 표준 배포나 미세 조정과 같은 다른 제공 사항은 포함되지 않습니다. Azure AI Foundry 프로비전된 처리량 예약도 용량 가용성을 보장하지 않습니다. 용량 가용성을 보장하려면 예약을 구매하기 전에 배포를 만드는 것이 가장 좋습니다.

예약이 만료되면 Azure AI Foundry 프로비전된 처리량 배포는 계속 실행되지만 시간당 요금이 청구됩니다.

갱신 옵션

갱신 설정에서 옵션을 선택하거나 구매 시 예약을 자동으로 갱신하도록 선택할 수 있습니다. Azure AI Foundry 프로비전된 처리량 예약 자동 갱신을 사용하면 예약이 동일한 예약 주문 ID를 사용하여 갱신되고 새 예약은 구매되지 않습니다. 이 예약을 갱신 설정에서 새 예약 구매로 바꾸도록 선택할 수도 있으며, 예약이 만료되면 대체 예약이 구매됩니다. 기본적으로 대체 예약에는 만료 예약과 동일한 특성이 있지만 기본적으로 자동 갱신으로 설정됩니다. 갱신 설정에서 선택적으로 이름, 대금 청구 주기, 기간 또는 수량을 변경할 수 있습니다. 청구에 사용된 구독 및 예약에 대한 소유자 액세스 권한이 있는 모든 사용자는 갱신을 설정할 수 있습니다. 예약이 동일한 예약 주문 ID에서 자동 갱신으로 설정될 경우, 사용자가 이를 취소하도록 설정할 때까지 이 예약은 자동으로 갱신되도록 설정됩니다. 구매 시 자동 갱신을 설정하기로 선택한 경우 1개월 기간 동안 예약은 동일한 예약 주문 ID로 자동으로 갱신되는 반면, 1년 기간은 대체 예약을 구매하게 됩니다.

필수 조건

Azure Portal에서 Azure AI Foundry 프로비전된 처리량 예약을 구입할 수 있습니다. 예약 요금은 사전 결제 또는 월별 결제로 처리할 수 있습니다. 예약을 구입하려면 다음을 수행합니다.

  • Azure 구독에는 소유자 역할 또는 예약 구매자 역할이 있어야 합니다.
  • 엔터프라이즈 구독의 경우 Azure Portal에서 예약 인스턴스 정책 옵션을 사용하도록 설정해야 합니다. 설정이 사용하지 않도록 설정된 경우 사용하도록 설정하려면 EA 관리자 권한이 있어야 합니다.
  • Direct Enterprise 고객은 Azure Portal에서 예약 인스턴스 정책 설정을 업데이트할 수 있습니다. 정책 메뉴로 이동하여 설정을 변경합니다.
  • CSP(클라우드 솔루션 공급자) 프로그램의 경우 관리 에이전트 또는 판매 에이전트만 Azure AI Foundry 프로비전된 처리량 예약을 구매할 수 있습니다.

예약 구매에 대해 엔터프라이즈 고객과 종량제 고객에게 요금이 청구되는 방법에 대한 자세한 내용은 엔터프라이즈 등록에서 Azure 예약 사용량 이해종량제 구독에서 Azure 예약 사용량 이해를 참조하세요.

구매하기 전에 적절한 크기 및 배포 유형 선택

Azure AI Foundry 프로비전된 처리량 예약 크기는 Azure AI Foundry 모델에서 사용할 수 있는 모델별로 배포를 통해 사용하는 프로비전된 총 처리량 단위를 기반으로 해야 합니다. 예약 구매는 제공된 처리량 단위 단위로 이루어집니다.

예를 들어 프로비전된 지역 배포 유형의 100개 단위와 프로비전된 전역 배포 유형의 50개 단위를 배포했다고 가정합니다. 이 예제에서는 100단위의 수량에 대해 프로비저닝된 관리 지역 예약을 구매하고, 배포된 모든 PTU를 포함할 수 있도록 50단위의 프로비저닝된 관리 전역 예약을 구매해야 합니다.

주의

모델 배포에 필요한 용량 가용성은 동적이며 지역과 모델에 따라 자주 변경됩니다. 사용할 수 있는 PTU보다 많은 PTU 예약을 구매하는 것을 방지하려면 먼저 배포를 만듭니다. 그런 다음 배치한 PTU를 충당하기 위한 예약을 구매합니다. 이 모범 사례는 예약 할인을 최대화하고 완전히 사용할 수 없는 기간 약정을 구매하는 것을 방지하는 데 도움이 됩니다.

Microsoft Azure AI Foundry의 프로비전 처리량 예약 구매

예약을 구입하면 현재 UTC 날짜 및 시간이 트랜잭션을 기록하는 데 사용됩니다.

Azure AI Foundry 프로비전된 처리량 예약을 구입하려면 다음 단계를 수행합니다.

  1. Azure Portal에 로그인합니다.
  2. 모든 서비스> 선택한 다음, Azure AI Foundry 프로비전된 처리량을 선택합니다.
    구매 예약 페이지를 보여 주는 스크린샷.
  3. 구독을 선택합니다. 구독 목록을 사용하여 예약 비용을 지불하는 데 사용할 구독을 선택합니다. 구독의 결제 방법으로 예약 요금이 청구됩니다. 구독 유형은 기업계약(제안 번호: MS-AZR-0017P 또는 MS-AZR-0148P), Microsoft 고객 계약 또는 종량제(제품 번호: MS-AZR-0003P 또는 MS-AZR-0023P)여야 합니다.
    • 엔터프라이즈 구독의 경우 요금은 등록의 Azure 선불(이전에는 현금 약정 금액이라고 함) 잔액에서 차감되거나 초과분에 대해 청구됩니다.
    • 종량제 구독의 경우 요금은 구독의 신용 카드 또는 송장 결제 방법으로 청구됩니다.
  4. 범위를 선택합니다. 구독 범위를 선택하려면 범위 목록을 사용합니다. 구매 후 예약 범위를 변경할 수 있습니다.
    • 단일 리소스 그룹 범위 - 선택한 리소스 그룹의 일치하는 리소스에만 예약 할인을 적용합니다.
    • 단일 구독 범위 - 선택한 구독의 일치하는 리소스에만 예약 할인을 적용합니다.
    • 공유 범위 - 청구 컨텍스트에 있는 적격 구독의 일치하는 리소스에 예약 할인을 적용합니다. 구독이 다른 청구 컨텍스트로 이동되면 혜택이 더 이상 구독에 적용되지 않습니다. 청구 컨텍스트의 다른 구독에는 계속 적용됩니다.
      • 기업 계약의 경우 청구 컨텍스트는 EA 등록입니다. 예약 공유 범위에는 등록의 여러 Microsoft Entra 테넌트가 포함됩니다.
      • Microsoft 고객 계약 고객의 경우 청구 범위는 청구 프로필입니다.
      • 종량제 고객의 공유 범위는 계정 관리자가 생성한 모든 종량제 구독입니다.
    • 관리 그룹 - 관리 그룹 및 청구 범위의 일부인 구독 목록에서 일치하는 리소스에 예약 할인을 적용합니다. 관리 그룹 범위는 전체 관리 그룹 계층 구조의 모든 구독에 적용됩니다. 관리 그룹에 대한 예약을 구입하려면, 우선 관리 그룹에 대한 읽기 권한이 있어야 하고, 청구 구독에 대한 예약 소유자나 예약 구매자가 되어야 합니다.
  5. 예약에서 적용되는 Azure 지역을 선택할 지역을 선택합니다.
  6. 배포 유형(전역, 데이터 영역 또는 지역)을 다룰 제품을 선택하고 카트에 추가를 선택합니다.
    구매할 제품 선택 페이지를 보여 주는 스크린샷.
  7. 카트에서 구매하려는 프로비전된 처리량 단위의 수량을 선택합니다. 예를 들어 64의 수량은 매시간 배포된 프로비전된 처리량 단위를 최대 64개까지 커버합니다.
  8. 다음: 검토 + 구매를 선택하고 구매 선택 사항과 가격을 검토합니다.
  9. 지금 구매를 선택합니다.
  10. 구매 후 예약 보기를 선택하여 구매 상태를 확인할 수 있습니다.

예약 취소, 교환 또는 환불

특정 제한 사항으로 예약을 교환하거나 취소할 수 있습니다. 자세한 내용은 Azure Reservations의 셀프 서비스 교환 및 환불을 참조하세요.

Azure AI Foundry 프로비전된 처리량 예약을 교환하려면 다음 단계를 수행하여 교환할 수 있습니다.

  1. Azure Portal에 로그인하고 예약 페이지로 이동합니다.
  2. 환불하려는 Azure AI Foundry 프로비전된 처리량 예약을 선택하고 Exchange를 선택합니다.
  3. 구매할 새 예약을 선택합니다.
  4. 사용 약관을 검토하고 이에 동의합니다.

Azure AI Foundry 프로비전된 처리량 예약에 대한 환불을 요청하려면 다음 단계를 수행하여 환불을 요청할 수 있습니다.

  1. Azure Portal에 로그인하고 예약 페이지로 이동합니다.
  2. 환불하려는 Azure AI Foundry 프로비전된 처리량 예약을 선택하고 반환을 선택합니다.
  3. 환불 예약 페이지에서 환불 금액을 검토하고 반환 사유를 선택합니다.
  4. 예약 인스턴스 반환을 선택합니다.
  5. 사용 약관을 검토하고 이에 동의합니다.

환불 금액은 비례 배분된 남은 기간과 예약의 현재 가격을 기준으로 합니다. 환불 금액은 Azure 계정에 크레딧으로 적용됩니다.

환불을 요청하면 예약이 취소되고 Azure Portal의 예약 페이지에서 환불 요청 상태를 볼 수 있습니다.

청구 범위(예: EA, Microsoft 고객 계약, Microsoft 파트너 계약)에서 취소된 모든 예약 약정의 총액은 12개월 연속 기간 동안 USD 50,000을 초과할 수 없습니다.

Azure AI Foundry 모델에서 사용할 수 있는 모델에 예약 할인이 적용되는 방법

Azure AI Foundry 프로비전된 처리량에 대한 예약을 구매한 후 예약 범위 내에 속하는 한 예약과 관련된 할인이 Azure AI Foundry 모델에서 사용할 수 있는 모델의 지정된 지역에 배포된 모든 단위에 자동으로 적용됩니다. 예약 할인은 프로비전된 처리량 종량제 미터에서 방출되는 사용량에 적용됩니다.

비고

전역, 데이터 영역 및 지역 배포에 대한 예약은 서로 교환할 수 없습니다. 각 배포 유형에 대해 별도의 예약을 구매해야 합니다.

예약 할인 애플리케이션

Azure AI Foundry 프로비전된 처리량 예약의 애플리케이션은 Azure AI Foundry 모델에서 사용할 수 있는 모델의 예약 및 배포된PTU 간의 시간별 비교를 기반으로 합니다. 예약된 PTUs 수량과 배포된 PTUs up-to의 합계는 예약을 통해 적용(유료)되며, 예약된 PTUs보다 초과 배포된 PTUs는 시간당 종량제로 청구됩니다. 명심해야 할 몇 가지 사항이 더 있습니다.

  • 부분 시간 배포에 대한 PTU는 배포가 해당 시간 동안 존재한 분 수를 기준으로 비례적으로 조정됩니다. 예를 들어, 1시간 동안 15분만 지속되는 100 PTU 배포는 25 PTU 배포로 간주됩니다. 구체적으로 15분은 1/4시간이므로, 해당 시간 동안 배치된 PTU의 1/4만 청구 및 예약 애플리케이션에 고려됩니다.
  • 예약이 적용되기 전에 예약 범위를 기준으로 배포가 예약과 일치됩니다. 예를 들어, 단일 구독으로 범위가 지정된 예약은 해당 구독 내의 배포에만 적용됩니다. 다른 구독에 대한 배포는 해당 구독과 관련된 예약이 없는 경우 시간제 종량제로 청구됩니다.

예약 가격은 예약된 PTU를 연중무휴(24x7)로 배포하는 것을 가정합니다. 배치된 PTU가 예약된 PTU보다 적은 기간에는, 배치된 모든 PTU가 예약으로 보장되지만, 초과 예약 PTU는 사용되지 않습니다. 이러한 초과 예약된 PTU는 손실되며 다른 기간으로 이월되지 않습니다.

비고

Azure AI Foundry 프로비전된 처리량 예약의 애플리케이션은 Azure AI Foundry 모델(예: Azure OpenAI Service, DeepSeek 등)에서 사용할 수 있는 모델에서 작동합니다. Azure AI Foundry 모델 목록은 Azure AI Foundry 모델 가격 책정 페이지를 참조하세요.

할인 예제

다음 예제에서는 배포에 따라 Azure AI Foundry 프로비전된 처리량 예약 할인이 적용되는 방법을 보여 줍니다.

예제 1 - 지역 배포 단위와 정확히 동일한 크기의 지역 예약입니다. 예를 들어 지역 예약에서 100PTU를 구매하고 100개의 지역별PTU를 배포합니다. 이 예제에서는 예약 가격만 지불합니다.

예제 2 - 귀하의 전역 배포 단위보다 더 큰 전역 예약입니다. 예를 들어 전역 예약에서 300PTU를 구매하고 100개의 전역PTU만 배포합니다. 이 예에서는 글로벌 예약 할인이 100개의 글로벌 PTU에 적용됩니다. 글로벌 예약의 나머지 200PTU는 사용되지 않으며 향후 청구 기간으로 진행되지 않습니다.

예제 3 - 배포된 데이터 영역 단위보다 작은 크기로 예약된 데이터 영역입니다. 예를 들어 데이터 영역 예약에서 200PTU를 구매하고 600개의 데이터 영역PTU를 배포합니다. 이 예제에서는 데이터 영역 예약 할인이 사용된 200개의 데이터 영역PTU에 적용됩니다. 나머지 400개의 데이터 존 PTU는 종량제 요금으로 청구됩니다.

예제 4 - 두 지역 배치의 총합과 동일한 크기의 지역 예약입니다. 예를 들어 예약에서 200개의 지역별 CPU를 구매하고 각각 100개의 지역별 PTU를 두 개 배포합니다. 이 예에서 할인은 배치된 단위의 합계에 적용됩니다.

Azure AI Foundry 프로비전된 처리량 예약 늘리기

구매한 예약의 크기는 변경할 수 없습니다. Azure AI Foundry 프로비전된 처리량 예약 용량을 늘려서 더 많은 시간당 처리 시간 단위를 포함하도록 하려면, 더 많은 Azure AI Foundry 프로비전된 처리량 예약을 구입하거나 필요한 수량으로 기존 예약을 교환할 수 있습니다.

월별 분할 상환 비용

분할 상환 예약 비용은 각 월을 기준으로 합니다. 따라서 연중 각 달에 따라 일일 분할 상환 비용이 변경될 수 있습니다. 월별 분할 상환 비용이 어떻게 다를 수 있는지 설명하는 예제는 다음과 같습니다.

예제 1 - 1월 10일 예약을 구입하는 경우 갱신은 다음과 같습니다.

  • 1개월: 1월 10일~2월 9일(포함)
  • 2개월: 2월 10일 ~ 3월 9일(포함) 등

예제 2 - 12 월 29일, 30일 또는 31일에 예약을 구매하면 갱신 날짜가 1년 동안 변경됩니다. 예를 들어 12월 30일에 예약을 구입한다고 가정합니다.

  • 1개월: 12월 30일~1월 29일(포함)
  • 2개월: 1월 30일 ~ 2월 27일(포함) - 윤년 이외의 연도
  • 3개월: 2월 28일 ~3월 27일(포함) 등

월별 예약에 대한 비용이 $200인 경우 다음을 수행합니다.

  • 예약은 5월에 구입되었고, 이후 매일 $200/31의 분할 상환 비용을 확인할 수 있습니다.
  • 예약은 2월에 구입되었고, 그 후 $200/28의 일일 분할 상환 비용을 볼 수 있습니다.