다음을 통해 공유


서비스 할당량 및 제한

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v2.1 | 최신 버전:파란색 확인 표시v4.0(미리 보기)

이 문서에는 모든 가격 책정 계층에서 Azure AI 문서 인텔리전스 서비스 할당량 및 제한에 대한 빠른 참조 및 자세한 설명이 포함되어 있습니다. 또한 요청 제한을 방지하기 위한 몇 가지 모범 사례가 포함되어 있습니다.

모델 사용

지원되는 문서 형식 읽음 레이아웃 미리 빌드된 모델 사용자 지정 모델 추가 기능
PDF ✔️ ✔️ ✔️ ✔️ ✔️
이미지: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = 지원됨 ✖️ = 지원되지 않음

지원되는 문서 형식 읽음 레이아웃 미리 빌드된 모델 사용자 지정 모델
PDF ✔️ ✔️ ✔️ ✔️
이미지: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = 지원됨 ✖️ = 지원되지 않음

할당량 무료(F0)1 Standard(S0)
초당 트랜잭션 수 제한 1 15(기본값)
조정 가능 아니요 2
최대 문서 크기 4MB 500 MB
조정 가능 아니요 아니요
최대 페이지 수(분석) 2 2000
조정 가능 아니요 아니요
레이블 파일의 최대 크기 10MB 10MB
조정 가능 아니요 아니요
OCR json 응답의 최대 크기 500 MB 500 MB
조정 가능 아니요 아니요
템플릿 모델의 최대 수 500 5,000
조정 가능 아니요 아니요
인공신경망 모델의 최대 수 100 500
조정 가능 아니요 아니요

사용자 지정 모델 사용

할당량 무료(F0)1 Standard(S0)
모델 한도 구성 5 200(기본값)
조정 가능 아니요 아니요
학습 데이터 세트 크기 * 인공신경망 1GB 3 1GB(기본값)
조정 가능 아니요 아니요
학습 데이터 세트 크기 * 템플릿 50MB 4 50MB(기본값)
조정 가능 아니요 아니요
최대 페이지 수(학습) * 템플릿 500 500(기본값)
조정 가능 아니요 아니요
최대 페이지 수(학습) * 인공신경망 50,000 50,000(기본값)
조정 가능 아니요 아니요
사용자 지정 신경망 모델 학습 매월 10 매월 20
조정 가능 아니요 3
최대 페이지 수(학습) * 분류자 10,000 10,000(기본값)
조정 가능 아니요 아니요
최대 문서 형식(클래스) 수 * 분류자 500 500(기본값)
조정 가능 아니요 아니요
학습 데이터 세트 크기 * 분류자 1GB 1GB(기본값)
조정 가능 아니요 아니요
클래스당 최소 샘플 수 * 분류자 5 5(기본값)
조정 가능 아니요 아니요

사용자 지정 모델 제한

할당량 무료(F0)1 Standard(S0)
모델 한도 구성 5 200(기본값)
조정 가능 아니요 아니요
학습 데이터 세트 크기 50MB 50MB(기본값)
조정 가능 아니요 아니요
최대 페이지 수(학습) 500 500(기본값)
조정 가능 아니요 아니요

1무료(F0) 가격 책정 계층에 대해서는 가격 책정 페이지에서 월별 허용량도 참조하세요.
2모범 사례 및 [조정 지침(#create-and-submit-support-request)을 참조하세요.
3 신경망 모델 학습 수는 매월 다시 설정됩니다. 지원 요청을 열어 월별 학습 한도를 늘립니다.

4 이 제한은 레이블 지정 관련 업데이트 전에 학습 데이터 세트 폴더에 있는 모든 문서에 적용됩니다.

자세한 설명, 할당량 조정 및 모범 사례

할당량 증가를 요청하려면(해당하는 경우) 먼저 해당 할당량이 필요한지 확인합니다. 문서 인텔리전스 서비스는 자동 크기 조정을 사용하여 필요한 계산 리소스 on-demand를 가져오고, 고객 비용을 낮게 유지하며, 하드웨어 용량을 과도하게 유지하지 않음으로써 사용하지 않는 리소스의 프로비전을 해제합니다.

애플리케이션이 응답 코드 429(요청이 너무 많음)를 반환하고 워크로드가 정의된 제한 내에 있는 경우 서비스가 수요에 맞게 스케일 업되었지만 아직 필요한 규모에 도달하지 않았을 가능성이 높습니다. 따라서 요청을 즉시 처리할 수 있을 만큼 충분한 리소스가 서비스에 없습니다. 이 상태는 일시적이며 오래 지속되지 않아야 합니다.

자동 크기 조정 중 제한을 완화하기 위한 일반적인 모범 사례

제한과 관련된 문제(응답 코드 429)를 최소화하려면 다음 방법을 사용하는 것이 좋습니다.

  • 애플리케이션에서 다시 시도 논리를 구현합니다.
  • 워크로드가 급격히 변경되지 않도록 합니다. 워크로드를 점진적으로 늘립니다.
    예제. 애플리케이션이 Document Intelligence를 사용하고 있으며 현재 워크로드는 10TPS(초당 트랜잭션 수)입니다. 그 다음 1초에 로드를 40TPS(즉, 4배)로 늘립니다. 서비스는 새 로드를 충족하기 위해 즉시 확장을 시작하지만 1초 이내에 수행할 수 없으므로 일부 요청에 응답 코드 429가 수신됩니다.

다음 섹션에서는 할당량 조정의 특정 사례에 대해 설명합니다. Document Intelligence: 동시 요청 제한 증가로 이동

초당 트랜잭션 수 증가 요청 제한

기본적으로 초당 트랜잭션 수는 Document Intelligence 리소스에 대해 초당 15개의 트랜잭션으로 제한됩니다. 표준 가격 책정 계층의 경우 이 크기를 늘릴 수 있습니다. 요청을 제출하기 전에 이 섹션의 자료를 숙지하고 모범 사례에 대해 알고 있는지 확인하세요.

동시 요청 제한을 늘려도 비용에 직접적인 영향을 주지 않습니다. Document Intelligence 서비스는 "사용한 만큼만 요금 지불" 모델을 사용합니다. 이 제한은 서비스에서 요청 제한을 시작하기 전에 크기를 조정할 수 있는 수준을 정의합니다.

동시 요청 제한 매개 변수의 기존 값은 Azure Portal, 명령줄 도구 또는 API 요청을 통해 표시되지 않습니다. 기존 값을 확인하려면 Azure 지원 요청을 만듭니다.

초당 트랜잭션을 늘리려면 리소스에서 자동 크기 조정을 사용하도록 설정하면 됩니다. 리소스에서 자동 스케일링을 사용하도록 설정하려면 이 문서 * 자동 스케일링 사용를 참조하세요. TPS 증가 지원 요청을 제출할 수도 있습니다.

필요한 정보 준비

  • Document Intelligence 리소스 ID

  • 지역

  • 정보를 가져오는 방법(기본 모델):

    • Azure 포털
    • 트랜잭션 제한을 늘리려는 Document Intelligence 리소스를 선택
    • 속성 선택(리소스 관리 그룹)
    • 다음 필드의 값을 복사하고 저장합니다.
      • 리소스 ID
      • 위치(엔드포인트 영역)

지원 요청 만들기 및 제출

지원 요청을 제출하여 리소스에 대한 TPS(초당 트랜잭션 수) 한도 증가를 시작합니다.

  • 필요한 정보가 있는지 확인
  • Azure 포털
  • TPS 제한을 늘리려는 Document Intelligence 리소스를 선택
  • 새 지원 요청(지원 + 문제 해결 그룹) 선택
  • Azure 구독 및 Azure 리소스에 대한 정보가 자동으로 채워진 새 창이 표시됨
  • 요약 입력(예: "Document Intelligence TPS 제한 증가")
  • 문제 유형에서 *“할당량 또는 사용 유효성 검사”를 선택합니다.
  • 다음: 솔루션을 선택합니다.
  • 요청 만들기 계속 진행
  • 세부 정보 탭의 설명 필드에 다음 정보를 입력합니다.
    • 참고로 요청은 문서 인텔리전스 할당량에 관한 것입니다.
    • 충족하도록 스케일링하려는 TPS 기대치를 제공합니다.
    • 수집한 Azure 리소스 정보.
    • 필요한 정보 입력을 완료하고 검토 + 만들기 탭에서 만들기 단추를 클릭합니다.
    • Azure Portal 알림에서 지원 요청 번호를 확인합니다. 추가 처리를 위해 곧 연락을 드릴 것입니다.

워크로드 패턴 모범 사례의 예

이 예에서는 진행 중인 자동 크기 조정으로 인해 가능한 요청 제한을 완화하기 위해 다음과 같은 권장되는 접근 방식을 제시합니다. 이는 정확한 해결 방법이 아니라 우리가 필요에 맞게 따르고 조정하도록 초대하는 템플릿일 뿐입니다.

Document Intelligence 리소스에 기본 제한이 설정되어 있다고 가정합니다. 워크로드를 시작하여 분석 요청을 제출합니다. 응답 코드 429로 대역폭 제한이 자주 발생하는 경우 GET 분석 응답 요청에 지수 백오프를 구현하여 시작합니다. 연속적인 오류 응답에 대한 다시 시도 사이에 점점 더 긴 대기 시간을 사용합니다(예: 요청 간의 지연 패턴 2-5-13-34). 일반적으로 해당 POST 요청에 대해 2초마다 두 번 이상 분석 가져오기 응답을 호출하지 않는 것이 좋습니다.

제출 중인 문서에 대한 POST 요청 수에 제한이 있는 경우 요청 사이에 지연을 추가하는 것이 좋습니다. 워크로드에 더 높은 수준의 동시 처리가 필요한 경우 초당 트랜잭션에 대한 서비스 제한을 늘리기 위해 지원 요청을 만들어야 합니다.

일반적으로 프로덕션으로 이동하기 전에 워크로드 및 워크로드 패턴을 테스트하는 것이 좋습니다.

다음 단계