서비스 할당량 및 제한

아티클
10/16/2024

이 콘텐츠의 적용 대상:v4.0(미리 보기) | 이전 버전:v3.1(GA)v3.0(GA)

이 콘텐츠의 적용 대상: v2.1 | 최신 버전: v4.0(미리 보기)

이 문서에는 모든 가격 책정 계층에서 Azure AI 문서 인텔리전스 서비스 할당량 및 제한에 대한 빠른 참조 및 자세한 설명이 포함되어 있습니다. 또한 요청 제한을 방지하기 위한 몇 가지 모범 사례가 포함되어 있습니다.

모델 사용

지원되는 문서 형식	읽음	레이아웃	미리 빌드된 모델	사용자 지정 모델	추가 기능
PDF	✔️	✔️	✔️	✔️	✔️
이미지: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️

✔️ = 지원됨 ✖️ = 지원되지 않음

지원되는 문서 형식	읽음	레이아웃	미리 빌드된 모델	사용자 지정 모델
PDF	✔️	✔️	✔️	✔️
이미지: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️

✔️ = 지원됨 ✖️ = 지원되지 않음

결제

문서 인텔리전스 청구는 모델 형식 및 분석된 페이지 수를 기준으로 매월 계산됩니다. Azure Portal의 메트릭 대시보드에서 사용 현황 메트릭을 찾을 수 있습니다. 대시보드에는 Azure AI 문서 인텔리전스에서 처리한 페이지 수가 표시됩니다. Azure 가격 계산기를 사용하여 리소스에 사용된 예상 비용을 확인할 수 있습니다. 자세한 지침은 사용량 확인 및 예상 비용을 참조하세요. 다음은 몇 가지 세부 정보입니다.

분석을 위해 문서를 제출할 때 요청에서 pages 매개 변수를 사용하여 페이지 범위를 지정하지 않으면 서비스에서 모든 페이지를 분석합니다. 서비스는 읽기, OCR 또는 레이아웃 모델을 통해 Microsoft Excel 및 PowerPoint 문서를 분석할 때 각 Excel 워크시트와 PowerPoint 슬라이드를 하나의 페이지로 계산합니다.
서비스는 PDF 및 TIFF 파일을 분석할 때 PDF 파일의 각 페이지 또는 TIFF 파일의 각 이미지를 최대 문자 제한 없이 한 페이지로 계산합니다.
서비스는 읽기 및 레이아웃 모델이 지원하는 Microsoft Word 및 HTML 파일을 분석할 때 각각 3,000자 블록으로 페이지 수를 계산합니다. 예를 들어 문서에 7,000자가 포함된 경우 각각 3,000자의 두 페이지와 1,000자의 한 페이지를 합하여 총 3페이지가 됩니다.
읽기 및 레이아웃 모델은 Microsoft Word, Excel, PowerPoint 및 HTML 파일에서 포함되거나 연결된 이미지의 분석을 지원하지 않습니다. 따라서 서비스는 이를 추가된 이미지로 계산하지 않습니다.
문서 인텔리전스를 사용하면 사용자 지정 모델을 항상 무료로 학습할 수 있습니다. 서비스에서 모델을 사용하여 문서를 분석하는 경우에만 요금이 발생합니다.
컨테이너 가격 책정은 클라우드 서비스 가격 책정과 동일합니다.
문서 인텔리전스는 모든 문서 인텔리전스 기능을 테스트할 수 있는 무료 계층(F0)을 제공합니다.
문서 인텔리전스에는 대규모 워크로드에 대한 약정 기반 가격 책정 모델이 있습니다.
레이아웃 모델은 사용자 지정 학습을 위해 데이터 세트에 대한 레이블을 생성하는 데 필요합니다. 사용자 지정 학습에 사용하는 데이터 세트에 사용할 수 있는 레이블 파일이 없으면 서비스에서 레이블 파일을 생성하고 레이아웃 모델 사용에 대한 요금을 청구합니다.

할당량	무료(F0)¹	Standard(S0)
초당 트랜잭션 수 제한	1	15(기본값)
조정 가능	아니요	예 ²
최대 문서 크기	4MB	500 MB
조정 가능	아니요	아니요
최대 페이지 수(분석)	2	2000
조정 가능	아니요	아니요
레이블 파일의 최대 크기	10MB	10MB
조정 가능	아니요	아니요
OCR json 응답의 최대 크기	500 MB	500 MB
조정 가능	아니요	아니요
템플릿 모델의 최대 수	500	5,000
조정 가능	아니요	아니요
인공신경망 모델의 최대 수	100	500
조정 가능	아니요	아니요

사용자 지정 모델 사용

할당량	무료(F0)¹	Standard(S0)
모델 한도 구성	5	500(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 신경망 및 생성형**	1GB ³	1GB(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 템플릿**	50MB ⁴	50MB(기본값)
조정 가능	아니요	아니요
*최대 페이지 수(학습) 템플릿**	500	500(기본값)
조정 가능	아니요	아니요
*최대 페이지 수(학습) 신경망 및 생성형**	50,000	50,000(기본값)
조정 가능	아니요	아니요
사용자 지정 신경망 모델 학습	매월 10시간 ⁵	제한 없음(시간당 지불)
조정 가능	아니요	예 ³
*최대 페이지 수(학습) 분류자**	10,000	10,000(기본값)
조정 가능	아니요	아니요
*최대 문서 형식(클래스) 수 분류자**	500	500(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 분류자**	1GB	2GB(기본값)
조정 가능	아니요	아니요
*클래스당 최소 샘플 수 분류자**	5	5(기본값)
조정 가능	아니요	아니요

사용자 지정 모델 사용

할당량	무료(F0)¹	Standard(S0)
모델 한도 구성	5	200(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 인공신경망**	1GB ³	1GB(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 템플릿**	50MB ⁴	50MB(기본값)
조정 가능	아니요	아니요
*최대 페이지 수(학습) 템플릿**	500	500(기본값)
조정 가능	아니요	아니요
*최대 페이지 수(학습) 인공신경망**	50,000	50,000(기본값)
조정 가능	아니요	아니요
사용자 지정 신경망 모델 학습	매월 10	매월 20
조정 가능	아니요	예 ³
*최대 페이지 수(학습) 분류자**	10,000	10,000(기본값)
조정 가능	아니요	아니요
*최대 문서 형식(클래스) 수 분류자**	500	500(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 분류자**	1GB	1GB(기본값)
조정 가능	아니요	아니요
*클래스당 최소 샘플 수 분류자**	5	5(기본값)
조정 가능	아니요	아니요

사용자 지정 모델 사용

할당량	무료(F0)¹	Standard(S0)
모델 한도 구성	5	200(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 인공신경망**	1GB ³	1GB(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 템플릿**	50MB ⁴	50MB(기본값)
조정 가능	아니요	아니요
*최대 페이지 수(학습) 템플릿**	500	500(기본값)
조정 가능	아니요	아니요
*최대 페이지 수(학습) 인공신경망**	50,000	50,000(기본값)
조정 가능	아니요	아니요
사용자 지정 신경망 모델 학습	매월 10	매월 20
조정 가능	아니요	예 ³
*최대 페이지 수(학습) 분류자**	10,000	10,000(기본값)
조정 가능	아니요	아니요
*최대 문서 형식(클래스) 수 분류자**	500	500(기본값)
조정 가능	아니요	아니요
*학습 데이터 세트 크기 분류자**	1GB	1GB(기본값)
조정 가능	아니요	아니요
*클래스당 최소 샘플 수 분류자**	5	5(기본값)
조정 가능	아니요	아니요

사용자 지정 모델 제한

할당량	무료(F0)¹	Standard(S0)
모델 한도 구성	5	200(기본값)
조정 가능	아니요	아니요
학습 데이터 세트 크기	50MB	50MB(기본값)
조정 가능	아니요	아니요
최대 페이지 수(학습)	500	500(기본값)
조정 가능	아니요	아니요

¹무료(F0) 가격 책정 계층에 대해서는 가격 책정 페이지에서 월별 허용량도 참조하세요.
² 모범 사례 및 조정 지침을 참조하세요.
³ 신경망 모델 학습 수는 매월 다시 설정됩니다. 지원 요청을 열어 월별 학습 한도를 늘립니다.

⁴ 이 제한은 레이블 지정 관련 업데이트 전에 학습 데이터 세트 폴더에 있는 모든 문서에 적용됩니다.

⁵ 이 제한은 v 4.0 (2024-07-31) 사용자 지정 신경망 모델에만 적용됩니다. v 4.0에서 시작하여 더 긴 기간 동안 더 큰 문서를 교육할 수 있습니다(무료는 최대 10시간, 이후 요금이 부과됨). 자세한 내용은 사용자 지정 신경망 모델 페이지를 참조하세요.

자세한 설명, 할당량 조정 및 모범 사례

할당량 증가를 요청하려면(해당하는 경우) 먼저 해당 할당량이 필요한지 확인합니다. 문서 인텔리전스 서비스는 자동 크기 조정을 사용하여 필요한 계산 리소스 on-demand를 가져오고, 고객 비용을 낮게 유지하며, 하드웨어 용량을 과도하게 유지하지 않음으로써 사용하지 않는 리소스의 프로비전을 해제합니다.

애플리케이션이 응답 코드 429(요청이 너무 많음)를 반환하고 워크로드가 정의된 제한 내에 있는 경우 서비스가 수요에 맞게 스케일 업되었지만 아직 필요한 규모에 도달하지 않았을 가능성이 높습니다. 따라서 요청을 즉시 처리할 수 있을 만큼 충분한 리소스가 서비스에 없습니다. 이 상태는 일시적이며 오래 지속되지 않아야 합니다.

자동 크기 조정 중 제한을 완화하기 위한 일반적인 모범 사례

제한과 관련된 문제(응답 코드 429)를 최소화하려면 다음 방법을 사용하는 것이 좋습니다.

애플리케이션에서 다시 시도 논리를 구현합니다.
워크로드가 급격히 변경되지 않도록 합니다. 워크로드를 점진적으로 늘립니다.
예제. 애플리케이션이 Document Intelligence를 사용하고 있으며 현재 워크로드는 10TPS(초당 트랜잭션 수)입니다. 그 다음 1초에 로드를 40TPS(즉, 4배)로 늘립니다. 서비스는 새 로드를 충족하기 위해 즉시 확장을 시작하지만 1초 이내에 수행할 수 없으므로 일부 요청에 응답 코드 429가 수신됩니다.

다음 섹션에서는 할당량 조정의 특정 사례에 대해 설명합니다. Document Intelligence: 동시 요청 제한 증가로 이동

초당 트랜잭션 수 증가 요청 제한

기본적으로 초당 트랜잭션 수는 Document Intelligence 리소스에 대해 초당 15개의 트랜잭션으로 제한됩니다. 표준 가격 책정 계층의 경우 이 크기를 늘릴 수 있습니다. 요청을 제출하기 전에 이 섹션의 자료를 숙지하고 모범 사례에 대해 알고 있는지 확인하세요.

동시 요청 제한을 늘려도 비용에 직접적인 영향을 주지 않습니다. Document Intelligence 서비스는 "사용한 만큼만 요금 지불" 모델을 사용합니다. 이 제한은 서비스에서 요청 제한을 시작하기 전에 크기를 조정할 수 있는 수준을 정의합니다.

동시 요청 제한 매개 변수의 기존 값은 Azure Portal, 명령줄 도구 또는 API 요청을 통해 표시되지 않습니다. 기존 값을 확인하려면 Azure 지원 요청을 만듭니다.

초당 트랜잭션을 늘리려면 리소스에서 자동 크기 조정을 사용하도록 설정하면 됩니다. 리소스에서 자동 스케일링을 사용하도록 설정하려면 이 문서 * 자동 스케일링 사용를 참조하세요. TPS 증가 지원 요청을 제출할 수도 있습니다.

필요한 정보 준비

Document Intelligence 리소스 ID
지역
기본 모델 정보:
- Azure 포털
- 트랜잭션 제한을 늘리려는 Document Intelligence 리소스를 선택
- -속성- 선택(-리소스 관리- 그룹)
- 다음 필드의 값을 복사하고 저장합니다.
  - 리소스 ID
  - 위치(엔드포인트 영역)

지원 요청 만들기 및 제출

지원 요청을 제출하여 리소스에 대한 TPS(초당 트랜잭션 수) 한도 증가를 시작합니다.

필요한 정보가 있는지 확인
Azure 포털
TPS 제한을 늘리려는 Document Intelligence 리소스를 선택
-새 지원 요청- 선택(-지원 + 문제 해결- 그룹). Azure 구독 및 Azure 리소스에 대한 정보가 자동으로 채워진 새 창이 표시됨
-요약- 입력(예: "문서 인텔리전스 TPS 제한 증가")
문제 유형 필드에 대해 "할당량 또는 사용량 유효성 검사"를 선택합니다.
-다음: 솔루션- 선택
요청 만들기 계속 진행
세부 정보 탭의 -설명- 필드에 다음 정보를 입력합니다.
- 참고로 요청은 문서 인텔리전스 할당량에 관한 것입니다.
- 충족하도록 스케일링하려는 TPS 기대치를 제공합니다.
- 수집한 Azure 리소스 정보.
- 필수 정보 입력을 완료하고 -검토 + 만들기 탭에서 -만들기- 버튼 선택
- Azure Portal 알림에서 지원 요청 번호를 확인합니다. 향후 처리를 위해 곧 연락을 받을 수 있도록 지원을 찾습니다.

워크로드 패턴 모범 사례의 예

이 예에서는 진행 중인 자동 크기 조정으로 인해 가능한 요청 제한을 완화하기 위해 다음과 같은 권장되는 접근 방식을 제시합니다. 이는 정확한 해결 방법이 아니라 우리가 필요에 맞게 따르고 조정하도록 초대하는 템플릿일 뿐입니다.

Document Intelligence 리소스에 기본 제한이 설정되어 있다고 가정합니다. 워크로드를 시작하여 분석 요청을 제출합니다. 응답 코드 429로 대역폭 제한이 자주 발생하는 경우 GET 분석 응답 요청에 지수 백오프를 구현하여 시작합니다. 연속적인 오류 응답에 대한 다시 시도 사이에 점점 더 긴 대기 시간을 사용합니다(예: 요청 간의 지연 패턴 2-5-13-34). 일반적으로 해당 POST 요청에 대해 2초마다 두 번 이상 분석 가져오기 응답을 호출하지 않는 것이 좋습니다.

제출 중인 문서에 대한 POST 요청 수에 제한이 있는 경우 요청 사이에 지연을 추가하는 것이 좋습니다. 워크로드에 더 높은 수준의 동시 처리가 필요한 경우 초당 트랜잭션에 대한 서비스 제한을 늘리기 위해 지원 요청을 만들어야 합니다.

일반적으로 프로덕션으로 이동하기 전에 워크로드 및 워크로드 패턴을 테스트하는 것이 좋습니다.

다음 단계

오류 코드 및 문제 해결에 대해 알아보기

다음을 통해 공유

서비스 할당량 및 제한

모델 사용

결제

사용자 지정 모델 사용

사용자 지정 모델 사용

사용자 지정 모델 사용

사용자 지정 모델 제한

자세한 설명, 할당량 조정 및 모범 사례

자동 크기 조정 중 제한을 완화하기 위한 일반적인 모범 사례

초당 트랜잭션 수 증가 요청 제한

필요한 정보 준비

지원 요청 만들기 및 제출

워크로드 패턴 모범 사례의 예

다음 단계

피드백

추가 리소스