Azure AI Search의 서비스 제한

스토리지, 워크로드 및 인덱스 및 기타 개체의 수량에 대한 최대 제한은 무료, 기본, 표준 또는 스토리지 최적화 가격 책정 계층에서 Azure AI Search를 프로비전하는지 여부에 따라 달라집니다.

  • 무료 는 Azure 구독과 함께 제공되는 다중 테넌트 공유 서비스입니다.

  • 기본은 프로덕션 워크로드 전용 컴퓨팅 리소스를 더 작은 규모로 제공하지만 일부 네트워킹 인프라를 다른 테넌트와 공유합니다.

  • 표준은 모든 수준에서 더 많은 스토리지 및 처리 용량을 갖춘 전용 머신에서 실행됩니다. 표준은 4가지 수준인 S1, S2, S3 및 S3 HD로 제공됩니다. S3 고밀도(S3 HD)는 다중 테넌트 및 대량의 작은 인덱스(서비스당 3,000개 인덱스)를 위해 엔지니어링됩니다. S3 HD는 인덱서 기능을 제공하지 않으며 데이터 수집은 원본에서 인덱스로 데이터를 푸시하는 API를 사용해야 합니다.

  • 스토리지 최적화는 표준보다 총 스토리지, 스토리지 대역폭 및 메모리가 더 많은 전용 머신에서 실행됩니다. 이 계층은 느리게 변경되는 대량 인덱스를 대상으로 합니다. 스토리지 최적화는 L1 및 L2의 두 가지 수준으로 제공됩니다.

구독 제한

각 계층에서 허용되는 최대 서비스 수까지 여러 청구 가능한 검색 서비스(기본 및 이상)를 만들 수 있습니다. 예를 들어, 기본 계층에 최대 16개의 서비스를 만들고, 동일한 구독 내의 S1 계층에 16개의 다른 서비스를 만들 수 있습니다. 계층에 대한 자세한 내용은 Azure AI Search에 대한 계층(또는 SKU) 선택을 참조하세요.

최대 서비스 제한은 요청 시 설정할 수 있습니다. 동일한 구독 내에서 더 많은 서비스가 필요한 경우 지원 요청을 제출합니다.

리소스 무료 1 기본 S1 S2 S3 S3 HD L1 L2
최대 서비스 1 16 16 8 6 6 6 6
SU(최대 검색 단위)2 해당 없음 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Azure 구독당 하나의 무료 검색 서비스를 사용할 수 있습니다. 무료 계층은 다른 고객과 공유하는 인프라를 기반으로 합니다. 하드웨어는 전용이 아니므로 확장이 지원되지 않으며 스토리지는 50MB로 제한됩니다.

2 SU(검색 단위)는 복제본(replica) 또는 파티션으로 할당된 청구 단위입니다. 둘 다 필요합니다. SU 조합에 대한 자세한 내용은 검색 서비스의 용량 추정 및 관리를 참조하세요.

서비스 제한

검색 서비스에는 최대 스토리지 제한(파티션 크기에 파티션 수 곱하기) 또는 인덱스 또는 인덱서의 최대 수에 대한 하드 제한이 적용됩니다.

리소스 무료 1 기본 1 S1 S2 S3 S3 HD L1 L2
SLA(서비스 수준 계약) 2
스토리지(파티션 크기) 50MB 3 2GB 25GB 100GB 200GB 200GB 1TB 2TB
파티션 해당 없음 1 12 12 12 3 12 12
복제본 해당 없음 3 12 12 12 12 12 12

1 기본에는 하나의 고정 파티션이 있습니다. 최대 3개의 검색 단위를 더 지정하여 더 큰 쿼리 볼륨 및 고가용성을 위한 복제본(replica) 추가할 수 있습니다.

2 서비스 수준 계약은 전용 리소스가 있는 청구 가능한 서비스에 적용됩니다. 무료 서비스 및 미리 보기 기능에는 SLA가 없습니다. 청구 가능한 서비스의 경우 서비스에 대한 충분한 중복성을 프로비전할 때 SLA가 적용됩니다. 쿼리(읽기) SLA에는 둘 이상의 복제본(replica) 필요합니다. 쿼리 및 인덱싱(읽기-쓰기) SLA에는 세 개 이상의 복제본이 필요합니다. 파티션 수는 SLA 고려 사항이 아닙니다. 복제본(replica) 고가용성에 대한 자세한 내용은 Azure AI Search의 안정성을 참조하세요.

3 무료 서비스에는 전용 파티션이 없습니다. 50MB 스토리지 제한은 다른 고객과 공유되는 인프라의 무료 검색 서비스에 할당된 최대 공간을 나타냅니다.

인덱스 제한

리소스 Free 기본 1 S1 S2 S3 S3 HD L1 L2
최대 인덱스 3 5 또는 15 50 200 200 파티션당 1000 또는 서비스당 3000 10 10
인덱스당 최대 단순 필드 2 1000 100 1000 1000 1000 1000 1000 1000
벡터 필드당 최대 차원 3072 3072 3072 3072 3072 3072 3072 3072
인덱스당 최대 복합 컬렉션 40 40 40 40 40 40 40 40
문서당 모든 복합 컬렉션에서 최대 요소 수 3 3000 3000 3000 3000 3000 3000 3000 3000
복합 필드의 최대 깊이 10 10 10 10 10 10 10 10
인덱스당 최대 제안기 1 1 1 1 1 1 1 1
인덱스당 최대 점수 매기기 프로필 100 100 100 100 100 100 100 100
프로필당 최대 함수 8 8 8 8 8 8 8 8

1 2017년 12월 이전에 만든 기본 서비스에는 인덱스에 대한 제한(15개 대신 5개)이 낮습니다. 기본 계층은 인덱스당 100개 필드 제한보다 더 낮은 SKU입니다.

2 필드의 상한에는 복합 컬렉션의 첫 번째 수준 필드와 중첩된 하위 필드가 모두 포함됩니다. 예를 들어 인덱스에 15개의 필드가 있고 각각 5개의 하위 필드가 있는 2개의 복합 컬렉션이 있는 경우 인덱스의 필드 수는 25입니다. 필드 컬렉션이 매우 큰 인덱스는 느릴 수 있습니다. 필드와 특성을 필요한 것으로 제한하고 인덱싱 및 쿼리 테스트를 실행하여 성능이 적합한지 확인합니다.

3 요소 수가 많으면 인덱스에 필요한 스토리지가 크게 증가하므로 요소에 대한 상한이 있습니다. 복합 컬렉션의 요소는 해당 컬렉션의 멤버로 정의됩니다. 예를 들어 객실 복합 컬렉션이 있는 호텔 문서를 가정하면 객실 컬렉션의 각 객실은 요소로 간주됩니다. 인덱싱 중에 인덱싱 엔진은 문서 전체에서 최대 3000개의 요소를 안전하게 처리할 수 있습니다. 이 제한 은 문자열 컬렉션이나 복합 필드에는 적용되지 않고 복잡한 컬렉션에만 도입 api-version=2019-05-06 되어 적용됩니다.

서비스가 더 강력한 클러스터에서 프로비전되는 경우 최대 제한에 다소 차이가 있을 수 있습니다. 여기서 제한은 공통 분모를 나타냅니다. 위의 사양에 따라 빌드된 인덱스는 모든 지역의 동등한 서비스 계층에서 이식 가능합니다.

문서 제한

Basic, S1, S2, S3, L1 및 L2 검색 서비스에서 인덱스당 약 240억 개의 문서를 가질 수 있습니다. S3 HD의 경우 제한은 인덱스당 20억 개 문서입니다. 복잡한 컬렉션의 각 인스턴스는 이러한 제한 측면에서 별도의 문서로 계산됩니다.

API 호출당 문서 크기 제한

인덱스 API를 호출할 때 최대 문서 크기는 약 16MB입니다.

문서 크기는 실제로 인덱스 API 요청 본문의 크기에 대한 제한입니다. 여러 문서를 포함하는 배치를 한꺼번에 인덱스 API에 전달할 수 있으므로 현실적으로 크기 제한은 배치에 포함된 문서 수에 따라 좌우됩니다. 단일 문서가 있는 일괄 처리의 경우 최대 문서 크기는 16MB의 JSON입니다.

문서 크기를 예측할 때는 검색 서비스에서 사용할 수 있는 필드만 고려해야 합니다. 원본 문서의 모든 이진 또는 이미지 데이터는 계산에서 생략해야 합니다.

벡터 인덱스 크기 제한

벡터 필드로 문서를 인덱싱할 때 Azure AI Search는 사용자가 제공하는 알고리즘 매개 변수를 사용하여 내부 벡터 인덱스를 생성합니다. 이러한 벡터 인덱스의 크기는 서비스의 계층(또는 SKU)에 대한 벡터 검색을 위해 예약된 메모리에 의해 제한됩니다.

서비스는 검색 서비스의 모든 파티션에 대해 벡터 인덱스 크기 할당량을 적용합니다. 각 추가 파티션은 사용 가능한 벡터 인덱스 크기 할당량을 증가합니다. 이 할당량은 서비스가 정상 상태가 되도록 하기 위한 하드 제한입니다기본 즉, 제한을 초과하면 추가 인덱싱 시도가 실패합니다. 일부 벡터 문서를 삭제하거나 파티션에서 확장하여 사용 가능한 할당량을 확보한 후 인덱싱을 다시 시작할 수 있습니다.

이 표에서는 서비스 계층(또는 SKU)의 파티션당 벡터 인덱스 크기 할당량에 대해 설명합니다. 컨텍스트의 경우 다음이 포함됩니다.

  • 각 계층에 대한 파티션 스토리지 제한은 컨텍스트에 대해 여기에서 반복됩니다.
  • 벡터 인덱스에 사용할 수 있는 각 파티션 크기(GB)입니다(인덱스에 벡터 필드를 추가할 때 생성됨).
  • 파티션당 대략적인 포함 수(부동 소수점 값)입니다.

GET /servicestats(Get Service Statistics API)를 사용하여 벡터 인덱스 크기 할당량을 검색합니다. 자세한 내용은 벡터 인덱스 크기에 대한 설명서를 참조하세요.

2023년 7월 1일 이전에 만든 서비스

계층 스토리지 할당량(GB) 파티션당 벡터 할당량(GB) 파티션당 부동 소수 자릿수(오버헤드 15% 가정)
기본 2 0.5 1억 1,500만 명
S1 25 1 2억 3,500만 명
S2 100 6 14억 명
S3 200 12 28억 명
L1 1,000 12 28억 명
L2 2,000 36 84억 명

지원되는 지역에서 2023년 7월 1일 이후에 생성된 서비스

Azure AI Search는 새로운 검색 서비스에 대해 전 세계적으로 증가된 벡터 인덱스 크기 제한을 출시하고 있지만 팀은 특정 지역에서 인프라 용량을 구축하고 있습니다. 아쉽게도 기존 서비스는 새 제한으로 마이그레이션할 수 없습니다.

다음 지역은 증가된 제한을 지원하지 않습니다 .

  • 독일 중서부
  • 인도 서부
  • 카타르 중부
계층 스토리지 할당량(GB) 파티션당 벡터 할당량(GB) 파티션당 부동 소수 자릿수(오버헤드 15% 가정)
기본 2 1 2억 3,500만 명
S1 25 3 7억 명
S2 100 12 28억 명
S3 200 36 84억 명
L1 1,000 12 28억 명
L2 2,000 36 84억 명

인덱서 제한

최대 실행 시간은 서비스에 대한 균형 및 안정성을 제공하기 위해 존재하지만 큰 데이터 세트는 최대 허용보다 많은 인덱싱 시간이 필요할 수 있습니다. 허용되는 최대 시간 내에 인덱싱 작업을 완료할 수 없는 경우 일정에 따라 실행해 보세요. 스케줄러는 인덱싱 상태 추적합니다. 어떤 이유로든 예약된 인덱싱 작업이 중단되면 인덱서는 다음 예약된 실행에서 마지막으로 중단된 위치를 선택할 수 있습니다.

리소스 무료 1 기본 2 S1 S2 S3 S3 HD 3 L1 L2
최대 인덱서 3 5 또는 15 50 200 200 해당 없음 10 10
최대 데이터 원본 3 5 또는 15 50 200 200 해당 없음 10 10
최대 기술 세트 4 3 5 또는 15 50 200 200 해당 없음 10 10
호출당 최대 인덱싱 부하 10,000개 문서 최대 문서로만 제한됨 최대 문서로만 제한됨 최대 문서로만 제한됨 최대 문서로만 제한됨 해당 없음 제한 없음 제한 없음
최소 일정 5분 5분 5분 5분 5분 5분 5분 5분
최대 실행 시간 5 1-3분 2시간 또는 24시간 2시간 또는 24시간 2시간 또는 24시간 2시간 또는 24시간 해당 없음 2시간 또는 24시간 2시간 또는 24시간
기술 세트 가 6인 인덱서의 최대 실행 시간 3-10분 2시간 2시간 2시간 2시간 해당 없음 2시간 2시간
Blob 인덱서: 최대 Blob 크기, MB 16 16 128 256 256 해당 없음 256 256
Blob 인덱서: Blob에서 추출된 콘텐츠의 최대 문자 32,000 64,000 400만 800만 1600만 해당 없음 400만 400만

1 무료 서비스에는 Blob 원본의 경우 3분, 다른 모든 데이터 원본의 경우 1분의 인덱서 최대 실행 시간이 있습니다. 인덱서 호출은 180초마다 한 번입니다. Azure AI 서비스를 호출하는 AI 인덱싱의 경우 무료 서비스는 하루에 인덱서당 20개의 무료 트랜잭션으로 제한됩니다. 여기서 트랜잭션은 보강 파이프라인을 성공적으로 통과하는 문서로 정의됩니다(팁: 인덱서를 다시 설정하여 개수를 다시 설정할 수 있음).

2017 년 12월 이전에 만든 기본 서비스 2개에는 인덱서, 데이터 원본 및 기술 세트에 대한 제한(15개 대신 5개)이 낮습니다.

3 개의 S3 HD 서비스에는 인덱서 지원이 포함되지 않습니다.

기술 세트당 최대 30개 기술 4 개.

5 인덱서에 대한 2시간 또는 24시간 최대 기간에 대해: 2시간 최대값이 가장 일반적이며 계획해야 합니다. 24시간 제한은 이전 인덱서 구현에서 가져옵니다. 24시간 동안 지속적으로 실행되는 예약되지 않은 인덱서가 있는 경우 해당 인덱서를 최신 인프라로 마이그레이션할 수 없기 때문입니다. 일반적으로 2시간 이내에 완료할 수 없는 인덱싱 작업의 경우 인덱서가 2시간 일정에 배치됩니다. 처음 2시간 간격이 완료되면 인덱서는 다음 2시간 간격을 시작할 때 중단된 위치를 선택합니다.

6 기술 세트 실행 및 특히 이미지 분석은 계산 집약적이며 사용 가능한 처리 능력의 불균형 양을 사용합니다. 이러한 워크로드에 대한 실행 시간이 단축되어 큐의 다른 작업을 더 많이 실행할 수 있습니다.

참고 항목

인덱스 제한명시된 대로 인덱서는 복잡한 형식()을 지원하는 최신 GA API 버전부터 문서당 모든 복합 컬렉션에 3,000개 요소의 상한을2019-05-06 적용합니다. 즉, 이전 API 버전으로 인덱서가 만들어진 경우 이 제한의 적용을 받지 않습니다. 최대 호환성을 유지하기 위해 이전 API 버전으로 만든 다음 API 버전 2019-05-06 이상으로 업데이트된 인덱서는 여전히 제한에서 제외됩니다. 고객은 앞에서 설명한 것처럼 매우 큰 복합 컬렉션을 사용하는 경우 부정적인 영향에 대해 알고 있어야 하며 최신 GA API 버전을 사용하여 새 인덱서를 만드는 것이 좋습니다.

인덱서는 공유 프라이빗 링크 리소스 API 통해 관리되는 프라이빗 엔드포인트를 통해 다른 Azure 리소스에 액세스할 수 있습니다. 이 섹션에서는 이 기능과 관련된 제한에 대해 설명합니다.

리소스 무료 Basic S1 S2 S3 S3 HD L1 L2
프라이빗 엔드포인트 인덱서 지원 없음
기술 세트가 있는 인덱서를 위한 프라이빗 엔드포인트 지원 1 아니요 없음 없음 없음
최대 프라이빗 엔드포인트 해당 없음 10 또는 30 100 400 400 해당 없음 20 20
최대 고유 리소스 종류2 해당 없음 4 7 15 15 해당 없음 4 4

1 AI 보강 및 이미지 분석은 계산 집약적이며 사용 가능한 처리 능력의 불균형한 양을 사용합니다. 이러한 이유로 검색 서비스 자체의 성능과 안정성을 보장하기 위해 하위 계층에서 프라이빗 연결을 사용하지 않도록 설정합니다.

2 고유한 리소스 형식 수는 리소스의 상태에 관계없이 지정된 검색 서비스에 대한 모든 공유 프라이빗 링크 리소스에서 사용되는 고유한 groupId 값의 수로 계산됩니다.

동의어 제한

동의어 맵의 최대 수는 계층에 따라 다릅니다. 각 규칙에는 확장이 동일한 용어인 최대 20개의 확장이 있을 수 있습니다. 예를 들어 "cat"가 지정된 경우 "kitty", "feline" 및 "felis"(고양이 속)와의 연결은 3개의 확장으로 간주됩니다.

리소스 무료 Basic S1 S2 S3 S3-HD L1 L2
최대 동의어 맵 3 3 5 10 20 20 10 10
맵당 최대 규칙 수 5000 20000 20000 20000 20000 20000 20000 20000

인덱스 별칭 제한

인덱스 별칭의 최대 수는 계층에 따라 다릅니다. 모든 계층에서 최대 별칭 수는 허용되는 최대 인덱스 수의 두 배입니다.

리소스 무료 Basic S1 S2 S3 S3-HD L1 L2
최대 별칭 6 10 또는 30 100 400 400 파티션당 2000 또는 서비스당 6000 20 20

데이터 제한(AI 보강)

엔터티 인식, 엔터티 연결, 핵심 구 추출, 감정 분석, 언어 감지 및 개인 정보 검색을 위해 Azure AI 언어 리소스를 호출하는 AI 보강 파이프라인은 데이터 제한의 적용을 받습니다. 레코드의 최대 크기는 String.Length에 의해 측정된 대로 50,000자여야 합니다. 감정 분석기에 데이터를 보내기 전에 데이터를 분리해야 하는 경우 텍스트 분할 기술을 사용합니다.

스로틀 제한

시스템이 최대 용량에 도달하면 API 요청이 제한됩니다. 제한은 다른 API에 대해 다르게 동작합니다. 쿼리 API(검색/제안/자동 완성) 및 인덱싱 API는 서비스의 부하에 따라 동적으로 제한됩니다. 인덱스 API 및 서비스 작업 API에는 정적 요청 속도 제한이 있습니다.

인덱스 관련 작업에 대한 정적 속도 요청 제한:

  • 인덱스 나열(GET /indexes): 검색 단위당 초당 3개
  • 인덱스 가져오기(GET /indexes/myindex): 검색 단위당 초당 10
  • 인덱스 만들기(POST /indexes): 검색 단위당 분당 12
  • 인덱스 만들기 또는 업데이트(PUT /indexes/myindex): 검색 단위당 초당 6개
  • 인덱스 삭제(DELETE /indexes/myindex): 검색 단위당 분당 12

서비스와 관련된 작업에 대한 정적 속도 요청 제한:

  • 서비스 통계(GET /servicestats): 검색 단위당 초당 4개

API 요청 제한

  • 요청 1당 최대 16MB
  • 최대 8KB URL 길이
  • 인덱스 업로드, 병합 또는 삭제 일괄 처리당 최대 1000개 문서
  • $orderby 절의 최대 32개 필드
  • 검색 절의 최대 100,000자
  • search의 최대 절 수(AND 또는 OR로 구분된 식)는 1024개입니다.
  • 최대 검색어 크기는 UTF-8로 인코딩된 텍스트의 32,766바이트(32KB - 2바이트)입니다.
  • 접두사 검색정규식 검색의 최대 검색어 크기는 1000자입니다.
  • Lucene에서 처리할 때 와일드카드 검색정규식 검색은 최대 1000개의 상태로 제한됩니다.

1 Azure AI Search에서 요청 본문은 16MB의 상한이 적용되며, 이론적 제한에 의해 제한되지 않는 개별 필드 또는 컬렉션의 내용에 실질적인 제한을 적용합니다(필드 구성 및 제한에 대한 자세한 내용은 지원되는 데이터 형식 참조).

바인딩되지 않은 쿼리는 검색 서비스를 불안정하게 만들 수 있으므로 쿼리 크기 및 컴퍼지션에 제한이 있습니다. 일반적으로 이러한 쿼리는 프로그래밍 방식으로 만들어집니다. 애플리케이션이 검색 쿼리를 프로그래밍 방식으로 생성하는 경우 쿼리가 제한 없는 크기로 생성되지 않도록 디자인하는 것이 좋습니다.

API 응답 제한

  • 검색 결과 페이지당 최대 1,000건의 문서가 반환됨
  • 제안 API 요청당 최대 100개 제안 반환

API 키 제한

API 키는 서비스 인증에 사용됩니다. 두 가지 유형이 있습니다. 관리 키는 요청 헤더에 지정되고 서비스에 대한 전체 읽기-쓰기 액세스 권한을 부여합니다. 쿼리 키는 읽기 전용이며 URL에 지정되며 일반적으로 클라이언트 애플리케이션에 배포됩니다.

  • 서비스당 최대 2개 관리 키
  • 서비스당 최대 50개 쿼리 키