Limites de serviço na Pesquisa de IA do Azure

2025-04-30

Os limites máximos de armazenamento, cargas de trabalho e quantidades de índices e outros objetos dependem da criação do Azure AI Search nos níveis de preços Gratuito, Básico, Standard ou Otimizado para Armazenamento .

Free é um serviço compartilhado multilocatário que vem com sua assinatura do Azure.
O Basic fornece recursos de computação dedicados para cargas de trabalho de produção em menor escala.
O padrão é executado em máquinas dedicadas com mais capacidade de armazenamento e processamento em todos os níveis. O padrão vem em quatro níveis: S1, S2, S3 e S3 HD. O S3 High Density (S3 HD) foi projetado para multilocação e grandes quantidades de pequenos índices (3.000 índices por serviço). O S3 HD não fornece o recurso de indexador e a ingestão de dados deve usar APIs que enviam dados da fonte para o índice.
O Storage Optimized é executado em máquinas dedicadas com mais armazenamento total, largura de banda de armazenamento e memória do que o Standard. Esta camada tem como alvo índices grandes e de mudança lenta. O Storage Optimized vem em dois níveis: L1 e L2.

Limites da subscrição

Você pode criar vários serviços de pesquisa faturáveis (básicos e superiores), até o número máximo de serviços permitidos em cada camada, por região. Por exemplo, você pode criar até 16 serviços na camada Basic e outros 16 serviços na camada S1 dentro da mesma assinatura e região. Em seguida, você pode criar 16 serviços básicos adicionais em outra região para um total combinado de 32 serviços básicos sob a mesma assinatura. Para obter mais informações sobre camadas, consulte Escolher uma camada (ou SKU) para o Azure AI Search.

Os limites máximos de serviço podem ser aumentados mediante solicitação. Se você precisar de mais serviços dentro da mesma assinatura, registre uma solicitação de suporte.

Recurso	Grátis ¹	Básica	S1	S2	S3	S3 HD	L1	L2
Máximo de serviços por região	1	16	16	8	6	6	6	6
Máximo de unidades de pesquisa (SU)²	N/A	3 Sistema Único	36 SU	36 SU	36 SU	36 SU	36 SU	36 unidades SU

1 Você pode ter um serviço de pesquisa gratuito por assinatura do Azure. O nível gratuito é baseado na infraestrutura compartilhada com outros clientes. Como o hardware não é dedicado, a expansão não é suportada e o armazenamento é limitado a 50 MB. Um serviço de pesquisa gratuito pode ser excluído após longos períodos de inatividade para abrir espaço para mais serviços.

2 As unidades de pesquisa (SU) são unidades de faturação, alocadas como uma réplica ou uma partição. Você precisa de ambos. Para saber mais sobre combinações de SU, consulte Estimar e gerenciar a capacidade de um serviço de pesquisa.

Limites de serviço

A tabela a seguir aborda SLA, contagens de partições e contagens de réplicas no nível de serviço.

Recurso	Gratuito	Básica	S1	S2	S3	S3 HD	L1	L2
Contrato de nível de serviço (SLA)	Não	Sim	Sim	Sim	Sim	Sim	Sim	Sim
Partições	N/A	^{3 1}	12	12	12	3	12	12
Réplicas	N/A	3	12	12	12	12	12	12

1 A camada básica suporta três partições e três réplicas, para um total de nove unidades de pesquisa (SU) em novos serviços de pesquisa criados após 3 de abril de 2024. Os serviços básicos mais antigos são limitados a uma partição e três réplicas.

Um serviço de pesquisa está sujeito a um limite máximo de armazenamento (tamanho da partição multiplicado pelo número de partições) ou a um limite rígido do número máximo de índices ou indexadores, o que ocorrer primeiro.

Os contratos de nível de serviço (SLAs) aplicam-se a serviços faturáveis que tenham duas ou mais réplicas para cargas de trabalho de consulta ou três ou mais réplicas para cargas de trabalho de consulta e indexação. O número de partições não é uma consideração de SLA. Para obter mais informações, consulte Confiabilidade na Pesquisa de IA do Azure.

Os serviços gratuitos não têm partições ou réplicas fixas e partilham recursos com outros subscritores.

Armazenamento de partições (GB)

Os limites de armazenamento por serviço variam em duas coisas: data de criação do serviço e região. Existem limites mais elevados para serviços mais recentes na maioria das regiões suportadas.

Esta tabela mostra a progressão dos aumentos da quota de armazenamento em GB ao longo do tempo. A partir de abril de 2024, partições de maior capacidade foram colocadas online nas regiões listadas nas notas de rodapé. Se você tiver um serviço mais antigo em uma região compatível, verifique se é possível atualizar seu serviço para os limites de armazenamento mais altos.

Data de criação do serviço	Básica	S1	S2	S3/HD	L1	L2
Antes de 3 de abril de 2024	2	25	100	200	1,024	2048
3 de abril de 2024 a 17 de maio de 2024 ¹	15	160	512	1,024	1,024	2048
Depois de 17 de maio de 2024 ²	15	160	512	1,024	2,048	4,096
Depois de 10 de fevereiro de 2025 ³	15	160	512	1,024	2048	4,096

¹ Armazenamento de maior capacidade para Basic, S1, S2, S3 nestas regiões. Américas: Brasil Sul, Canadá Central, Canadá Leste, Leste dos EUA, Leste dos EUA 2, Centro dos EUA, Norte-Central dos EUA, Centro-Sul dos EUA, Oeste dos EUA, Oeste dos EUA 2, Oeste dos EUA 3, Centro-Oeste dos EUA. Europa: France Central. Itália Norte, Norte da Europa, Noruega Leste, Polónia Central, Suíça Norte, Suécia Central, Reino Unido Sul, Reino Unido Oeste. Médio Oriente: Norte dos Emirados Árabes Unidos. África: África do Sul Norte. Ásia-Pacífico: Austrália Leste, Austrália Sudeste, Índia Central, Jio Índia Oeste, Ásia Oriental, Sudeste Asiático, Leste do Japão, Oeste do Japão, Coreia Central, Coreia do Sul.

2 Armazenamento de maior capacidade para L1 e L2. Mais regiões oferecem maior capacidade em todos os níveis faturáveis. Europa: Alemanha Norte, Alemanha Centro-Oeste, Suíça Oeste. Azure Government: Texas, Arizona, Virgínia. África: África do Sul Norte. Ásia-Pacífico: China Norte 3, China Leste 3.

3 Armazenamento de maior capacidade está disponível na Europa Ocidental.

Importante

Atualmente, limites de armazenamento mais altos não estão disponíveis nas seguintes regiões, que estão sujeitas aos limites anteriores a 3 de abril.

Israel Central
Catar Central
Espanha Central
Sul da Índia

Limites de índice

Recurso	Gratuito	Básico ¹	S1	S2	S3	S3 HD	L1	L2
Índices máximos	3	5 ou 15	50	200	200	1000 por partição ou 3000 por serviço	10	10
Máximo de campos simples por índice ²	1000	100	1000	1000	1000	1000	1000	1000
Dimensões máximas por campo vetorial	4096	4096	4096	4096	4096	4096	4096	4096
Máximo de coleções complexas por índice	40	40	40	40	40	40	40	40
Máximo de elementos em todas as coleções complexas por documento ³	3000	3000	3000	3000	3000	3000	3000	3000
Profundidade máxima de campos complexos	10	10	10	10	10	10	10	10
Máximo sugeridores por índice	1	1	1	1	1	1	1	1
Perfis de pontuação máxima por índice	100	100	100	100	100	100	100	100
Configurações semânticas máximas por índice	100	100	100	100	100	100	100	100
Máximo de funções por perfil	8	8	8	8	8	8	8	8
Tamanho máximo do índice ⁴	N/A	N/A	N/A	1,88 TB	2,34 TB	100 GB	N/A	N/A

1 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) nos índices. A camada básica é a única camada com um limite inferior de 100 campos por índice.

² O limite máximo de campos inclui campos de nível principal e subcampos aninhados numa coleção complexa. Por exemplo, se um índice contiver 15 campos e tiver duas coleções complexas com cinco subcampos cada, a contagem de campos do índice será 25. Os índices com uma coleção de campos muito grande podem ser lentos. Limite campos e atributos apenas àqueles de que você precisa e execute indexação e teste de consulta para garantir que o desempenho seja aceitável.

3 Existe um limite superior para elementos porque ter um grande número deles aumenta significativamente o armazenamento necessário para o seu índice. Um elemento de uma coleção complexa é definido como um membro dessa coleção. Por exemplo, suponha um documento de Hotel com uma coleção complexa de Quartos, em que cada quarto da coleção Quartos é considerado um elemento. Durante a indexação, o mecanismo de indexação pode processar com segurança um máximo de 3.000 elementos no documento como um todo. Este limite foi introduzido em api-version=2019-05-06 e aplica-se apenas a coleções complexas, e não a coleções de cadeias ou campos complexos.

⁴ Para a maioria dos níveis, o tamanho máximo do índice é o armazenamento total disponível no serviço de pesquisa. Para serviços S2, S3 e S3 HD com várias partições e, portanto, mais armazenamento, o tamanho máximo de um único índice é fornecido na tabela. Aplica-se a serviços de pesquisa criados após 3 de abril de 2024.

Você pode encontrar alguma variação nos limites máximos se o serviço for provisionado em um cluster mais poderoso. Os limites aqui representam o denominador comum. Os índices criados de acordo com as especificações acima são portáteis em níveis de serviço equivalentes em qualquer região.

Limites de documentos

O número máximo de documentos por índice é:

24 mil milhões em Basic, S1, S2, S3
2 mil milhões no S3 HD
288 mil milhões em L1
576 mil milhões em L2

O tamanho máximo de cada documento é de aproximadamente 16 megabytes. O tamanho do documento é, na verdade, um limite no tamanho da carga útil da solicitação da API de indexação, que é de 16 megabytes. Essa carga pode ser um único documento ou um lote de documentos. Para um lote com um único documento, o tamanho máximo do documento é de 16 MB de JSON.

O tamanho do documento aplica-se à indexação no modo push que carrega documentos para um serviço de pesquisa. Se você estiver usando um indexador para indexação em modo pull, seus arquivos de origem podem ser de qualquer tamanho de arquivo, sujeitos aos limites do indexador. Para o indexador de blob, os limites de tamanho de arquivo são maiores para camadas mais altas. Por exemplo, o limite S1 é de 128 megabytes, o limite S2 é de 256 megabytes e assim por diante.

Ao estimar o tamanho do documento, lembre-se de indexar apenas os campos que agregam valor aos cenários de pesquisa e excluir quaisquer campos de origem que não tenham finalidade nas consultas que você pretende executar.

Limites de tamanho do índice vetorial

Quando você indexa documentos com campos vetoriais, o Azure AI Search constrói índices vetoriais internos usando os parâmetros de algoritmo fornecidos. O tamanho destes índices vetoriais é limitado pela memória reservada para pesquisa vetorial no nível de serviço (ou SKU) do seu serviço. Para obter orientações sobre como gerenciar e maximizar o armazenamento vetorial, consulte Tamanho do índice vetorial e permanecer abaixo dos limites.

Os limites vetoriais variam por:

Limites vetoriais mais altos a partir de abril de 2024 existem em novos serviços de busca em regiões que fornecem a capacidade extra, que é a maioria deles. Se você tiver um serviço mais antigo em uma região compatível, verifique se é possível atualizar seu serviço para os limites vetoriais mais altos.

Esta tabela mostra a progressão dos aumentos de cota vetorial em GB ao longo do tempo. A cota é por partição, portanto, se você dimensionar um novo serviço Standard (S1) para 6 partições, a cota vetorial total será 35 multiplicada por 6.

Data de criação do serviço	Básica	S1	S2	S3/HD	L1	L2
Antes de 1 de julho de 2023¹	0,5	1	6	12	12	36
1 de julho de 2023 a 3 de abril de 2024²	1	3	12	36	12	36
3 de abril de 2024 a 17 de maio de 2024³	5	35	150	300	12	36
Depois de 17 de maio de 2024⁴	5	35	150	300	150	300

1 Limites vetoriais iniciais durante a pré-visualização.

² Limites vetoriais durante o período de pré-visualização final. Três regiões não tinham os limites mais altos: Alemanha Centro-Oeste, Índia Ocidental, Qatar Central.

³ Quota vetorial mais elevada com base nas partições maiores para as camadas e regiões suportadas.

4 Cota vetorial aumentada para mais níveis e regiões com base nas atualizações do tamanho da partição.

O serviço impõe uma cota de tamanho de índice vetorial para cada partição em seu serviço de pesquisa. Cada partição extra aumenta a cota de tamanho do índice vetorial disponível. Essa cota é um limite rígido para garantir que seu serviço permaneça íntegro, o que significa que novas tentativas de indexação quando o limite é excedido resultam em falha. Você pode retomar a indexação depois de liberar a cota disponível excluindo alguns documentos vetoriais ou aumentando a escala em partições.

Importante

Limites vetoriais mais altos estão vinculados a tamanhos de partição maiores. Atualmente, limites vetoriais mais altos não estão disponíveis nas seguintes regiões, que estão sujeitas aos limites de julho a abril.

Israel Central
Catar Central
Espanha Central
Sul da Índia

Limites do indexador

Os tempos de execução máximos existem para proporcionar equilíbrio e estabilidade ao serviço como um todo, mas conjuntos de dados maiores podem precisar de mais tempo de indexação do que o máximo permite. Se um trabalho de indexação não puder ser concluído dentro do tempo máximo permitido, tente executá-lo em um cronograma. O agendador acompanha o status da indexação. Se um trabalho de indexação agendado for interrompido por qualquer motivo, o indexador poderá continuar de onde parou pela última vez na próxima execução agendada.

Recurso	Grátis ¹	Básico ²	S1	S2	S3	S3 HD ³	L1	L2
Indexadores máximos	3	5 ou 15	50	200	200	N/A	10	10
Máximo de fontes de dados	3	5 ou 15	50	200	200	N/A	10	10
Máximo de ^{4 conjuntos de competências}	3	5 ou 15	50	200	200	N/A	10	10
Carga máxima de indexação por invocação	10 000 documentos	Apenas limitado ao número máximo de documentos.	Apenas limitado ao número máximo de documentos.	Apenas limitado ao número máximo de documentos.	Apenas limitado ao número máximo de documentos.	N/A	Sem limite	Sem limite
Horário mínimo	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos	5 minutos
Tempo ^{máximo de execução 5}	1-3 ou 3-10 minutos	2 ou 24 horas	2 ou 24 horas	2 ou 24 horas	2 ou 24 horas	N/A	2 ou 24 horas	2 ou 24 horas
Indexador de blob: tamanho máximo de blob, megabytes	16	16	128	256	256	N/A	256	256
Indexador de blob: máximo de caracteres de conteúdo extraído de um blob ⁶	32,000	64,000	4 milhões	8 milhões	16 milhões	N/A	4 milhões	4 milhões

1 Os serviços gratuitos têm um tempo máximo de execução do indexador de 3 minutos para fontes de blob e 1 minuto para todas as outras fontes de dados. A invocação do indexador é feita uma vez a cada 180 segundos. Para indexação de IA que chama os serviços de IA do Azure, os serviços gratuitos são limitados a 20 transações gratuitas por indexador por dia, sendo que uma transação é definida como um documento que passa com êxito pelo pipeline de enriquecimento (dica: pode-se redefinir um indexador para redefinir o seu número de transações).

2 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) para indexadores, fontes de dados e conjuntos de competências.

3 Os serviços S3 HD não incluem suporte a indexadores.

4 Máximo de 30 competências por conjunto de competências.

⁵ Em relação à duração máxima de 2 ou 24 horas para indexadores: um máximo de 2 horas é o mais comum e é o que deves planear. Refere-se a indexadores que são executados no ambiente público, usados para descarregar o processamento computacionalmente intensivo e deixar mais recursos para consultas. O limite de 24 horas se aplica se você configurar o indexador para ser executado em um ambiente privado usando apenas a infraestrutura alocada ao seu serviço de pesquisa. Observe que alguns indexadores mais antigos são incapazes de serem executados no ambiente público, e esses indexadores sempre têm um intervalo de processamento de 24 horas. Se você tiver indexadores não agendados que são executados continuamente por 24 horas, pode presumir que esses indexadores não puderam ser migrados para a infraestrutura mais recente. Como regra geral, para trabalhos de indexação que não podem terminar dentro de duas horas, coloque o indexador em um cronograma de 5 minutos para que o indexador possa retomar rapidamente de onde parou. No nível Gratuito, o tempo máximo de execução de 3 a 10 minutos destina-se a indexadores com competências específicas.

6 O número máximo de caracteres é baseado em unidades de código Unicode, especificamente UTF-16.

Nota

Conforme indicado nos limites do índice, os indexadores também aplicarão o limite superior de 3000 elementos em todas as coleções complexas por documento, começando com a versão mais recente da API do GA que suporta tipos complexos (2019-05-06) em diante. Isso significa que, se você criou seu indexador com uma versão anterior da API, não estará sujeito a esse limite. Para preservar a compatibilidade máxima, um indexador que foi criado com uma versão anterior da API e, em seguida, atualizado com uma versão 2019-05-06 da API ou posterior, ainda será excluído dos limites. Os clientes devem estar cientes do impacto adverso de ter coleções complexas muito grandes (como dito anteriormente) e é altamente recomendável criar novos indexadores com a versão mais recente da API GA.

Limites de recursos de links privados compartilhados

Os indexadores podem aceder a outros recursos do Azure sobre pontos finais privados geridos através da API de recurso de ligação privada partilhada. Esta seção descreve os limites associados a esse recurso.

Recurso	Gratuito	Básica	S1	S2	S3	S3 HD	L1	L2
Suporte ao indexador de ponto de extremidade privado	Não	Sim	Sim	Sim	Sim	Não	Sim	Sim
Suporte de ponto final privado para indexadores com um conjunto de aptidões ¹	Não	Não	Sim	Sim	Sim	Não	Sim	Sim
Suporte de endpoint privado para conjuntos de habilidades com uma habilidade de incorporação ²	Não	Sim	Sim	Sim	Sim	Não	Sim	Sim
Máximo de pontos finais privados	N/A	10 ou 30	100	400	400	N/A	20	20
Máximo de tipos de recursos distintos ³	N/A	4	7	15	15	N/A	4	4

1 O enriquecimento da IA e a análise de imagens são computacionalmente intensivos e consomem quantidades desproporcionadas de poder de processamento disponível. Por esse motivo, as conexões privadas são desativadas em níveis mais baixos para garantir o desempenho e a estabilidade do próprio serviço de pesquisa. Nos serviços básicos, as conexões privadas com um recurso multisserviço de serviços de IA do Azure não são suportadas para preservar a estabilidade do serviço. Para a camada S1, verifique se o serviço foi criado com limites mais altos após 3 de abril de 2024.

² As conexões privadas com um modelo de incorporação são suportadas nos serviços de pesquisa de alta capacidade Basic e S1 criados após 3 de abril de 2024, com os limites mais altos para armazenamento e processamento computacional.

3 O número de tipos de recursos distintos é calculado como o número de valores únicos groupId utilizados em todos os recursos de ligação privada partilhada para um determinado serviço de pesquisa, independentemente do estado do recurso.

Limites de sinónimos

O número máximo de mapas de sinónimos varia consoante o nível. Cada regra pode ter até 20 expansões, onde uma expansão é um termo equivalente. Por exemplo, dado "gato", a associação com "gatinho", "felino" e "felis" (o género para gatos) contaria como 3 expansões.

Recurso	Gratuito	Básica	S1	S2	S3	S3-HD	L1	L2
Mapas de sinónimos máximos	3	3	5	10	20	20	10	10
Número máximo de regras por mapa	5 000	20 000	20 000	20 000	20 000	20 000	20 000	20 000

Limites de alias de índice

O número máximo de aliases de índice varia de acordo com a camada e a data de criação do serviço. Em todas as camadas, se o serviço tiver sido criado após outubro de 2022, o número máximo de aliases é o dobro do número máximo de índices permitidos. Se o serviço foi criado antes de outubro de 2022, o limite é o número de índices permitidos.

Data de criação do serviço	Gratuito	Básica	S1	S2	S3	S3-HD	L1	L2
Antes de outubro de 2022	3	5 ou 15 ¹	50	200	200	1000 por partição ou 3000 por serviço	10	10
Depois de outubro de 2022	6	30	100	400	400	2000 por partição ou 6000 por serviço	20	20

1 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) nos índices

Limites de dados (enriquecimento de IA)

Um pipeline de enriquecimento de IA que faz chamadas para um recurso da Linguagem de IA do Azure para reconhecimento de entidade, vinculação de entidade, extração de frases-chave, análise de sentimento, deteção de idioma e deteção de informações pessoais está sujeito a limites de dados. O tamanho máximo de um registo deve ser de 50 000 carateres, medido por String.Length. Se precisa dividir os seus dados antes de os enviar para o analisador de sentimentos, utilize a habilidade Divisão de Texto.

Limites de limitação

As solicitações de API são limitadas à medida que o sistema se aproxima da capacidade máxima. O controlo de largura de banda comporta-se de forma diferente para distintas APIs. As APIs de consulta (Pesquisa/Sugestão/Autocompletar) e as APIs de indexação são ajustadas dinamicamente com base na carga de serviço. As APIs de índice e a API de operações de serviço têm limites de taxa de solicitação estática.

Limites de solicitação de taxa estática para operações relacionadas a um índice:

Listar índices (GET /indexes): 3 por segundo por unidade de pesquisa
Obter índice (GET /indexes/myindex): 10 por segundo por unidade de pesquisa
Criar índice (POST /indexes): 12 por minuto por unidade de pesquisa
Criar ou atualizar índice (PUT /indexes/myindex): 6 por segundo por unidade de pesquisa
Excluir índice (DELETE /indexes/myindex): 12 por minuto por unidade de pesquisa

Limites de solicitação de taxa estática para operações relacionadas a um serviço:

Estatísticas de serviço (GET /servicestats): 4 por segundo por unidade de pesquisa

Limites de restrição semântica do algoritmo de classificação

O classificador semântico usa um sistema de enfileiramento para gerenciar solicitações simultâneas. Este sistema permite que os serviços de pesquisa obtenham o maior número possível de consultas por segundo. Quando o limite de solicitações simultâneas é atingido, solicitações adicionais são colocadas em uma fila. Se a fila estiver cheia, outras solicitações serão rejeitadas e deverão ser repetidas.

O total de consultas do classificador semântico por segundo varia com base nos seguintes fatores:

O nível do serviço de pesquisa. A capacidade da fila e os limites de solicitação simultânea variam de acordo com a camada.
O número de unidades de pesquisa utilizadas no serviço de pesquisa. A maneira mais simples de aumentar o número máximo de consultas simultâneas de classificação semântica é adicionar mais unidades de pesquisa ao seu serviço de pesquisa.
A capacidade total disponível do classificador semântico na região.
A quantidade de tempo que leva para servir uma consulta usando o classificador semântico. Isso varia de acordo com o quão ocupado o serviço de pesquisa está.

A tabela a seguir descreve os limites de restrição do ranker semântico por nível, conforme a capacidade disponível na região. Você pode entrar em contato com o suporte da Microsoft para solicitar um aumento de limite.

Recurso	Básica	S1	S2	S3	S3-HD	L1	L2
Máximo de solicitações simultâneas (por unidade de pesquisa)	2	3	4	4	4	4	4
Tamanho máximo da fila de solicitações (por unidade de pesquisa)	4	6	8	8	8	8	8

Limites de solicitação de API

Existem limites para consultas porque consultas ilimitadas podem desestabilizar seu serviço de pesquisa. Normalmente, essas consultas são criadas programaticamente. Se seu aplicativo gera consultas de pesquisa programaticamente, recomendamos projetá-lo de tal forma que não gere consultas de tamanho ilimitado.

Existem limites de carga por motivos semelhantes, assegurando a estabilidade do seu serviço de pesquisa. O limite aplica-se a todo o pedido, incluindo todos os seus componentes. Por exemplo, se a solicitação agrupar vários documentos ou comandos, toda a solicitação deverá caber dentro do limite suportado.

Se tiver de exceder um limite suportado, deve testar a sua carga de trabalho para saber o que esperar.

Exceto onde indicado, as seguintes solicitações de API se aplicam a todas as interfaces programáveis, incluindo os SDKs do Azure.

Geral:

O limite máximo de carga útil suportado é de 16 MB para indexação e solicitação de consulta via API REST e SDKs.
Comprimento máximo de URL de 8 KB (aplica-se apenas a APIs REST).

APIs de indexação:

Suporta no máximo 1.000 documentos por lote de carregamentos, mesclagens ou exclusões de índice.

APIs de consulta:

Máximo de 10 campos em uma consulta vetorial
No máximo 32 campos na cláusula $orderby.
Máximo de 100.000 caracteres em uma cláusula de pesquisa.
O número máximo de cláusulas na pesquisa é de 3.000.
Limites máximos para consultas de caracteres especiais e expressões regulares, conforme imposto por Lucene. Ele limita o número de padrões, variações ou correspondências a 1.000 instâncias. Este limite está em vigor para evitar sobrecarga do motor.

Termos de pesquisa:

O tamanho máximo do termo de pesquisa suportado é de 32.766 bytes (32 KB menos 2 bytes) de texto codificado em UTF-8. Aplica-se à pesquisa por palavra-chave e à propriedade "text" da pesquisa vetorial.
O tamanho máximo de um termo de pesquisa suportado é de 1.000 caracteres para pesquisa de prefixo e regex.

Limites de resposta da API

Máximo de 1.000 documentos retornados por página de resultados da pesquisa
Máximo de 100 sugestões retornadas por solicitação de API de sugestão

O mecanismo de pesquisa retorna 50 resultados por padrão, mas você pode substituir esse parâmetro até o limite máximo.

Limites de chave da API

As chaves de API são usadas para autenticação de serviço. Existem dois tipos. As chaves de administrador são especificadas no cabeçalho da solicitação e concedem acesso total de leitura e gravação ao serviço. As chaves de consulta são somente leitura, especificadas na URL e normalmente distribuídas para aplicativos cliente.

Máximo de 2 chaves de administração por serviço
Máximo de 50 chaves de consulta por serviço