Limites de serviço no Azure Cognitive Search

Os limites máximos de armazenamento, cargas de trabalho e quantidades de índices e outros objetos dependem de se você fornece Azure Cognitive Search nos níveis de preços otimizados gratuitos, básicos, padrão ou de armazenamento otimizados.

  • Free é um serviço partilhado multi-inquilino que vem com a sua assinatura Azure.

  • A Basic fornece recursos computamento dedicados para cargas de trabalho de produção em menor escala, mas partilha algumas infraestruturas de networking com outros inquilinos.

  • A norma funciona em máquinas dedicadas com mais capacidade de armazenamento e processamento a todos os níveis. O padrão vem em quatro níveis: S1, S2, S3 e S3 HD. S3 High Density (S3 HD) é projetado para multi-arrendamento e grandes quantidades de pequenos índices (três mil índices por serviço). O S3 HD não fornece a funcionalidade do indexante e a ingestão de dados deve alavancar as APIs que empurram os dados da fonte para o índice.

  • Armazenamento Otimizado funciona em máquinas dedicadas com mais armazenamento total, largura de banda de armazenamento e memória do que o Standard. Este nível tem como alvo índices grandes e em mudança lenta. Armazenamento Otimizado vem em dois níveis: L1 e L2.

Limites da subscrição

Pode criar vários serviços, limitados apenas pelo número de serviços permitidos em cada nível. Por exemplo, pode criar até 16 serviços no nível Básico e outros 16 no nível S1 dentro da mesma subscrição. Para obter mais informações sobre os níveis, consulte Escolha um SKU ou um nível para Azure Cognitive Search.

Os limites máximos de serviço podem ser aumentados mediante solicitação. Se precisar de mais serviços dentro da mesma subscrição, apresente um pedido de apoio.

Recurso Grátis1 Básica S1 S2 S3 S3 HD L1 L2
Serviços máximos 1 16 16 8 6 6 6 6
Escala máxima nas unidades de busca (SU)2 N/D 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 O Free é baseado em infraestruturas partilhadas com outros clientes. Como o hardware não é dedicado, a escala não é suportada no nível livre.

2 As unidades de busca são unidades de faturação, atribuídas como uma réplica ou uma divisória. Precisa de ambos os recursos para armazenamento, indexação e operações de consulta. Para saber mais sobre os cálculos de SU, consulte os níveis de recursos de escala para consultas e cargas de trabalho de índice.

Limites de armazenamento

Um serviço de pesquisa é limitado pelo espaço do disco ou por um limite rígido no número máximo de índices ou indexadores, o que vier primeiro. Os seguintes limites de armazenamento de documentos de mesa. Para obter limites máximos de objetos, consulte limites por recurso.

Recurso Gratuito Básico1 S1 S2 S3 S3 HD L1 L2
Contrato de nível de serviço (SLA)2 No Yes Yes Yes Yes Yes Yes Yes
Armazenamento por partição 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partições por serviço N/D 1 12 12 12 3 12 12
Tamanho da partição N/D 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Réplicas N/D 3 12 12 12 12 12 12

1 Básico tem uma divisória fixa. Unidades de pesquisa adicionais podem ser usadas para adicionar réplicas para volumes de consulta maiores.

2 Os contratos de nível de serviço estão em vigor para serviços faturados em recursos dedicados. Os serviços gratuitos e as funcionalidades de pré-visualização não têm SLA. Para serviços de faturação, as SLAs fazem efeito quando prestam despedimentos suficientes para o seu serviço. São necessárias duas ou mais réplicas para consulta (ler) SLAs. São necessárias três ou mais réplicas para consultas e indexação (ler-escrever) SLAs. O número de divisórias não é uma consideração de SLA.

Limites de índice

Recurso Gratuito Básico 1 S1 S2 S3 S3 HD L1 L2
Índices máximos 3 5 ou 15 50 200 200 1000 por partição ou 3000 por serviço 10 10
Máximo de campos simples por índice 2 1000 100 1000 1000 1000 1000 1000 1000
Coleções complexas máximas por índice 40 40 40 40 40 40 40 40
Elementos máximos em todas as coleções complexas por documento 3 3.000 3.000 3.000 3.000 3.000 3.000 3.000 3.000
Profundidade máxima de campos complexos 10 10 10 10 10 10 10 10
Indicadores máximos por índice 1 1 1 1 1 1 1 1
Perfis de pontuação máxima por índice 100 100 100 100 100 100 100 100
Funções máximas por perfil 8 8 8 8 8 8 8 8

1 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) nos índices. O nível básico é o único SKU com um limite inferior de 100 campos por índice.

2 O limite superior dos campos inclui campos de primeiro nível e subcampos aninhados numa coleção complexa. Por exemplo, se um índice contiver 15 campos e tiver duas coleções complexas com 5 subcampos cada, a contagem de campo do seu índice é de 25. Os índices com uma coleção de campos muito grandes podem ser lentos. Limite os campos e atributos a apenas aqueles que você precisa, e executar teste de indexação e consulta para garantir que o desempenho é aceitável.

3 Existe um limite superior para os elementos porque ter um grande número deles aumenta significativamente o armazenamento necessário para o seu índice. Um elemento de uma coleção complexa é definido como um membro dessa coleção. Por exemplo, assuma um documento de hotel com uma coleção complexa de quartos, cada quarto na coleção de quartos é considerado um elemento. Durante a indexação, o motor de indexação pode processar com segurança um máximo de 3000 elementos em todo o documento como um todo. Este limite foi introduzido api-version=2019-05-06 e aplica-se apenas a coleções complexas, e não a coleções de cordas ou a campos complexos.

Você pode encontrar alguma variação nos limites máximos se o seu serviço for ateado em um cluster mais poderoso. Os limites aqui representam o denominador comum. Os índices construídos de acordo com as especificações acima serão portáteis em níveis de serviço equivalentes em qualquer região.

Limites de documentos

Já não existem limites de documentos por serviço em Azure Cognitive Search, no entanto, existe um limite de aproximadamente 24 mil milhões de documentos por índice nos serviços de pesquisa Básico, S1, S2, S3, L1 e L2. Para o S3 HD, o limite é de 2 mil milhões de documentos por índice. Cada elemento de uma coleção complexa conta como um documento separado em termos destes limites.

Limites de tamanho do documento por chamada API

O tamanho máximo do documento quando se chama API de índice é de aproximadamente 16 megabytes.

O tamanho do documento é, na verdade, um limite para o tamanho do corpo de pedido da API index. Uma vez que pode passar um lote de vários documentos para a API de índice de uma só vez, o limite de tamanho depende realisticamente de quantos documentos estão no lote. Para um lote com um único documento, o tamanho máximo do documento é de 16 MB de JSON.

Ao estimar o tamanho do documento, lembre-se de considerar apenas os campos que podem ser consumidos por um serviço de pesquisa. Quaisquer dados binários ou de imagem nos documentos de origem devem ser omitidos dos seus cálculos.

Limites de indexante

Os tempos de execução máximos existem para proporcionar equilíbrio e estabilidade ao serviço como um todo, mas conjuntos de dados maiores podem precisar de mais tempo de indexação do que o máximo permite. Se um trabalho de indexação não puder ser concluído dentro do tempo máximo permitido, tente executá-lo em um horário. O agendador acompanha o estado de indexação. Se um trabalho de indexação programado for interrompido por qualquer motivo, o indexante pode retomar onde ficou pela última vez na próxima corrida programada.

Recurso Grátis 1 Básico 2 S1 S2 S3 S3 HD 3 L1 L2
Indexadores máximos 3 5 ou 15 50 200 200 N/D 10 10
Origens de dados máximas 3 5 ou 15 50 200 200 N/D 10 10
Competências máximas 4 3 5 ou 15 50 200 200 N/D 10 10
Carga máxima de indexação por invocação 10.000 documentos Limitado apenas por documentos máximos Limitado apenas por documentos máximos Limitado apenas por documentos máximos Limitado apenas por documentos máximos N/D Sem limite Sem limite
Horário mínimo 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos
Tempo máximo de execução 6 1-3 minutos 2 ou 24 horas 2 ou 24 horas 2 ou 24 horas 2 ou 24 horas N/D 2 ou 24 horas 2 ou 24 horas
Tempo máximo de execução para indexadores com um skillset 5 3-10 minutos Duas horas Duas horas Duas horas Duas horas N/D Duas horas Duas horas
Indexador blob: tamanho máximo de bolha, MB 16 16 128 256 256 N/D 256 256
Indexador blob: caracteres máximos de conteúdo extraído de uma bolha 32,000 64,000 4 milhões 8 milhões 16 milhões N/D 4 milhões 4 milhões

1 Os serviços gratuitos têm um tempo máximo de execução indexante de 3 minutos para fontes blob e 1 minuto para todas as outras fontes de dados. A invocação do indexante é uma vez a cada 180 segundos. Para a indexação da IA que liga para os Serviços Cognitivos, os serviços gratuitos estão limitados a 20 transações gratuitas por indexante por dia, onde uma transação é definida como um documento que passa com sucesso através do pipeline de enriquecimento (dica: pode redefinir um indexante para redefinir a sua contagem).

2 Os serviços básicos criados antes de dezembro de 2017 têm limites mais baixos (5 em vez de 15) em indexadores, fontes de dados e skillsets.

3 Os serviços S3 HD não incluem suporte indexante.

4 Máximo de 30 habilidades por skillset.

5 O enriquecimento e a análise de imagem da IA são computacionalmente intensivos e consomem quantidades desproporcionadas de poder de processamento disponível. O tempo de funcionamento destas cargas de trabalho foi encurtado para dar a outros empregos na fila mais oportunidades de funcionamento.

6 O tempo máximo de execução do Indexer para o nível básico ou superior pode ser de 2 ou 24 horas, dependendo dos recursos do sistema, implementação do produto e outros fatores.

Nota

Conforme indicado nos limites do Índice, os indexantes também aplicarão o limite superior de 3000 elementos em todas as coleções complexas por documento, começando com a versão mais recente da API ga que suporta tipos complexos (2019-05-06) em diante. Isto significa que se criou o seu indexante com uma versão API anterior, não estará sujeito a este limite. Para preservar a compatibilidade máxima, um indexante que foi criado com uma versão API anterior e depois atualizado com uma versão 2019-05-06 API ou posterior, continuará a ser excluído dos limites. Os clientes devem estar cientes do impacto adverso de ter coleções complexas muito grandes (como indicado anteriormente) e recomendamos vivamente a criação de novos indexantes com a versão api mais recente da GA.

Os indexantes podem aceder a outros recursos Azure através de pontos finais privados geridos através do recurso de ligação privada partilhada API. Esta secção descreve os limites associados a esta capacidade.

Recurso Gratuito Básico S1 S2 S3 S3 HD L1 L2
Suporte do indexador de pontos finais privados No Yes Yes Yes Yes No Yes Yes
Suporte de ponto final privado para indexadores com um skillset1 No No No Yes Yes No Yes Yes
Pontos finais máximos privados N/D 10 ou 30 100 400 400 N/D 20 20
Máximo distinto de recursos2 N/D 4 7 15 15 N/D 4 4

1 O enriquecimento e análise de imagem da IA são computacionalmente intensivos e consomem quantidades desproporcionadas de poder de processamento disponível. Por esta razão, as ligações privadas são desativadas em níveis inferiores para evitar um impacto adverso no desempenho e estabilidade do próprio serviço de pesquisa.

2 O número de tipos de recursos distintos é calculado como o número de valores únicos groupId utilizados em todos os recursos de ligação privada partilhada para um determinado serviço de pesquisa, independentemente do estado do recurso.

Limites de sinônio

O número máximo de mapas de sinónimo varia por nível. Cada regra pode ter até 20 expansões, onde uma expansão é um termo equivalente. Por exemplo, dado "gato", associação com "gatinho", "felino" e "felis" (o género para gatos) contaria como 3 expansões.

Recurso Gratuito Básico S1 S2 S3 S3-HD L1 L2
Mapas máximos de sinónimo 3 3 5 10 20 20 10 10
Número máximo de regras por mapa 5000 20 000 20 000 20 000 20 000 20 000 20 000 20 000

Limites de pseudónimos de índice

O número máximo de pseudónimos de índice varia por nível. Em todos os níveis, o número máximo de pseudónimos é o dobro do número máximo de índices permitidos.

Recurso Gratuito Básico S1 S2 S3 S3-HD L1 L2
Pseudónimos máximos 6 10 ou 30 100 400 400 2000 por partição ou 6000 por serviço 20 20

Limites de dados (enriquecimento de IA)

Um oleoduto de enriquecimento de IA que faz chamadas para a Azure Cognitive Services for Language resource for entity recognition, entity linking, key phrase extraction, sentiment analysis, language detection, and personal-information detection is subjected to data limits. O tamanho máximo de um disco deve ser de 50.000 caracteres medido por String.Length. Se precisar de separar os seus dados antes de os enviar para o analisador de sentimentos, utilize a habilidade Text Split.

Limites de estrangulamento

Os pedidos da API são acelerados à medida que o sistema se aproxima da capacidade máxima. O estrangulamento comporta-se de forma diferente para diferentes APIs. ApIs de consulta (Search/Suggest/Autocomplete) e indexar o acelerador apis dinamicamente com base na carga do serviço. ApIs de índice e operações de serviço API têm limites estáticos de taxa de pedido.

Limites de pedido de taxa estática para operações relacionadas com um índice:

  • Índices de Lista (GET/indexes): 3 por segundo por unidade de pesquisa
  • Obtenha Índice (GET/indexes/myindex): 10 por segundo por unidade de pesquisa
  • Criar Índice (POST/índices): 12 por minuto por unidade de pesquisa
  • Criar ou atualizar índice (PUT/indexes/myindex): 6 por segundo por unidade de pesquisa
  • Eliminar Índice (DELETE/indexes/myindex): 12 por minuto por unidade de pesquisa

Limites de pedido de taxa estática para operações relacionadas com um serviço:

  • Estatísticas de Serviço (GET/servicestats): 4 por segundo por unidade de pesquisa

Limites de pedido da API

  • Máximo de 16 MB por pedido 1
  • Comprimento máximo de URL de 8 KB
  • Máximo de 1000 documentos por lote de uploads, fusões ou eliminações de índices
  • Máximo 32 campos na cláusula $orderby
  • Máximo de 100.000 caracteres numa cláusula de pesquisa
  • O número máximo de cláusulas em search (expressões separadas por E ou OR) é de 1024
  • O tamanho máximo do prazo de pesquisa é de 32.766 bytes (32 KB menos 2 bytes) de texto codificado UTF-8
  • O tamanho máximo do prazo de pesquisa é de 1000 caracteres para pesquisa de prefixos e pesquisa de regex
  • A pesquisa de wildcard e a procura regular de expressão estão limitadas a um máximo de 1000 estados quando processados por Lucene.

1 Em Azure Cognitive Search, o corpo de um pedido está sujeito a um limite superior de 16 MB, impondo um limite prático ao conteúdo de campos ou coleções individuais que não sejam de outra forma limitados por limites teóricos (ver tipos de dados suportados para mais informações sobre composição e restrições de campo).

Existem limites ao tamanho e composição da consulta porque as consultas não limitadas podem desestabilizar o seu serviço de pesquisa. Tipicamente, tais consultas são criadas programáticamente. Se a sua aplicação gerar consultas de pesquisa programáticas, recomendamos que a desenhe de forma a não gerar consultas de tamanho ilimitado.

Limites de resposta da API

  • Máximo de 1000 documentos devolvidos por página de resultados de pesquisa
  • Máximo de 100 sugestões devolvidas por pedido de API

Limites-chave da API

As teclas API são utilizadas para a autenticação do serviço. Existem dois tipos. Administração teclas são especificadas no cabeçalho do pedido e concedem acesso completo à leitura-escrita ao serviço. As chaves de consulta são apenas de leitura, especificadas no URL, e normalmente distribuídas para aplicações do cliente.

  • Máximo de 2 teclas de administração por serviço
  • Máximo de 50 chaves de consulta por serviço