Partilhar via


Escolher uma camada de serviço para o Azure AI Search

Parte da criação de um serviço de pesquisa é escolher um nível de preço (ou SKU) fixo para o tempo de vida do serviço. No portal, a camada é especificada na página Selecionar Nível de Preço quando você cria o serviço. No PowerShell ou na CLI do Azure, a camada é especificada por meio do -Sku parâmetro.

O nível determina:

  • Número máximo de índices e outros objetos permitidos no serviço
  • Tamanho e velocidade das partições (armazenamento físico)
  • Taxa faturável como um custo mensal fixo, mas também um custo incremental se você adicionar capacidade

Em alguns casos, a camada escolhida determina a disponibilidade de recursos premium.

As taxas de cobrança são mostradas na página Selecionar Nível de Preço do portal. Você pode verificar a página de preços para tarifas regionais e revisar Planejar e gerenciar custos para saber mais sobre o modelo de faturamento.

Nota

Os serviços de pesquisa criados após 3 de abril de 2024 têm partições maiores e cotas vetoriais mais altas em quase todos os níveis. Para obter mais informações, consulte Limites de serviço.

Descrições dos níveis

Os níveis incluem Gratuito, Básico, Standard e Otimizado para armazenamento. Standard e Storage Optimized estão disponíveis com várias configurações e capacidades. A captura de tela a seguir do portal do Azure mostra os níveis disponíveis, menos os preços (que você pode encontrar no portal e na página de preços).

Gráfico de níveis de preços

Free cria um serviço de pesquisa limitado para projetos menores, como a execução de tutoriais e exemplos de código. Internamente, os recursos do sistema são compartilhados entre vários assinantes. Não é possível dimensionar um serviço gratuito, executar cargas de trabalho significativas e alguns recursos premium não estão disponíveis. Você só pode ter um serviço de pesquisa gratuito por assinatura do Azure.

Os níveis faturáveis mais usados incluem:

  • O Basic tem a capacidade de cumprir o SLA com seu suporte para três réplicas.

  • Standard (S1, S2, S3) é o padrão. Ele oferece mais flexibilidade no dimensionamento para cargas de trabalho. Você pode dimensionar partições e réplicas. Com recursos dedicados sob seu controle, você pode implantar projetos maiores, otimizar o desempenho e aumentar a capacidade.

Alguns níveis são projetados para certos tipos de trabalho:

  • Standard 3 High Density (S3 HD) é um modo de hospedagem para o S3, onde o hardware subjacente é otimizado para um grande número de índices menores e destina-se a cenários de multilocação. O S3 HD tem a mesma carga por unidade que o S3, mas o hardware é otimizado para leituras rápidas de arquivos em um grande número de índices menores.

  • Os níveis otimizados para armazenamento (L1, L2) oferecem maior capacidade de armazenamento a um preço mais baixo por TB do que os níveis Standard. Essas camadas são projetadas para índices grandes que não mudam com muita frequência. A principal compensação é a maior latência de consulta, que você deve validar para seus requisitos específicos de aplicativo.

Você pode saber mais sobre os vários níveis na página de preços, no artigo Limites de serviço na Pesquisa de IA do Azure e na página do portal quando estiver provisionando um serviço.

Disponibilidade de recursos por camada

A maioria dos recursos está disponível em todos os níveis, incluindo o nível gratuito. Em alguns casos, a camada determina a disponibilidade de um recurso. A tabela a seguir descreve as restrições.

Caraterística Limitações
indexadores Os indexadores não estão disponíveis no S3 HD. Os indexadores têm mais limitações no nível gratuito.
Enriquecimento da IA É executado no nível Gratuito, mas não recomendado.
Identidades gerenciadas ou confiáveis para acesso de saída (indexador) Não disponível no nível Gratuito.
Chaves de criptografia gerenciadas pelo cliente Não disponível no nível Gratuito.
Acesso a firewall IP Não disponível no nível Gratuito.
Ponto de extremidade privado (integração com o Azure Private Link) Para conexões de entrada a um serviço de pesquisa, não disponível no nível Gratuito.
Para conexões de saída de indexadores com outros recursos do Azure, não disponíveis em Free ou S3 HD.
Para indexadores que usam conjuntos de habilidades, não disponível em Free, Basic, S1 ou S3 HD.
Zonas de Disponibilidade Não disponível no nível Gratuito ou Básico.
Classificador semântico Não disponível no nível Gratuito.

Recursos que consomem muitos recursos podem não funcionar bem, a menos que você dê capacidade suficiente. Por exemplo, o enriquecimento de IA tem habilidades de longa duração que expiram em um serviço gratuito, a menos que o conjunto de dados seja pequeno.

Limites superiores

As camadas determinam o armazenamento máximo do próprio serviço, além do número máximo de índices, indexadores, fontes de dados, conjuntos de habilidades e mapas de sinônimos que você pode criar. Para obter uma análise completa de todos os limites, consulte Limites de serviço na Pesquisa de IA do Azure.

Tamanho e velocidade da partição

O preço do nível inclui detalhes sobre o armazenamento por partição, que varia de 15 GB para níveis básicos e até 2 TB para níveis otimizados para armazenamento (L2). Outras características de hardware, como velocidade de operações, latência e taxas de transferência, não são publicadas, mas as camadas projetadas para arquiteturas de solução específicas são criadas em hardware que tem os recursos para suportar esses cenários. Para obter mais informações sobre partições, consulte Estimar e gerenciar capacidade e confiabilidade no Azure AI Search.

Taxas de faturação

Os níveis têm taxas de cobrança diferentes, com taxas mais altas para níveis que são executados em hardware mais caro ou fornecem recursos mais caros. A taxa de cobrança de camada pode ser encontrada nas páginas de preços do Azure para o Azure AI Search.

Depois de criar um serviço, a taxa de faturamento se torna um custo fixo de execução do serviço o tempo todo e um custo incremental se você optar por adicionar mais capacidade.

Os serviços de pesquisa são alocados recursos de computação na forma de partições (para armazenamento) e réplicas (instâncias do mecanismo de consulta). Inicialmente, um serviço é criado com um de cada um, e a taxa de faturamento inclui ambos os recursos. No entanto, se você dimensionar a capacidade, os custos sobem ou diminuem em incrementos da taxa faturável.

O exemplo a seguir fornece uma ilustração. Suponha uma taxa de faturamento hipotética de US$ 100 por mês. Se você mantiver o serviço de pesquisa em sua capacidade inicial de uma partição e uma réplica, então US $ 100 é o que você pode esperar pagar no final do mês. No entanto, se você adicionar mais duas réplicas para obter alta disponibilidade, a conta mensal aumentará para US$ 300 (US$ 100 para o primeiro par de réplicas e partições, seguido por US$ 200 para as duas réplicas).

Este modelo de faturação baseia-se no conceito de aplicação da taxa de faturação às unidades de pesquisa numérica (SU) utilizadas por um serviço de pesquisa. Todos os serviços são inicialmente provisionados em uma SU, mas você pode aumentar as SUs adicionando partições ou réplicas para lidar com cargas de trabalho maiores. Para obter mais informações, consulte Como estimar os custos de um serviço de pesquisa.

Upgrade ou downgrade de nível

Não há suporte interno para atualizar ou fazer downgrade de camadas. Se você quiser mudar para uma camada diferente, a abordagem é:

  • Crie um novo serviço de pesquisa na nova camada.

  • Implante seu conteúdo de pesquisa no novo serviço. Siga esta lista de verificação para se certificar de que tem todo o conteúdo.

  • Exclua o serviço de pesquisa antigo quando tiver certeza de que ele não é mais necessário.

Para índices grandes que você não deseja reconstruir do zero, considere usar o exemplo de backup e restauração para movê-los.

Próximos passos

A melhor maneira de escolher um nível de preço é começar com um nível de menor custo e, em seguida, permitir que a experiência e os testes informem sua decisão de manter o serviço ou criar um novo em um nível mais alto. Para as próximas etapas, recomendamos que você crie um serviço de pesquisa em uma camada que possa acomodar o nível de teste que você se propõe a fazer e, em seguida, revise as orientações a seguir para obter recomendações sobre como estimar o custo e a capacidade.