Gerenciar a capacidade

Concluído

Para criar uma solução de Pesquisa de IA do Azure, você precisa criar um recurso de Pesquisa de IA do Azure na sua assinatura do Azure. Dependendo da solução específica que você pretende criar, talvez você precise de recursos do Azure para armazenamento de dados e outros serviços de aplicativos.

Camadas de serviço e gerenciamento de capacidade

Quando você cria um recurso de Pesquisa de IA do Azure, deve especificar um tipo de preço. O tipo de preço que você seleciona determina as limitações de capacidade do serviço de pesquisa e as opções de configuração disponíveis para você, bem como o custo do serviço. Os tipos de preço disponíveis são:

  • Gratuito (F): use essa camada para explorar o serviço ou experimentar os tutoriais na documentação do produto.
  • Básico (B): use essa camada para soluções de pesquisa de pequena escala que incluem um máximo de 15 índices e 2 GB de dados de índice.
  • Standard (S): use essa camada para soluções de escala empresarial. Há várias variantes dessa camada, incluindo S, S2 e S3, que oferecem maior capacidade em termos de índices e armazenamento, bem como S3HD, que é otimizada para rápido desempenho de leitura em números menores de índices.
  • Otimizado para Armazenamento (L): Use uma camada otimizada para armazenamento (L1 ou L2) quando precisar criar índices grandes, tendo como contrapartida maior latência de consulta.

Observação

É importante selecionar o tipo de preço mais adequado para a sua solução, pois você não poderá alterá-lo posteriormente. Se você descobrir que o tipo de preço escolhido não é mais adequado para sua solução, deverá criar um novo recurso de Pesquisa de IA do Azure e recriar todos os índices e objetos.

Réplicas e partições

Dependendo do tipo de preço selecionado, você pode otimizar sua solução para escalabilidade e disponibilidade criando réplicas e partições.

  • Réplicas são instâncias do serviço de pesquisa – você pode considerá-las como nós em um cluster. Aumentar o número de réplicas pode ajudar a garantir que haja capacidade suficiente para atender a várias solicitações de consulta simultâneas ao gerenciar operações de indexação em andamento.

  • As partições são usadas para dividir um índice em vários locais de armazenamento, permitindo que você divida as operações de E/S, como consulta ou recriação de um índice.

A combinação de réplicas e partições que você configura determina as unidades de pesquisa usadas pela sua solução. Para simplificar, o número de unidades de pesquisa é o número de réplicas multiplicado pelo número de partições (R x P = UP). Por exemplo, um recurso com quatro réplicas e três partições está usando 12 unidades de pesquisa.

Dica

Você pode saber mais sobre os tipos de preços e o gerenciamento de capacidade na documentação da Pesquisa de IA do Azure.