Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Parte da criação de um serviço de pesquisa é escolher uma camada de preço (ou SKU). No portal do Azure, a camada é especificada na página Selecionar Camada de Preço quando você cria o serviço. No PowerShell ou na CLI do Azure, a camada é especificada por meio do -Sku
parâmetro.
O nível determina o seguinte:
- Número máximo de índices e outros objetos permitidos no serviço.
- Tamanho e velocidade das partições (armazenamento físico).
- Tarifa faturável como um custo mensal fixo, mas também um custo incremental se se adicionar capacidade.
- Características da carga de trabalho. Algumas camadas são otimizadas para cargas de trabalho específicas.
Em alguns casos, a camada escolhida determina a disponibilidade de funcionalidades premium.
As taxas de cobrança são mostradas na página Selecionar Nível de Preço do portal do Azure. Você pode verificar a página de preços para tarifas regionais e revisar Planejar e gerenciar custos para saber mais sobre o modelo de faturamento.
Nota
Os serviços de pesquisa criados após 3 de abril de 2024 têm partições maiores e cotas vetoriais mais altas em quase todos os níveis. Para obter mais informações, consulte Limites de serviço.
Descrições dos níveis
Os níveis incluem Gratuito, Básico, Standard e Otimizado para armazenamento. Standard e Storage Optimized estão disponíveis com várias configurações e capacidades. A captura de tela a seguir do portal do Azure mostra as camadas disponíveis, menos os preços (que você pode encontrar no portal do Azure e na página de preços).
Free cria um serviço de pesquisa limitado para projetos menores, como a execução de tutoriais e exemplos de código. Internamente, os recursos do sistema são compartilhados entre vários assinantes. Não é possível dimensionar um serviço gratuito, executar cargas de trabalho significativas e alguns recursos premium não estão disponíveis. Você só pode ter um serviço de pesquisa gratuito por assinatura do Azure. Se o serviço estiver inativo por um longo período de tempo, ele poderá ser excluído para liberar capacidade, especialmente se a região estiver sob restrições de capacidade.
Os níveis faturáveis mais usados incluem:
Basic tem a capacidade de cumprir o SLA graças ao suporte para três réplicas.
Standard (S1, S2, S3) é o padrão. Ele oferece mais flexibilidade no dimensionamento para cargas de trabalho. Você pode dimensionar partições e réplicas. Com recursos dedicados sob seu controle, você pode implantar projetos maiores, otimizar o desempenho e aumentar a capacidade.
Alguns níveis são projetados para certos tipos de trabalho:
Standard 3 High Density (S3 HD) é um modo de hospedagem para o S3, onde o hardware subjacente é otimizado para um grande número de índices menores e destina-se a cenários de multilocação. O S3 HD tem a mesma carga por unidade que o S3, mas o hardware é otimizado para leituras rápidas de arquivos em um grande número de índices menores.
Os níveis otimizados para armazenamento (L1, L2) oferecem maior capacidade de armazenamento a um preço mais baixo por TB do que os níveis Standard. Essas camadas são projetadas para índices grandes que não mudam com muita frequência. A principal compensação é a maior latência de consulta, que você deve validar para seus requisitos específicos de aplicativo.
Você pode saber mais sobre as várias camadas na página de preços, no artigo Limites de serviço na Pesquisa de IA do Azure e na página do portal do Azure quando estiver provisionando um serviço.
Disponibilidade da região por nível
A lista de regiões com suporte fornece os locais onde o Azure AI Search é oferecido.
Atualmente, várias regiões têm capacidade limitada para níveis específicos e não podem ser usadas para novos serviços de pesquisa. Se você usar o portal do Azure para criar um serviço de pesquisa, o portal do Azure excluirá quaisquer combinações de camada de região que não estejam disponíveis.
Região | Nível desativado (SKU) devido ao excesso de capacidade | Alternativa sugerida |
---|---|---|
E.U.A. Oeste 2 | Básico, S1, S2, S3, L1, L2 | Oeste dos EUA, Oeste dos EUA 3 |
Disponibilidade de recursos por camada
A maioria dos recursos está disponível em todos os níveis, incluindo o nível Gratuito. Em alguns casos, a camada determina a disponibilidade de um recurso. A tabela a seguir descreve as restrições.
Caraterística | Considerações de nível |
---|---|
indexadores | Os indexadores não estão disponíveis no S3 HD. Os indexadores têm mais limitações no nível gratuito. |
parâmetro de configuração do indexador executionEnvironment |
A capacidade de fixar todo o processamento do indexador apenas nos clusters de pesquisa alocados ao seu serviço de pesquisa requer S2 e superior. |
Enriquecimento da IA | É executado no nível Gratuito, mas não recomendado. |
Identidades geridas ou de confiança para acesso externo (indexador) | Não disponível no nível Gratuito. |
Chaves de criptografia gerenciadas pelo cliente | Não disponível no nível Gratuito. |
Acesso a firewall IP | Não disponível no nível Gratuito. |
Endpoint privado (integração com o Azure Private Link) | Para conexões de entrada a um serviço de pesquisa, não está disponível no plano Gratuito. Para conexões de saída de indexadores com outros recursos do Azure, não disponíveis em Free ou S3 HD. Para indexadores que usam conjuntos de habilidades, não disponível em Free, Basic, S1 ou S3 HD. |
Zonas de Disponibilidade | Não disponível no nível Gratuito ou Básico. |
Classificador semântico | Não disponível no nível Gratuito. |
Funcionalidades que consomem muitos recursos podem não funcionar bem, a menos que lhes dê capacidade suficiente. Por exemplo, o enriquecimento de IA envolve habilidades de longa duração que expiram num serviço gratuito, a menos que o conjunto de dados seja pequeno.
Limites superiores
As camadas determinam o armazenamento máximo do próprio serviço, além do número máximo de índices, indexadores, fontes de dados, conjuntos de habilidades e mapas de sinônimos que você pode criar. Para obter uma análise completa de todos os limites, consulte Limites de serviço na Pesquisa de IA do Azure.
Tamanho e velocidade da partição
O preço do nível inclui detalhes sobre o armazenamento por partição, que varia de 15 GB para níveis básicos e até 2 TB para níveis otimizados para armazenamento (L2). Outras características de hardware, como velocidade de operações, latência e taxas de transferência, não são publicadas, mas as camadas projetadas para arquiteturas de solução específicas são criadas em hardware que tem os recursos para suportar esses cenários. Para obter mais informações sobre partições, consulte Estimar e gerenciar capacidade e confiabilidade no Azure AI Search.
Nota
Partições de maior capacidade ficaram disponíveis em regiões selecionadas em abril de 2024. Uma segunda onda de partições de maior capacidade foi lançada em maio de 2024. Se tiver um serviço de pesquisa mais antigo, poderá atualizar o seu serviço para beneficiar de mais capacidade com a mesma taxa de faturação.
Taxas de faturação
Os níveis têm taxas de cobrança diferentes, com taxas mais altas para níveis que são executados em hardware mais caro ou fornecem recursos mais caros. A taxa de faturação por nível pode ser encontrada nas páginas de preços da Azure para o Azure AI Search.
Depois de criar um serviço, a taxa de faturamento se torna um custo fixo de execução do serviço o tempo todo e um custo incremental se você optar por adicionar mais capacidade.
Os serviços de pesquisa são alocados recursos de computação na forma de partições (para armazenamento) e réplicas (instâncias do mecanismo de consulta). Inicialmente, um serviço é criado com um de cada um, e a taxa de faturamento inclui ambos os recursos. No entanto, se você dimensionar a capacidade, os custos sobem ou diminuem em incrementos da taxa faturável.
O exemplo a seguir fornece uma ilustração. Suponha uma taxa de faturamento hipotética de US$ 100 por mês. Se mantiver o serviço de pesquisa na sua capacidade inicial de uma partição e uma réplica, pode esperar pagar 100 dólares no final do mês. No entanto, se você adicionar mais duas réplicas adicionais para obter alta disponibilidade, a conta mensal aumentará para US$ 300 (US$ 100 pelo par de réplica-partição inicial, seguido por US$ 200 para as duas réplicas adicionais).
Este modelo de faturação baseia-se no conceito de aplicação da taxa de faturação às unidades de pesquisa (SU) utilizadas por um serviço de pesquisa. Todos os serviços são inicialmente provisionados em uma SU, mas você pode aumentar as SUs adicionando partições ou réplicas para lidar com cargas de trabalho maiores. Para obter mais informações, consulte Como estimar os custos de um serviço de pesquisa.
Alterações de nível
Os serviços podem ser alternados entre as camadas Básica e Padrão (S1, S2 e S3). Atualmente, você só pode alternar de uma camada inferior para uma camada mais alta, como passar de Basic para S1. Sua região também não pode ter restrições de capacidade no nível superior. Para obter mais informações, consulte Alterar o nível de preços.
Se você quiser mudar para uma camada inferior ou para uma camada diferente das listadas anteriormente, a abordagem é:
Crie um novo serviço de pesquisa na nova camada.
Implante seu conteúdo de pesquisa no novo serviço. Siga esta lista de verificação para se certificar de que tem todo o conteúdo.
Exclua o serviço de pesquisa antigo quando tiver certeza de que ele não é mais necessário.
Para índices grandes que você não deseja reconstruir do zero, considere usar um dos exemplos de backup e restauração para movê-los:
- Exemplo de backup e restauração (C#)
- Exemplo de backup e restauração (Python)
- Maior backup e restauração de índice (Python)
Próximos passos
A melhor maneira de escolher um nível de preço é começar com um nível de menor custo e, em seguida, permitir que a experiência e os testes informem sua decisão de manter o serviço ou mudar para um nível mais alto.
Para as próximas etapas, recomendamos que você crie um serviço de pesquisa em uma camada que possa acomodar o nível de teste que você se propõe a fazer e, em seguida, revise as seguintes orientações sobre estimativa de custo e capacidade: