Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo explica como o Azure AI Search é cobrado, incluindo custos fixos e variáveis, e fornece diretrizes para o gerenciamento de custos.
Antes de criar um serviço de pesquisa, use a calculadora de preços do Azure para estimar os custos com base em sua capacidade e recursos planejados. Outro recurso é uma planilha de planejamento de capacidade que modela o tamanho do índice esperado, a taxa de transferência de indexação e os custos de indexação.
À medida que a carga de trabalho de pesquisa evolui, siga nossas dicas para minimizar os custos durante a implantação e a operação. Você também pode usar métricas internas para monitorar solicitações de consulta e Gerenciamento de Custos para criar orçamentos, alertas e exportações de dados.
Observação
Partições de maior capacidade estão disponíveis com a mesma taxa de cobrança em serviços criados após abril e maio de 2024. Para obter mais informações sobre atualizações de tamanho de partição, consulte os limites de serviço.
Entender o modelo de cobrança
O Azure AI Search tem cobrança fixa e paga conforme o uso. Você paga uma taxa fixa pelo serviço de pesquisa desde que ela exista, enquanto os recursos premium são cobrados de acordo com seu uso.
Os custos do Azure AI Search são apenas uma parte dos custos mensais em sua fatura do Azure. Embora este artigo se concentre no planejamento e gerenciamento de custos do Azure AI Search, você é cobrado por todos os serviços e recursos do Azure usados em sua assinatura do Azure, incluindo serviços que não são da Microsoft.
Como você é cobrado pelo serviço básico
Ao criar ou usar recursos de pesquisa, você é cobrado pela combinação mínima de replicação e partição necessária (R × P) na taxa proporcional por hora do seu tipo de preço. À medida que suas unidades de pesquisa aumentam ou diminuem, seus custos também aumentam. Para obter mais informações e um exemplo do modelo de cobrança, consulte as taxas de cobrança.
Como você é cobrado pelas funcionalidades premium
Os recursos Premium são cobrados além do custo base do serviço de pesquisa. A tabela a seguir lista os recursos premium e suas unidades de cobrança. Todos esses recursos são opcionais, portanto, se você não usá-los, não incorre em encargos.
Característica | Unidade de cobrança |
---|---|
Extração de imagem (enriquecimento de IA) 1 | Por 1.000 imagens. Consulte a página de preços. |
Habilidade de pesquisa de entidade personalizada (enriquecimento de IA) | Por 1.000 registros de texto. Confira a página de preços |
Habilidades internas ou personalizadas (enriquecimento de IA) 2 | Número de transações. Cobrado à taxa do provedor de modelos: serviços de IA do Azure, Azure OpenAI ou Azure AI Foundry. |
Vetorizadores2 | Número de operações de vetorização. Cobrado à taxa do provedor de modelo: Visão de IA do Azure, Azure OpenAI ou Azure AI Foundry. |
Classificador semântico | Número de consultas de queryType=semantic . Cobrado em uma taxa progressiva. Consulte a página de preços. |
Link privado compartilhado | Cobrado pela largura de banda desde que o link privado compartilhado exista e seja usado. |
1 Refere-se às imagens extraídas de um arquivo dentro do pipeline do indexador. A extração de texto é gratuita. A extração de imagem é cobrada quando você habilita o indexAction
parâmetro ou quando chama a habilidade de Extração de Documentos.
2 Encargos para modelos do Azure OpenAI e modelos do Azure AI Foundry aparecem em sua fatura para esses serviços.
Como você é cobrado de outra forma
Dependendo da configuração e do uso, os seguintes encargos podem ser aplicados:
O tráfego de dados pode incorrer em custos de rede. Consulte o preço da largura de banda.
Vários recursos premium, como repositórios de conhecimento, sessões de depuração e caches de enriquecimento, dependem do Armazenamento do Azure e incorrem em custos de armazenamento. Os encargos pelos recursos aparecem na fatura do armazenamento do Azure.
As chaves gerenciadas pelo cliente, que fornecem criptografia dupla de conteúdo confidencial, exigem um Azure Key Vault faturável.
Um conjunto de habilidades pode incluir habilidades internas faturáveis, habilidades internas utilitárias não faturáveis e habilidades personalizadas. As habilidades do utilitário sem cobrança incluem Condicional, Formador, Mesclagem deTexto e Divisão de Texto. Eles não têm um requisito de chave de API ou um limite de 20 documentos.
A habilidade personalizada é a funcionalidade que você fornece. As habilidades personalizadas só poderão ser cobrada se chamarem outros serviços faturáveis. Eles não têm um requisito de chave de API ou um limite de 20 documentos.
Observação
Você não é cobrado pelo número de consultas de texto completo ou vetor, respostas de consulta ou documentos ingeridos. No entanto, os limites de serviço se aplicam a cada tipo de preço.
Estimar e planejar custos
Use a calculadora de preços do Azure para estimar seus custos de linha de base para o Azure AI Search. Você também pode encontrar os custos estimados e comparações de camada na página Selecionar Tipo de Preço durante a criação do serviço.
Para testes iniciais, recomendamos que você crie uma planilha de planejamento de capacidade. A planilha ajuda a entender a proporção índice-origem e o efeito das características de enriquecimento ou de vetor tanto na capacidade quanto no custo.
Para criar uma planilha de planejamento de capacidade:
Indexe uma amostra pequena (1 a 5%) de seus dados. Inclua qualquer OCR, enriquecimento ou habilidades de inserção que você planeja usar.
Meça o tamanho do índice, o desempenho de indexação e os custos de indexação.
Extrapole os resultados para estimar os requisitos de escala total para seus dados.
Minimizar custos
Para minimizar os custos da solução do Azure AI Search, use as seguintes estratégias:
Implantação e configuração
Crie um serviço de pesquisa em uma região com mais armazenamento por partição.
Crie todos os recursos relacionados do Azure na mesma região (ou o menor número possível de regiões) para minimizar ou eliminar encargos de largura de banda.
Escolha o tipo de preço mais leve que atenda às suas necessidades. Basic e S1 oferecem acesso total à API moderna à menor taxa por hora por unidade de serviço (SU).
Use os Aplicativos Web do Azure para seu aplicativo front-end para manter solicitações e respostas dentro do limite do data center.
Escalonamento
Adicione partições somente quando o tamanho do índice ou a taxa de transferência de ingestão exigir.
Adicione réplicas somente quando suas consultas por segundo aumentarem, quando consultas complexas estiverem limitando seu serviço ou quando a alta disponibilidade for necessária.
Aumente a capacidade para operações com uso intensivo de recursos, como indexação, e, em seguida, reduza a capacidade para cargas de trabalho de consulta regulares.
Escreva código para automatizar o dimensionamento para padrões previsíveis de carga de trabalho.
Lembre-se de que a capacidade e os preços não são lineares. Dobrar a capacidade mais do que dobra os custos na mesma camada. Para obter um melhor desempenho a um preço semelhante, considere mudar para um nível mais alto.
Indexação e enriquecimento
Use a indexação incremental para processar apenas dados novos ou alterados.
Use o cache de enriquecimento e um repositório de conhecimento para reutilizar conteúdo enriquecido anteriormente. Embora o cache incorre em um custo de armazenamento, ele reduz o custo cumulativo do enriquecimento de IA.
Mantenha as cargas de vetor compactas. Para pesquisa de vetor, consulte as práticas recomendadas de compactação de vetor.
Monitorar custos
No nível do serviço, você pode monitorar métricas internas para suas consultas por segundo (QPS), latência de pesquisa, consultas limitadas e tamanho do índice. Em seguida, você pode criar um painel do Azure Monitor que sobrepõe dados de QPS, latência e custo para determinar quando adicionar ou remover réplicas.
No nível da assinatura ou do grupo de recursos, o Gerenciamento de Custos fornece ferramentas para acompanhar, analisar e controlar os custos. Você pode usar o Gerenciamento de Custos para:
Crie orçamentos que definem e acompanhem o progresso em relação aos limites de gastos. Para um monitoramento mais granular, personalize seus orçamentos usando filtros para recursos ou serviços específicos do Azure. Os filtros impedem que você crie acidentalmente recursos que incorrem em custos extras.
Crie alertas que notifiquem automaticamente os stakeholders sobre anomalias de gastos ou riscos de gastos excessivos. Os alertas são baseados nos gastos comparados com os limites de orçamento e de custo. Orçamentos e alertas são criados para assinaturas e grupos de recursos, tornando-os úteis para monitorar os custos gerais.
Exportar dados de custo para uma conta de armazenamento. Isso é útil quando você ou outras pessoas precisam executar mais análise de custo. Por exemplo, uma equipe de finanças pode analisar os dados usando o Excel ou o Power BI. Você pode exportar seus custos em uma agenda diária, semanal ou mensal e definir um intervalo de datas personalizado. Exportar dados de custo é o método recomendado para recuperar conjuntos de dados de custo.
Perguntas frequentes
Posso desligar um serviço de pesquisa temporariamente para economizar nos custos?
A pesquisa é executada como um serviço contínuo. Os recursos dedicados estão sempre operacionais e alocados para seu uso exclusivo durante o tempo de vida do serviço. Para interromper totalmente a cobrança, é necessário excluir o serviço. Excluir um serviço será permanente e também exclui seus dados associados.
Posso alterar a taxa de cobrança (nível) de um serviço de pesquisa existente?
Os serviços existentes podem ser alternados entre as camadas Básica e Standard (S1, S2 e S3). Atualmente, você só pode alternar de uma camada inferior para uma camada mais alta, como ir de Basic para S1. Para obter mais informações, consulte Alterar seu tipo de preço.