Partilhar via


Planejar e gerenciar custos de um serviço de Pesquisa de IA do Azure

Este artigo explica como o Azure AI Search é cobrado, incluindo custos fixos e variáveis, e fornece orientação para o gerenciamento de custos.

Antes de criar um serviço de pesquisa, use a calculadora de preços do Azure para estimar os custos com base na capacidade e nos recursos planejados. Outro recurso é uma planilha de planejamento de capacidade que modela o tamanho esperado do índice, a taxa de transferência de indexação e os custos de indexação.

À medida que sua carga de trabalho de pesquisa evolui, siga nossas dicas para minimizar os custos durante a implantação e a operação. Você também pode usar métricas internas para monitorar solicitações de consulta e o Gerenciamento de custos para criar orçamentos, alertas e exportações de dados.

Nota

As partições de maior capacidade estão disponíveis à mesma taxa de faturação em serviços criados após abril e maio de 2024. Para obter mais informações sobre atualizações de tamanho de partição, consulte Limites de serviço.

Entenda o modelo de faturamento

O Azure AI Search tem cobrança fixa e paga conforme o uso. Você paga uma taxa fixa pelo seu serviço de pesquisa, enquanto ele existir, enquanto os recursos premium são cobrados de acordo com o seu uso.

Os custos da Pesquisa de IA do Azure são apenas uma parte dos custos mensais na sua fatura do Azure. Embora este artigo se concentre no planejamento e gerenciamento dos custos do Azure AI Search, você será cobrado por todos os serviços e recursos do Azure usados em sua assinatura do Azure, incluindo serviços que não sejam da Microsoft.

Como você é cobrado pelo serviço básico

Ao criar ou usar recursos de pesquisa, você é cobrado pela combinação mínima necessária de réplica e partição (R × P) à taxa horária proporcional do seu nível de preço. À medida que as suas unidades de pesquisa aumentam ou diminuem, os seus custos também aumentam. Para obter mais informações e um exemplo do modelo de faturamento, consulte Taxas de faturamento.

Como és cobrado pelas funcionalidades premium

Os recursos Premium são cobrados além do custo base do seu serviço de pesquisa. A tabela a seguir lista os recursos premium e suas unidades de faturamento. Todas estas funcionalidades são opcionais, por isso, se não as utilizar, não incorre em quaisquer encargos.

Característica Unidade de faturação
Extração de imagens (enriquecimento IA) 1 Por 1.000 imagens. Veja a página de preços.
Habilidade de pesquisa de entidade personalizada (enriquecimento de IA) Por 1.000 registros de texto. Consulte a página de preços
Competências incorporadas ou personalizadas (enriquecimento de IA) 2 Número de transações. Cobrado à taxa do fornecedor do modelo: serviços de IA do Azure, Azure OpenAI ou Azure AI Foundry.
Vetorizadores2 Número de operações de vetorização. Cobrado à taxa do fornecedor do modelo: Azure AI Vision, Azure OpenAI ou Azure AI Foundry.
Classificador semântico Número de consultas de queryType=semantic. Faturado com uma taxa progressiva. Veja a página de preços.
Link privado compartilhado Cobrado pela largura de banda enquanto a ligação privada compartilhada existir e for usada.

1 Refere-se a imagens extraídas de um arquivo dentro do pipeline do indexador. A extração de texto é gratuita. A extração de imagem é cobrada quando você habilita o indexAction parâmetro ou quando chama a habilidade Extração de Documentos.

2 As cobranças para modelos do Azure OpenAI e modelos do Azure AI Foundry aparecem na sua fatura por esses serviços.

Como você é cobrado de outras maneiras

Dependendo da sua configuração e utilização, poderão aplicar-se os seguintes encargos:

Nota

Você não é cobrado pelo número de consultas vetoriais ou de texto completo, respostas a consultas ou documentos ingeridos. No entanto, os limites de serviço aplicam-se a cada nível de preço.

Estimar e planear custos

Use a calculadora de preços do Azure para estimar seus custos de linha de base para o Azure AI Search. Você também pode encontrar custos estimados e comparações de camadas na página Selecionar nível de preço durante a criação do serviço.

Para testes iniciais, recomendamos que você crie uma planilha de planejamento de capacidade. A folha de cálculo ajuda a compreender a relação índice-fonte e o impacto das funcionalidades de enriquecimento ou de vetores na capacidade e no custo.

Para criar uma planilha de planejamento de capacidade:

  1. Indexe uma pequena amostra (1–5%) dos seus dados. Inclua qualquer OCR, enriquecimento ou habilidades de incorporação que você planeja usar.

  2. Meça o tamanho do índice, a taxa de indexação e os custos de indexação.

  3. Extrapole os resultados para estimar os requisitos de escala completa para seus dados.

Minimizar custos

Para minimizar os custos da sua solução Azure AI Search, use as seguintes estratégias:

Implementação e configuração

  • Crie um serviço de pesquisa em uma região com mais armazenamento por partição.

  • Crie todos os recursos relacionados do Azure na mesma região (ou no menor número possível de regiões) para minimizar ou eliminar os encargos de largura de banda.

  • Escolha o nível de preço mais leve que atenda às suas necessidades. Basic e S1 oferecem acesso total à API moderna com a menor taxa horária por SU.

  • Use os Aplicativos Web do Azure para seu aplicativo front-end para manter as solicitações e respostas dentro do limite do data center.

Escalonamento

  • Adicione partições somente quando o tamanho do índice ou a taxa de transferência de ingestão exigirem.

  • Adicione réplicas somente quando suas consultas por segundo aumentarem, quando consultas complexas estiverem limitando seu serviço ou quando for necessária alta disponibilidade.

  • Aumente a escala para operações que consomem muitos recursos, como indexação, e reajuste para baixo para cargas de trabalho de consulta regulares.

  • Escreva código para automatizar o dimensionamento para padrões de carga de trabalho previsíveis.

  • Lembre-se de que a capacidade e os preços não são lineares. A duplicação da capacidade mais do que duplica os custos no mesmo nível. Para um melhor desempenho a um preço semelhante, considere mudar para um nível mais alto.

Indexação e enriquecimento

Monitorizar os custos

No nível de serviço, você pode monitorar métricas internas para suas consultas por segundo (QPS), latência de pesquisa, consultas limitadas e tamanho do índice. Em seguida, você pode criar um painel do Azure Monitor que sobrepõe QPS, latência e dados de custo para determinar quando adicionar ou remover réplicas.

No nível de assinatura ou grupo de recursos, o Gerenciamento de Custos fornece ferramentas para rastrear, analisar e controlar custos. Você pode usar o Gerenciamento de Custos para:

  • Crie orçamentos que definam e acompanhem o progresso em relação aos limites de gastos. Para um monitoramento mais granular, personalize seus orçamentos usando filtros para recursos ou serviços específicos do Azure. Os filtros evitam que você crie acidentalmente recursos que incorram em custos extras.

  • Crie alertas que notifiquem automaticamente as partes interessadas sobre anomalias de gastos ou riscos de gastos excessivos. Os alertas são baseados nos gastos em comparação com os orçamentos e os limites de custos. Orçamentos e alertas são criados para assinaturas e grupos de recursos, tornando-os úteis para monitorar os custos gerais.

  • Exporte dados de custo para uma conta de armazenamento. Isso é útil quando você ou outras pessoas precisam realizar mais análises de custos. Por exemplo, uma equipe financeira pode analisar os dados usando o Excel ou o Power BI. Você pode exportar seus custos em uma programação diária, semanal ou mensal e definir um intervalo de datas personalizado. A exportação de dados de custo é o método recomendado para recuperar conjuntos de dados de custo.

Perguntas Frequentes

Posso encerrar temporariamente um serviço de pesquisa para poupar custos?

A pesquisa é executada como um serviço contínuo. Recursos dedicados estão sempre operacionais e alocados para seu uso exclusivo durante a vida útil do seu serviço. Para interromper totalmente a cobrança, você deve excluir o serviço. A exclusão de um serviço é permanente e também exclui seus dados associados.

Posso alterar a taxa de faturação (nível) de um serviço de pesquisa existente?

Os serviços existentes podem ser alternados entre as camadas Basic e Standard (S1, S2 e S3). Atualmente, você só pode alternar de uma camada inferior para uma camada mais alta, como passar de Basic para S1. Para obter mais informações, consulte Alterar o nível de preços.