Compartilhar via


Planejar e gerenciar custos de um serviço da IA do Azure Search

Este artigo explica como o Azure AI Search é cobrado, incluindo custos fixos e variáveis, e fornece diretrizes para o gerenciamento de custos.

Antes de criar um serviço de pesquisa, use a calculadora de preços do Azure para estimar os custos com base em sua capacidade e recursos planejados. Outro recurso é uma planilha de planejamento de capacidade que modela o tamanho do índice esperado, a taxa de transferência de indexação e os custos de indexação.

À medida que a carga de trabalho de pesquisa evolui, siga nossas dicas para minimizar os custos durante a implantação e a operação. Você também pode usar métricas internas para monitorar solicitações de consulta e Gerenciamento de Custos para criar orçamentos, alertas e exportações de dados.

Observação

Partições de maior capacidade estão disponíveis com a mesma taxa de cobrança em serviços criados após abril e maio de 2024. Para obter mais informações sobre atualizações de tamanho de partição, consulte os limites de serviço.

Entender o modelo de cobrança

O Azure AI Search tem cobrança fixa e paga conforme o uso. Você paga uma taxa fixa pelo serviço de pesquisa desde que ela exista, enquanto os recursos premium são cobrados de acordo com seu uso.

Os custos do Azure AI Search são apenas uma parte dos custos mensais em sua fatura do Azure. Embora este artigo se concentre no planejamento e gerenciamento de custos do Azure AI Search, você é cobrado por todos os serviços e recursos do Azure usados em sua assinatura do Azure, incluindo serviços que não são da Microsoft.

Como você é cobrado pelo serviço básico

Ao criar ou usar recursos de pesquisa, você é cobrado pela combinação mínima de replicação e partição necessária (R × P) na taxa proporcional por hora do seu tipo de preço. À medida que suas unidades de pesquisa aumentam ou diminuem, seus custos também aumentam. Para obter mais informações e um exemplo do modelo de cobrança, consulte as taxas de cobrança.

Como você é cobrado pelas funcionalidades premium

Os recursos Premium são cobrados além do custo base do serviço de pesquisa. A tabela a seguir lista os recursos premium e suas unidades de cobrança. Todos esses recursos são opcionais, portanto, se você não usá-los, não incorre em encargos.

Característica Unidade de cobrança
Extração de imagem (enriquecimento de IA) 1 Por 1.000 imagens. Consulte a página de preços.
Habilidade de pesquisa de entidade personalizada (enriquecimento de IA) Por 1.000 registros de texto. Confira a página de preços
Habilidades internas ou personalizadas (enriquecimento de IA) 2 Número de transações. Cobrado à taxa do provedor de modelos: serviços de IA do Azure, Azure OpenAI ou Azure AI Foundry.
Vetorizadores2 Número de operações de vetorização. Cobrado à taxa do provedor de modelo: Visão de IA do Azure, Azure OpenAI ou Azure AI Foundry.
Classificador semântico Número de consultas de queryType=semantic. Cobrado em uma taxa progressiva. Consulte a página de preços.
Link privado compartilhado Cobrado pela largura de banda desde que o link privado compartilhado exista e seja usado.

1 Refere-se às imagens extraídas de um arquivo dentro do pipeline do indexador. A extração de texto é gratuita. A extração de imagem é cobrada quando você habilita o indexAction parâmetro ou quando chama a habilidade de Extração de Documentos.

2 Encargos para modelos do Azure OpenAI e modelos do Azure AI Foundry aparecem em sua fatura para esses serviços.

Como você é cobrado de outra forma

Dependendo da configuração e do uso, os seguintes encargos podem ser aplicados:

Observação

Você não é cobrado pelo número de consultas de texto completo ou vetor, respostas de consulta ou documentos ingeridos. No entanto, os limites de serviço se aplicam a cada tipo de preço.

Estimar e planejar custos

Use a calculadora de preços do Azure para estimar seus custos de linha de base para o Azure AI Search. Você também pode encontrar os custos estimados e comparações de camada na página Selecionar Tipo de Preço durante a criação do serviço.

Para testes iniciais, recomendamos que você crie uma planilha de planejamento de capacidade. A planilha ajuda a entender a proporção índice-origem e o efeito das características de enriquecimento ou de vetor tanto na capacidade quanto no custo.

Para criar uma planilha de planejamento de capacidade:

  1. Indexe uma amostra pequena (1 a 5%) de seus dados. Inclua qualquer OCR, enriquecimento ou habilidades de inserção que você planeja usar.

  2. Meça o tamanho do índice, o desempenho de indexação e os custos de indexação.

  3. Extrapole os resultados para estimar os requisitos de escala total para seus dados.

Minimizar custos

Para minimizar os custos da solução do Azure AI Search, use as seguintes estratégias:

Implantação e configuração

  • Crie um serviço de pesquisa em uma região com mais armazenamento por partição.

  • Crie todos os recursos relacionados do Azure na mesma região (ou o menor número possível de regiões) para minimizar ou eliminar encargos de largura de banda.

  • Escolha o tipo de preço mais leve que atenda às suas necessidades. Basic e S1 oferecem acesso total à API moderna à menor taxa por hora por unidade de serviço (SU).

  • Use os Aplicativos Web do Azure para seu aplicativo front-end para manter solicitações e respostas dentro do limite do data center.

Escalonamento

  • Adicione partições somente quando o tamanho do índice ou a taxa de transferência de ingestão exigir.

  • Adicione réplicas somente quando suas consultas por segundo aumentarem, quando consultas complexas estiverem limitando seu serviço ou quando a alta disponibilidade for necessária.

  • Aumente a capacidade para operações com uso intensivo de recursos, como indexação, e, em seguida, reduza a capacidade para cargas de trabalho de consulta regulares.

  • Escreva código para automatizar o dimensionamento para padrões previsíveis de carga de trabalho.

  • Lembre-se de que a capacidade e os preços não são lineares. Dobrar a capacidade mais do que dobra os custos na mesma camada. Para obter um melhor desempenho a um preço semelhante, considere mudar para um nível mais alto.

Indexação e enriquecimento

Monitorar custos

No nível do serviço, você pode monitorar métricas internas para suas consultas por segundo (QPS), latência de pesquisa, consultas limitadas e tamanho do índice. Em seguida, você pode criar um painel do Azure Monitor que sobrepõe dados de QPS, latência e custo para determinar quando adicionar ou remover réplicas.

No nível da assinatura ou do grupo de recursos, o Gerenciamento de Custos fornece ferramentas para acompanhar, analisar e controlar os custos. Você pode usar o Gerenciamento de Custos para:

  • Crie orçamentos que definem e acompanhem o progresso em relação aos limites de gastos. Para um monitoramento mais granular, personalize seus orçamentos usando filtros para recursos ou serviços específicos do Azure. Os filtros impedem que você crie acidentalmente recursos que incorrem em custos extras.

  • Crie alertas que notifiquem automaticamente os stakeholders sobre anomalias de gastos ou riscos de gastos excessivos. Os alertas são baseados nos gastos comparados com os limites de orçamento e de custo. Orçamentos e alertas são criados para assinaturas e grupos de recursos, tornando-os úteis para monitorar os custos gerais.

  • Exportar dados de custo para uma conta de armazenamento. Isso é útil quando você ou outras pessoas precisam executar mais análise de custo. Por exemplo, uma equipe de finanças pode analisar os dados usando o Excel ou o Power BI. Você pode exportar seus custos em uma agenda diária, semanal ou mensal e definir um intervalo de datas personalizado. Exportar dados de custo é o método recomendado para recuperar conjuntos de dados de custo.

Perguntas frequentes

Posso desligar um serviço de pesquisa temporariamente para economizar nos custos?

A pesquisa é executada como um serviço contínuo. Os recursos dedicados estão sempre operacionais e alocados para seu uso exclusivo durante o tempo de vida do serviço. Para interromper totalmente a cobrança, é necessário excluir o serviço. Excluir um serviço será permanente e também exclui seus dados associados.

Posso alterar a taxa de cobrança (nível) de um serviço de pesquisa existente?

Os serviços existentes podem ser alternados entre as camadas Básica e Standard (S1, S2 e S3). Atualmente, você só pode alternar de uma camada inferior para uma camada mais alta, como ir de Basic para S1. Para obter mais informações, consulte Alterar seu tipo de preço.