Planejar e gerenciar custos de um serviço da IA do Azure Search

Este artigo explica o modelo de cobrança e os eventos faturáveis da Pesquisa de IA do Azure e fornece diretrizes para gerenciar os custos.

Como primeira etapa, estime os custos de linha de base usando a calculadora de preços do Azure. Como alternativa, também é possível encontrar os custos estimados e as comparações de níveis na página Selecionar um nível de preço ao criar um serviço.

O Azure fornece gerenciamento interno de custos que corta os limites de serviço para fornecer monitoramento de custos inclusivo e a capacidade de definir orçamentos e definir alertas. Os custos da execução de um serviço de pesquisa variam dependendo da capacidade e dos recursos usados. Depois de criar o serviço de pesquisa, otimize a capacidade para pagar apenas pelo necessário.

Entender o modelo de cobrança

A IA do Azure Search é executada na infraestrutura do Azure que acumula custos quando você implanta novos recursos. É importante entender que pode haver outros custos de infraestrutura adicionais que possam ser acumulados.

Ao criar ou usar recursos do Serviço de pesquisa, será realizada a cobrança com base nos seguintes medidores:

  • É realizada a cobrança por uma taxa por hora com base no nível de preço do serviço de pesquisa, rateado para a hora.

  • O custo é aplicado de acordo com o número de unidades de pesquisa (SU) alocadas ao serviço. As unidades de pesquisa são unidades de capacidade. A SU total é o produto de réplicas e partições (R x P = SU) usadas pelo serviço.

A cobrança é baseada na capacidade (UAs) e nos custos da execução dos recursos premium, como o Enriquecimento de IA, classificador semântico e Pontos de extremidade privados. Os medidores associados aos recursos premium são listados na tabela a seguir.

Medidor Unidade
Extração de imagem (enriquecimento de IA) 1, 2 Por 1000 imagens. Consulte a página de preços.
Habilidade de pesquisa de entidade personalizada (enriquecimento de IA) 1 Por 1000 registros de texto. Confira a página de preços
Habilidades internas (Enriquecimento de IA) 1 Número de transações cobradas à mesma taxa como se você tivesse executado a tarefa chamando diretamente dos serviços de IA do Azure. Você pode processar 20 documentos por indexador por dia gratuitamente. Cargas de trabalho maiores ou mais frequentes exigem uma chave de serviços de IA do Azure com vários recursos.
Classificador semântico1 Número de consultas de "queryType=semantic", cobradas a uma taxa progressiva. Consulte a página de preços.
Link privado compartilhado1 Cobrado pela largura de banda desde que o link privado compartilhado exista e seja usado.

1 Aplica-se somente se o recurso é usado ou está habilitado.

2 Em uma configuração do indexador, imageAction é o parâmetro que dispara a extração de imagem. SeimageAction for definido como "nenhum" (o padrão), não haverá cobrança pela extração de imagem. Os custos são incorridos quando o parâmetro imageAction está definido e você inclui OCR, Análise de Imagem ou Extração de Documentos em um conjunto de habilidades.

Não há cobrança pelo número de consultas de texto completo ou vetor, respostas a consultas ou documentos ingeridos, embora os limites de serviço sejam aplicados em cada camada.

O tráfego de dados também pode incorrer em custos de rede. Veja Preços de largura de banda.

Vários recursos premium, como repositório de conhecimento, sessões de depuração e cache de enriquecimento, têm uma dependência no Armazenamento do Microsoft Azure. Os medidores do Armazenamento do Microsoft Azure se aplicam nesse caso e os custos de armazenamento associados ao uso desses recursos são incluídos na fatura do Armazenamento do Microsoft Azure.

Chaves gerenciadas pelo cliente fornecem criptografia dupla de conteúdo confidencial. Esse recurso requer um Azure Key Vault faturável).

O conjunto de habilidades pode incluir habilidades internas faturáveis, habilidades de utilitário internas não faturáveis e habilidades personalizadas. As habilidades do utilitário sem cobrança incluem Condicional, Formador, Mesclagem de Texto, Divisão de Texto. Não há cobrança por usá-los. Não há nenhum requisito de chave de API e nenhum limite de 20 documentos.

A habilidade personalizada é a funcionalidade que você fornece. O custo de usar uma habilidade personalizada depende totalmente se o código personalizado está chamando outros serviços faturáveis. Não há nenhum requisito de chave de API e nenhum limite de 20 documentos em habilidades personalizadas.

Monitorar custos

O gerenciamento de custos é compilado à infraestrutura do Azure. Revise oGerenciamento de custos e cobrançapara obter mais informações sobre como acompanhar os custos, ferramentas e APIs.

Minimizar custos

Siga estas diretrizes para minimizar os custos de uma solução da IA do Azure Search.

  1. Se possível, crie um serviço de pesquisa [em uma região que tenha mais armazenamento por partição](regiões com suporte. Se você estiver usando vários recursos do Azure em sua solução, crie-os na mesma região ou no menor número possível de regiões para minimizar ou eliminar encargos de largura de banda.

  2. Escalar verticalmente as operações com uso intensivo de recursos, como indexação e reajuste para baixo das cargas de trabalho de consulta regular. Se houver padrões previsíveis para suas cargas de trabalho, será possível sincronizar a escala para coincidir com o volume esperado (seria necessário escrever código para automatizar o processo).

    Quando estiver estimando o custo de uma solução de pesquisa, tenha em mente que os preços e a capacidade não são lineares (dobrar a capacidade aumenta em mais de duas vezes o custo na mesma camada). Além disso, em algum momento, mudar para uma camada superior pode fornecer um desempenho melhor e mais rápido, aproximadamente pelo mesmo preço. Para obter mais informações e um exemplo, consulte Atualizar para uma camada Standard S2.

  3. Considere o aplicativo Web do Azure do aplicativo front-end para que as solicitações e respostas permaneçam dentro do limite do data center.

  4. Se estiver usando o enriquecimento de IA, haverá um custo extra de armazenamento de blob, mas o custo cumulativo será reduzido se você habilitar o cache de enriquecimento.

Criar orçamentos

É possível criar orçamentos para gerenciar custos e criar alertas que notificam automaticamente os stakeholders de anomalias de gastos e risco de gastos em excesso. Os alertas são baseados nos gastos comparados com os limites de orçamento e de custo. Orçamentos e alertas são criados para assinaturas e grupos de recursos do Azure, para que sejam úteis como parte de uma estratégia de monitoramento de custo geral.

Os orçamentos podem ser criados com filtros para recursos ou serviços específicos no Azure se você quiser mais granularidade no monitoramento. Os filtros ajudam a garantir que você não crie acidentalmente novos recursos com custo extra. Para obter mais informações sobre as opções de filtro disponíveis ao criar um orçamento, confira Opções de grupo e filtro.

Exportar dados de custo

Você também pode exportar seus dados de custo para uma conta de armazenamento. Isso é útil quando você ou outras pessoas precisam realizar mais análises de dados para custos. Por exemplo, uma equipe de finanças pode analisar os dados usando o Excel ou o Power BI. Você pode exportar seus custos em uma agenda diária, semanal ou mensal e definir um intervalo de datas personalizado. A exportação de dados de custo é a maneira recomendada de recuperar conjuntos de dados de custos.

Perguntas frequentes

Posso desligar um serviço de pesquisa temporariamente para economizar nos custos?

A pesquisa é executado como um serviço contínuo. Os recursos dedicados estão sempre operacionais, alocados para seu uso exclusivo durante o tempo de vida do serviço. Para interromper totalmente a cobrança, é necessário excluir o serviço. Excluir um serviço será permanente e também exclui seus dados associados.

Posso alterar a taxa de cobrança (nível) de um serviço de pesquisa existente?

Não há suporte para atualização in-loco ou para fazer downgrade. Alterar uma camada de serviço requer o provisionamento de um novo serviço na camada desejada.

Próximas etapas