Partager via


Planifier et gérer les coûts d’un service de recherche Azure AI

Cet article explique comment Azure AI Search est facturé, y compris les coûts fixes et variables, et fournit des conseils pour la gestion des coûts.

Avant de créer un service de recherche, utilisez la calculatrice de prix Azure pour estimer les coûts en fonction de votre capacité et de vos fonctionnalités planifiées. Une autre ressource est une feuille de calcul de planification de la capacité qui modélise la taille de votre index, le débit d’indexation et les coûts d’indexation attendus.

À mesure que votre charge de travail de recherche évolue, suivez nos conseils pour réduire les coûts pendant le déploiement et l’opération. Vous pouvez également utiliser des métriques intégrées pour surveiller les requêtes et Cost Management pour créer des budgets, des alertes et des exportations de données.

Remarque

Les partitions à capacité supérieure sont disponibles au même taux de facturation sur les services créés après avril et mai 2024. Pour plus d’informations sur les mises à niveau de taille de partition, consultez Limites de service.

Comprendre le modèle de facturation

Azure AI Search a à la fois une facturation fixe et de paiement à l’utilisation. Vous payez un taux fixe pour votre service de recherche tant qu’il existe, tandis que les fonctionnalités Premium sont facturées en fonction de votre utilisation.

Les coûts de Recherche d’IA Azure ne sont qu’une partie des coûts mensuels dans votre facture Azure. Bien que cet article se concentre sur la planification et la gestion des coûts azure AI Search, vous êtes facturé pour tous les services et ressources Azure utilisés dans votre abonnement Azure, y compris les services non-Microsoft.

Comment vous êtes facturé pour le service de base

Lorsque vous créez ou utilisez des ressources de recherche, vous êtes facturé pour la combinaison minimale requise de réplica et de partition (R × P) au taux horaire prorata de votre niveau tarifaire. À mesure que vos unités de recherche augmentent ou diminuent, vos coûts en font de même. Pour plus d’informations et un exemple de modèle de facturation, consultez Tarifs de facturation.

Comment vous êtes facturé pour les fonctionnalités Premium

Les fonctionnalités Premium sont facturées en plus du coût de base de votre service de recherche. Le tableau suivant répertorie les fonctionnalités Premium et leurs unités de facturation. Toutes ces fonctionnalités sont facultatives. Par conséquent, si vous ne les utilisez pas, vous n’êtes pas facturé.

Caractéristique Unité de facturation
Extraction d’images (enrichissement par IA) 1 Par unité de 1 000 images. Consultez la page de tarification.
Compétence de recherche d’entité personnalisée (enrichissement par IA) Par unité de 1 000 enregistrements texte. Consultez la page de tarification
Compétences intégrées ou personnalisées (enrichissement par IA) 2 Nombre de transactions. Facturé au taux du fournisseur de modèles : services Azure AI, Azure OpenAI ou Azure AI Foundry.
Vectoriseurs2 Nombre d’opérations de vectorisation. Facturé au taux du fournisseur de modèles : Azure AI Vision, Azure OpenAI ou Azure AI Foundry.
Classeur sémantique Nombre de requêtes de queryType=semantic. Facturé à un taux progressif. Consultez la page de tarification.
Liaison privée partagée Facturé pour la bande passante tant que la liaison privée partagée existe et est utilisée.

1 Fait référence aux images extraites d’un fichier dans le pipeline d’indexeur. L’extraction de texte est gratuite. L’extraction d’images est facturée lorsque vous activez le indexAction paramètre ou lorsque vous appelez la compétence Extraction de documents.

2 Frais pour les modèles Azure OpenAI et les modèles Azure AI Foundry apparaissent sur votre facture pour ces services.

Les autres façons dont vous êtes facturé

Selon votre configuration et votre utilisation, les frais suivants peuvent s’appliquer :

Remarque

Vous n’êtes pas facturé pour le nombre de requêtes de texte intégral ou de vecteur, de réponses de requête ou de documents ingérés. Toutefois, les limites de service s’appliquent à chaque niveau tarifaire.

Estimer et planifier les coûts

Utilisez la calculatrice de prix Azure pour estimer vos coûts de base pour Recherche Ia Azure. Vous pouvez également trouver les coûts estimés et les comparaisons de niveaux dans la page Sélectionner le niveau tarifaire lors de la création du service.

Pour les tests initiaux, nous vous recommandons de créer une feuille de calcul de planification de capacité. La feuille de calcul vous aide à comprendre le ratio index-source et l’effet des fonctionnalités d’enrichissement ou de vecteur sur la capacité et le coût.

Pour créer une feuille de calcul de planification de capacité :

  1. Indexez un petit échantillon (1 à 5%) de vos données. Incluez toutes les compétences OCR, enrichissement ou incorporation que vous envisagez d’utiliser.

  2. Mesurez la taille de l’index, le débit d’indexation et les coûts d’indexation.

  3. Extrapolez les résultats pour estimer les exigences de mise à l’échelle complète pour vos données.

Réduire le coût

Pour réduire les coûts de votre solution Recherche d’IA Azure, utilisez les stratégies suivantes :

Déploiement et configuration

  • Créez un service de recherche dans une région avec plus de stockage par partition.

  • Créez toutes les ressources Azure associées dans la même région (ou autant de régions que possible) pour réduire ou éliminer les frais de bande passante.

  • Choisissez le niveau tarifaire le plus léger qui répond à vos besoins. Essentiel et S1 offrent un accès complet à l’API moderne au taux horaire le plus bas par unité de stockage.

  • Utilisez Azure Web Apps pour votre application frontale pour conserver les demandes et les réponses au sein de la limite du centre de données.

Croissance

  • Ajoutez des partitions uniquement lorsque la taille d’index ou le débit d’ingestion l’exige.

  • Ajoutez des réplicas uniquement lorsque le nombre de vos requêtes par seconde augmente, lorsque des requêtes complexes ralentissent votre service, ou lorsque la haute disponibilité est requise.

  • Effectuez un scale-up pour les opérations nécessitant beaucoup de ressources, telles que l’indexation, puis réajustez à la baisse les charges de travail de requête régulières.

  • Écrivez du code pour automatiser la mise à l’échelle pour les modèles de charge de travail prévisibles.

  • N’oubliez pas que la capacité et la tarification ne sont pas linéaires. Le doublement de la capacité fait que les coûts augmentent de plus du double sur le même palier. Pour de meilleures performances à un prix similaire, envisagez de passer à un niveau supérieur.

Indexation et enrichissement

Superviser les coûts

Au niveau du service, vous pouvez surveiller les métriques intégrées pour vos requêtes par seconde (QPS), la latence de recherche, les requêtes limitées et la taille d’index. Vous pouvez ensuite créer un tableau de bord Azure Monitor qui superpose QPS, latence et données de coût pour déterminer quand ajouter ou supprimer des réplicas.

Au niveau de l’abonnement ou du groupe de ressources, Cost Management fournit des outils pour suivre, analyser et contrôler les coûts. Vous pouvez utiliser Cost Management pour :

  • Créez des budgets qui définissent et suivent les progrès par rapport aux limites de dépense. Pour une surveillance plus précise, personnalisez vos budgets à l’aide de filtres pour des ressources ou services Azure spécifiques. Les filtres vous empêchent de créer accidentellement des ressources qui entraînent des coûts supplémentaires.

  • Créez des alertes qui informent automatiquement les parties prenantes des anomalies de dépense ou des risques trop importants. Les alertes sont basées sur les dépenses par rapport aux seuils de budget et de coût. Les budgets et les alertes sont créés pour les abonnements et les groupes de ressources, ce qui les rend utiles pour surveiller les coûts globaux.

  • Exporter des données de coût vers un compte de stockage. Cela est utile lorsque vous ou d’autres avez besoin d’effectuer plus d’analyse des coûts. Par exemple, une équipe Finance peut analyser les données avec Excel ou Power BI. Vous pouvez exporter vos coûts selon une planification quotidienne, hebdomadaire ou mensuelle, et définir une plage de dates personnalisée. L’exportation des données de coût est la méthode recommandée pour récupérer les jeux de données de coût.

Questions fréquentes (FAQ)

Puis-je arrêter temporairement un service de recherche pour réduire les coûts ?

La recherche s’exécute en tant que service continu. Les ressources dédiées sont toujours opérationnelles et allouées pour votre utilisation exclusive pendant la durée de vie de votre service. Pour arrêter entièrement la facturation, vous devez supprimer le service. La suppression d'un service est définitive, et elle entraîne également la suppression des données associées à celui-ci.

Puis-je modifier le taux (niveau) de facturation d’un service de recherche existant ?

Les services existants peuvent être basculés entre les niveaux De base et Standard (S1, S2 et S3). Actuellement, vous ne pouvez passer d’un niveau inférieur qu’à un niveau supérieur, par exemple passer de Basic à S1. Pour plus d’informations, consultez Modifier votre niveau tarifaire.