Choisir un niveau de service pour la recherche Azure AI

Créer un service de recherche implique entre autres de choisir un niveau tarifaire (ou une référence SKU) qui est fixé pour toute la durée de vie du service. Dans le portail, le niveau est spécifié sur la page Sélectionnez le niveau tarifaire lorsque vous créez le service. Si vous approvisionnez par le biais de PowerShell ou d’Azure CLI, le niveau est spécifié à l’aide du paramètre -Sku

Le niveau que vous sélectionnez détermine ce qui suit :

  • Nombre maximal d’index et d’autres objets autorisés sur le service
  • Taille et la vitesse des partitions (stockage physique)
  • Taux facturable, comme un coût mensuel fixe, mais également un coût incrémentiel si vous ajoutez plus de capacité

Dans quelques instances, le niveau que vous choisissez détermine la disponibilité des fonctionnalités Premium.

La tarification, ou le coût mensuel estimé pour l’exécution du service, s’affichent dans la page du portail Sélectionnez le niveau tarifaire. Vous devriez vérifier la tarification de service pour en savoir plus sur les coûts estimés.

Remarque

Les services de recherche créés après le 3 avril 2024 ont des partitions plus grandes et des quotas de vecteurs plus élevés à presque tous les niveaux. Pour plus d’informations, consultez les limites du service.

Descriptions des niveaux

Les niveaux disponibles sont : Gratuit, De base, Standard et À stockage optimisé. Les niveaux Standard et À stockage optimisé sont proposés dans diverses configurations et capacités. La capture d’écran suivante du portail Microsoft Azure indique les niveaux disponibles, après la déduction indiquée sur le portail et dans la page de tarification.

Graphique du niveau tarifaire

Le niveau Gratuit crée un service de recherche limité pour les projets plus petits, notamment les tutoriels et les exemples de code. En interne, les ressources système sont partagées entre plusieurs abonnés. Vous ne pouvez pas mettre à l’échelle un service gratuit ni exécuter des charges de travail importantes. Vous ne pouvez avoir qu’un seul service de recherche gratuit par abonnement Azure.

Les niveaux facturables les plus couramment utilisés sont les suivants :

  • Basic a la capacité de respecter le contrat de niveau de service (SLA) en prenant en charge trois répliques.

  • Standard (S1, S2, S3) est la valeur par défaut. Ce niveau vous offre davantage de flexibilité en matière de mise à l’échelle des charges de travail. Vous pouvez mettre à l’échelle à la fois les partitions et les réplicas. Grâce à des ressources dédiées sous votre contrôle, vous pouvez déployer des projets plus volumineux, optimiser les performances et augmenter la capacité.

Certains niveaux sont conçus pour certains types de travaux :

  • Le niveau Standard 3 High Density (S3 HD) est un mode d’hébergement pour S3, où le matériel sous-jacent est optimisé pour un grand nombre d’index plus petits, qui est destiné aux scénarios d’architecture mutualisée. Le niveau S3 HD présente les mêmes frais à l’unité que S3, mais le matériel est optimisé pour les lectures de fichiers rapides sur un grand nombre d’index plus petits.

  • Les niveaux À stockage optimisé (L1, L2) offrent une capacité de stockage plus importante et à moindre coût par To que les niveaux Standard. Ces niveaux sont conçus pour les index volumineux qui ne changent pas très souvent. Le principal compromis impliqué par ces niveaux réside dans une latence de requête plus élevée, ce que vous devez valider pour vos exigences applicatives spécifiques.

Des informations complémentaires sur les différents niveaux sont disponibles sur la page de tarification, dans l’article Service limits in Azure AI Search (Limites du service de recherche Azure AI), ainsi que sur la page du portail lorsque vous approvisionnez un service.

Disponibilité des fonctionnalités par niveau

La plupart des fonctionnalités sont disponibles dans tous les niveaux, y compris le niveau gratuit. Dans certains cas, le niveau détermine la disponibilité d’une fonctionnalité. Le tableau suivant décrit les contraintes.

Fonction Limites
indexeurs Les indexeurs ne sont pas disponibles sur S3 HD. Les indexeurs ont davantage de limitations sur le niveau gratuit.
Enrichissement par IA Fonctionne au niveau Gratuit, mais n’est pas recommandé.
Identités managées ou approuvées pour l’accès sortant (indexeur) Non disponibles au niveau Gratuit.
Clés de chiffrement gérées par le client Non disponibles au niveau Gratuit.
Accès au pare-feu IP Non disponibles au niveau Gratuit.
Point de terminaison privé (intégration à Azure Private Link) Pour les connexions entrantes à un service de recherche ; non disponible au niveau Gratuit. Pour les connexions sortantes, par des indexeurs, à d'autres ressources Azure ; non disponible aux niveaux Gratuit et S3 HD. Pour les indexeurs qui utilisent des ensembles de compétences ; non disponible aux niveaux Gratuit, De base, S1 et S3 HD.
Zones de disponibilité Non disponibles au niveau Gratuit ou De base.
Classeur sémantique Non disponibles au niveau Gratuit.

Les fonctionnalités gourmandes en ressources risquent de ne pas fonctionner correctement si vous ne leur attribuez pas une capacité suffisante. Par exemple, l’enrichissement par IA implique des qualifications à long terme qui dépassent le délai d’attente sur un service Gratuit, sauf si le jeu de données est restreint.

Limites supérieures

Les niveaux déterminent le stockage maximal du service proprement dit, ainsi que le nombre maximal d’index, d’indexeurs, de sources de données, d’ensembles de compétences et de cartes de synonymes que vous pouvez créer. Pour connaître toutes les limites, consultez Limites de service de recherche Azure AI.

Taille et vitesse de la partition

La tarification par niveau comprend des détails sur le stockage par partition qui va de 15 Go pour le niveau de base, jusqu’à 2 To pour les niveaux de stockage optimisé (L2). D’autres caractéristiques matérielles, telles que la vitesse des opérations, la latence et les taux de transfert, ne sont pas publiées, mais les niveaux conçus pour des architectures de solution spécifiques sont basés sur du matériel qui possède les caractéristiques nécessaires pour prendre en charge ces scénarios. Pour plus d’informations sur les partitions, consultez Estimer et gérer la capacité et Fiabilité dans la recherche Azure AI.

Tarifs de facturation

Les niveaux ont des tarifs de facturation différents, avec des tarifs plus élevés pour les niveaux qui s’exécutent sur du matériel plus onéreux ou qui offrent des fonctionnalités plus coûteuses. Le taux de facturation par niveau est disponible dans les pages de tarification Azure pour la Recherche Azure AI.

Une fois que vous avez créé un service, le tarif de facturation devient à la fois un coût fixe pour faire fonctionner le service 24 h sur 24 et un coût incrémentiel si vous choisissez d’ajouter plus de capacité.

Les services de recherche sont alloués aux ressources de calcul sous la forme de partitions (pour le stockage) et de réplicas (instances du moteur d’interrogation). Au départ, un service est créé avec un de chaque, et le tarif de facturation comprend les deux ressources. Toutefois, si vous mettez à l’échelle la capacité, les coûts augmentent ou diminuent par incréments du tarif facturable.

L'exemple suivant illustre cette situation. Supposons un tarif de facturation hypothétique de 100 USD par mois. Si vous conservez le service de recherche à sa capacité initiale d’une partition et d’un réplica, vous pouvez alors vous attendre à payer la somme de 100 USD à la fin du mois. Toutefois, si vous ajoutez deux réplicas supplémentaires pour obtenir une haute disponibilité, la facture mensuelle s’élève à 300 USD (100 USD pour la première paire réplica-partition, puis 200 USD pour les deux réplicas).

Ce modèle de facturation est basé sur le concept d’application du tarif de facturation au nombre d’unités de recherche (SU) utilisées par un service de recherche. Tous les services sont initialement approvisionnés avec une SU, mais vous pouvez augmenter le nombre de SU en ajoutant des partitions ou des réplicas pour gérer des charges de travail plus volumineuses. Pour plus d’informations, consultez Comment estimer les coûts d’un service de recherche.

Passer à un niveau supérieur ou inférieur

Il n’existe aucune prise en charge intégrée pour passer à un niveau supérieur ou inférieur. Si vous souhaitez passer à un autre niveau, l’approche est la suivante :

  • Créez un service de recherche au nouveau niveau.

  • Déployez votre contenu de recherche sur le nouveau service. Suivez cette liste de contrôle pour vous assurer que vous disposez de tout le contenu.

  • Supprimez l’ancien service de recherche une fois que vous êtes sûr qu’il n’est plus nécessaire.

Pour les index volumineux que vous ne souhaitez pas reconstruire à partir de zéro, envisagez d’utiliser l’échantillon de sauvegarde et de restauration pour les déplacer.

Étapes suivantes

La meilleure façon de choisir un niveau tarifaire est de commencer par le niveau le moins cher, puis de laisser l’expérience et les tests éclairer votre décision de conserver le service ou d’en créer un nouveau à un niveau supérieur. Pour les étapes suivantes, nous vous recommandons de créer un service de recherche à un niveau qui puisse prendre en charge le niveau de test que vous vous proposez de faire, puis de consulter l’aide suivante pour obtenir des recommandations sur l’estimation du coût et de la capacité.