Partage via


Compétences de traitement supplémentaire pendant l’indexation (Recherche Azure AI)

Cet article décrit les compétences dans Recherche Azure AI que vous pouvez inclure dans un ensemble de compétences pour accéder au traitement externe.

Une compétence est une opération atomique qui transforme le contenu d’une certaine manière. Souvent, il s’agit d’une opération qui reconnaît ou extrait du texte, mais il peut également s’agir d’une compétence utilitaire qui modifie les enrichissements existants. La sortie est généralement basée sur du texte à utiliser dans la recherche en texte intégral ou les vecteurs à utiliser dans la recherche vectorielle.

Les compétences sont organisées en catégories suivantes :

  • Une compétence intégrée encapsule les appels d’API vers une autre ressource Azure, où les entrées, sorties et étapes de traitement sont bien comprises. Certaines compétences intégrées nécessitent une ressource jointe uniquement pour la facturation, tandis que d’autres utilisent votre modèle ou ressource hébergé par Azure pour la facturation et le traitement.

  • Une compétence personnalisée fournit un code personnalisé qui s’exécute en externe sur le service de recherche. Elle est accessible via un URI. Le code personnalisé est souvent mis à disposition par le biais d’une application de fonction Azure. Pour joindre un modèle open source ou de vectorisation tiers, utilisez une compétence personnalisée.

  • Une compétence utilitaire est interne à Azure AI Search, sans dépendance sur les ressources externes ou les connexions sortantes. La plupart des compétences utilitaires sont non facturables.

Compétences intégrées

Il existe deux types de compétences intégrées :

Ressource Foundry

Les compétences de cette catégorie invoquent les sous-services des Foundry Tools. Pour la facturation plutôt que le traitement, vous devez attacher une ressource Foundry à votre ensemble de compétences. Azure AI Search utilise des ressources internes pour exécuter ces compétences et utilise uniquement votre ressource Foundry à des fins de facturation.

Une petite quantité de traitement n’est pas facturable, mais à des volumes plus importants, le traitement est facturable. Ces compétences sont basées sur des modèles préentraînés à partir de Foundry Tools, ce qui signifie que vous ne pouvez pas entraîner les modèles à l’aide de vos propres données.

Ces compétences sont facturées au tarif standard.

Compétence Descriptif Mesuré par
Incorporations multimodales Azure Vision Image multimodale et vectorisation de texte. Foundry Tools (tarification)
Recherche d’entité personnalisée Recherche du texte dans une liste personnalisée définie par l’utilisateur de mots et d’expressions. Recherche Azure AI (tarification)
Liaison d'entités Cette compétence utilise un modèle préentraîné pour générer des liens pour les entités reconnues vers des articles de Wikipédia. Foundry Tools (tarification)
Reconnaissance d’entité Cette compétence utilise un modèle préformé pour établir des entités pour un ensemble fixe de catégories : champs "Person", "Location", "Organization", "Quantity", "DateTime", "URL", "Email", "PersonType", "Event", "Product", "Skill", "Address", "Phone Number" et "IP Address". Foundry Tools (tarification)
Analyse d’image Cette compétence utilise un algorithme de détection d’image pour identifier le contenu d’une image et générer un texte descriptif. Foundry Tools (tarification)
Extraction d’expressions clés Cette compétence utilise un modèle préformé pour détecter des phrases importantes en fonction de la position du terme, des règles linguistiques, de la proximité d’autres termes et du caractère inhabituel du terme dans la source de données. Foundry Tools (tarification)
Détection de la langue Cette compétence utilise un modèle préformé pour détecter la langue utilisée (un ID de langue par document). Quand plusieurs langues sont utilisées dans les mêmes segments de texte, la sortie est le LCID de la langue utilisée principalement. Foundry Tools (tarification)
OCR Reconnaissance optique de caractères. Foundry Tools (tarification)
Détection d’informations personnelles Cette compétence utilise un modèle préformé pour extraire des informations personnelles d’un texte donné. Elle offre également différentes options pour masquer les entités d’informations personnelles détectées dans le texte. Foundry Tools (tarification)
Sentiment Cette compétence utilise un modèle préformé pour affecter des étiquettes de sentiment (comme « négatif », « neutre » et « positif ») en fonction du score de confiance le plus élevé trouvé par le service au niveau du document et de la phrase enregistrement par enregistrement. Foundry Tools (tarification)
Traduction de texte Cette qualification utilise un modèle préformé pour traduire le texte d’entrée dans diverses langues pour les cas d’usage de normalisation ou de localisation. Foundry Tools (tarification)

Modèle ou ressource hébergé par Azure

Les compétences de cette catégorie appellent des modèles ou des ressources hébergés par Azure que vous possédez pour la facturation et le traitement. Bien qu’Azure Content Understanding fait partie des outils Foundry, la compétence Azure Content Understanding se connecte à votre ressource déployée pour le traitement, pas seulement la facturation.

Ces compétences sont facturées au tarif standard.

Compétence Descriptif Mesuré par
Présentation du contenu Azure Se connecte à Azure Content Understanding pour l’analyse avancée des documents et la segmentation sémantique. Azure Content Understanding (tarification)
Incorporation d’Azure OpenAI Se connecte à un modèle d’incorporation Azure OpenAI déployé pour la vectorisation intégrée. Azure OpenAI (tarification)
Invite GenAI Étend un pipeline d’enrichissement par IA avec un modèle de complétion de conversation Foundry. Azure OpenAI (tarification)

Compétences personnalisées

Les compétences de cette catégorie encapsulent le code externe que vous concevez, développez et déployez sur le web. Vous pouvez ensuite appeler le module à partir d’un ensemble de compétences en tant que compétence personnalisée.

Pour obtenir des conseils sur la création d’une compétence personnalisée, consultez Définir une interface personnalisée et Exemple : création d’une compétence personnalisée pour l’enrichissement par IA.

Compétence Descriptif Mesuré par
AML Étend un pipeline d’enrichissement par IA avec un modèle Foundry ou Azure Machine Learning. Aucun, sauf si votre solution utilise un service Azure limité.
Recherche d’entité personnalisée Étend un pipeline d’enrichissement par IA en détectant les entités définies par l’utilisateur. Aucun, sauf si votre solution utilise un service Azure limité.
API Web Étend un pipeline d’enrichissement par IA en effectuant un appel HTTP dans une API web personnalisée. Aucun, sauf si votre solution utilise un service Azure limité.

Compétences de l’utilitaire

Les compétences de cette catégorie s’exécutent uniquement sur Azure AI Search, itèrent principalement sur les nœuds dans le cache d’enrichissement et sont principalement non facturables.

Compétence Descriptif Mesuré par
Conditionnel Permet le filtrage, l’attribution d’une valeur par défaut et la fusion de données selon une condition. Non applicable
Extraction de documents Extrait le contenu d’un fichier dans le pipeline d’enrichissement. Recherche AZURE AI (tarification) pour l’extraction d’images
Shaper Mappe la sortie sur un type complexe (type de données de plusieurs parties, qui peut être utilisé pour un nom complet, une adresse sur plusieurs lignes ou une combinaison d’un nom et d’un identificateur personnel.) Non applicable
Fusion de texte Consolide en un champ unique du texte issu d’une collection de champs. Non applicable
Fractionnement de texte Fractionne le texte en pages afin que vous puissiez enrichir ou augmenter le contenu de façon incrémentielle. Non applicable