Fonctionnalités de Recherche Azure AI

Article
04/04/2024

Recherche Azure AI fournit une récupération des informations et utilise l’intégration IA facultative pour extraire davantage de texte et structurer le contenu.

Le tableau suivant récapitule les fonctionnalités par catégorie. Pour plus d’informations sur la comparaison de Recherche Azure AI à d’autres technologies de recherche, consultez Comparer les options de recherche.

Il existe une parité des fonctionnalités dans tous les clouds publics, privés et souverains Azure, mais certaines fonctionnalités ne sont pas prises en charge dans certaines régions. Pour plus d’informations, consultez Disponibilité des produits par région.

Remarque

Vous recherchez les fonctionnalités en préversion ? Consultez la liste des fonctionnalités d’évaluation.

Fonctionnalités d’indexation

Catégorie	Fonctionnalités
Sources de données	Les index de recherche peuvent accepter du texte de n’importe quelle source, à condition qu’il soit envoyé en tant que document JSON. Les indexeurs sont une fonctionnalité qui automatise l’importation de données à partir de sources de données prises en charge pour extraire du contenu pouvant faire l’objet de recherches dans des magasins de données principaux. Les indexeurs gèrent la sérialisation JSON pour vous et la plupart prennent en charge une certaine forme de détection des modifications et des suppressions. Vous pouvez vous connecter à différentes sources de données, notamment Azure SQL Database, Azure Cosmos DB ou le stockage blob Azure.
Structures de données hiérarchiques et imbriquées	Les types complexes et les collections vous permettent de modéliser pratiquement tout type de structure JSON au sein d’un index de recherche. La cardinalité « un à plusieurs » et « plusieurs à plusieurs » peut être exprimée de manière native à travers des collections, des types complexes et des collections de types complexes.
Analyse linguistique	Les analyseurs sont des composants utilisés pour le traitement au cours des opérations d’indexation et de recherche de texte. Par défaut, vous pouvez utiliser l’analyseur Lucene standard à usage général ou remplacer la valeur par défaut par un analyseur linguistique, un analyseur personnalisé que vous configurez ou un autre analyseur prédéfini qui produit des jetons au format requis. Les analyseurs de langage de Lucene ou de Microsoft sont utilisés pour gérer intelligemment les caractéristiques linguistiques propres à la langue, notamment les temps des verbes, le masculin et le féminin, les noms au pluriel irrégulier (par exemple, « cheval » et « chevaux »), la décomposition des mots, la césure des mots (pour les langues sans espaces), etc. Les analyseurs lexicaux personnalisés servent pour des formes de requêtes complexes telles que la correspondance phonétique et les expressions régulières.

Recherche vectorielle et hybride

Catégorie	Fonctionnalités
Indexation des vecteurs	Dans un index de recherche, ajoutez des champs vectoriels pour prendre en charge les scénarios de recherche vectorielle. Les champs vectoriels peuvent coexister avec des champs non-vecteurs dans le même document de recherche.
Requêtes vectorielles	Formulez des requêtes vectorielles uniques et multiples.
Algorithmes de recherche vectorielle	Utilisez HNSW (Hierarchical Navigable Small World) ou Exhaustive K-Nearest Neighbors (KNN) pour rechercher des vecteurs similaires dans un index de recherche.
Filtres vectoriels	Appliquez des filtres avant ou après l’exécution de la requête pour une plus grande précision lors de la récupération des informations.
Récupération d’informations hybrides	Recherchez des concepts et des mots clés dans une demande de requête hybride unique. La recherche hybride consolide la recherche de vecteurs et de texte, avec un classement sémantique facultatif et un réglage de pertinence pour obtenir des résultats optimaux.
Segmentation et vectorisation des données intégrées (préversion)	Segmentation des données natives par la compétence Fractionnement de texte et vectorisation native par les vecteurs et la compétence AzureOpenAIEmbeddingModel. La vectorisation intégrée (préversion) fournit un pipeline d’indexation de bout en bout des fichiers sources aux requêtes.
Compression et quantification de vecteurs intégrées	Pour réduire la taille de l’index vectoriel en mémoire et sur le disque, utilisez la quantification scalaire intégrée. Vous pouvez également renoncer au stockage de vecteurs dont vous n’avez pas besoin ou attribuer des types de données restreints aux champs vectoriels pour des besoins de stockage réduits.
Importer et vectoriser des données (préversion)	Un nouvel Assistant dans le portail Microsoft Azure qui crée un pipeline d’indexation complet qui inclut la segmentation et la vectorisation des données. L’Assistant crée tous les objets et paramètres de configuration.

Enrichissement par IA et exploration des connaissances

Catégorie	Fonctionnalités
Traitement de l’IA pendant l’indexation	L’enrichissement par IA fait référence à l’image incorporée et au traitement en langage naturel dans un pipeline d’indexeur qui extrait le texte et les informations du contenu qui ne peut pas être indexé pour la recherche en texte intégral. Le traitement de l’IA est réalisé en ajoutant et en combinant des compétences dans un ensemble de compétences, attaché ensuite à un indexeur. L’intelligence artificielle peut être une compétence intégrée de Microsoft, par exemple la traduction de texte ou la reconnaissance optique de caractères (OCR), ou des compétences personnalisées que vous fournissez.
Stockage de contenu enrichi pour l’analyse et la consommation dans des scénarios de non-recherche	Une base de connaissances est un stockage persistant d’un contenu enrichi, destiné à des scénarios de non-recherche tels que l’exploration de données et le traitement de la science des données. Une base de connaissances est définie dans un ensemble de compétences, mais créée dans Stockage Azure en tant qu’objets ou ensembles de lignes tabulaires.
Enrichissements mis en cache	L’enrichissement incrémentiel (préversion) fait référence aux enrichissements mis en cache qui peuvent être réutilisés lors de l’exécution d’un ensemble de compétences. La mise en cache est particulièrement utile dans les ensembles de compétences qui incluent la reconnaissance optique de caractères et l’analyse d’image, des opérations coûteuses.

Interrogation et expérience de l’utilisateur

Catégorie	Fonctionnalités
Recherche de texte de forme libre	La recherche en texte intégral est le principal cas d'utilisation de la plupart des applications basées sur la recherche. Vous pouvez formuler des requêtes à l’aide d’une syntaxe prise en charge. La syntaxe de requête simple offre des opérateurs logiques, de recherche d’expression, de suffixe et de précédence. La syntaxe de requête complète Lucene inclut toutes les opérations de la syntaxe simple, avec en plus des extensions pour la recherche partielle, la recherche de proximité, la promotion de termes et les expressions régulières.
Pertinence	Le scoring simple est l’un des principaux avantages de Recherche Azure AI. Les profils de score permettent de modéliser la pertinence en fonction des valeurs dans les documents eux-mêmes. Par exemple, vous souhaiterez peut-être que les nouveaux produits ou les produits en promotion apparaissent en priorité dans les résultats de la recherche. Vous pouvez également créer des profils de score à l'aide de balises pour obtenir un score personnalisé en fonction de préférences de recherche de client que vous avez suivies et stockées séparément. Le classeur sémantique est une fonctionnalité Premium qui réorganise les résultats en fonction de leur pertinence sémantique avec la requête. Selon votre contenu et votre scénario, elle peut améliorer considérablement la pertinence de la recherche avec presque un minimum de configuration ou d’effort.
Recherche géospatiale	Les fonctions géospatiales filtrent et correspondent à des coordonnées géographiques. Vous pouvez établir une correspondance sur la distance ou par inclusion dans une forme polygonale.
Filtres et facettes	La navigation par facettes est activée par le biais d’un seul paramètre de requête. La Recherche Azure AI renvoie une structure de navigation par facettes que vous pouvez utiliser en tant que code de liste de catégories pour le filtrage autonome (par exemple, pour filtrer les éléments de catalogue par plage de prix ou par marque). L’option Filtres permet d’intégrer la navigation par facettes dans l’interface utilisateur de votre application, d’améliorer la formulation des requêtes et d’appliquer un filtre en fonction de critères spécifiés par les utilisateurs ou les développeurs. Créez des filtres à l’aide de la syntaxe OData.
Expérience utilisateur	L'Autocomplétion peut être activée sur une barre de recherche pour les requêtes prédictives. Suggestions de recherche fonctionne sur les entrées de texte partielle dans une barre de recherche, mais les résultats est également les documents dans vos conditions d’index plutôt que de requête. Synonymes Dans les moteurs de recherche, les synonymes associent des termes équivalents qui élargissent implicitement l’étendue d’une requête, sans que l’utilisateur ait à fournir le terme. Le surligneur d’éléments applique la mise en forme de texte à un mot clé correspondant dans les résultats de la recherche. Vous pouvez choisir quels champs renvoient les extraits de texte en surbrillance. Tri est proposée pour plusieurs champs par le biais du schéma d’index, et elle est activée ou désactivée au moment de la requête avec un paramètre de recherche unique. Pagination et la limitation des résultats de la recherche sont d’un fonctionnement très simple avec le contrôle finement ajusté qu’offre Recherche Azure AI sur vos résultats de recherche.

Fonctionnalités de sécurité

Catégorie	Fonctionnalités
Chiffrement des données	Le chiffrement au repos géré par Microsoft est intégré dans la couche de stockage interne et est irrévocable. Les clés de chiffrement gérées par le client que vous créez et gérez dans Azure Key Vault peuvent être utilisées pour le chiffrement supplémentaire des index et des cartes de synonymes. Pour les services créés après le 1er août 2020, le chiffrement CMK s’étend aux données sur les disques temporaires, pour le double chiffrement complet du contenu indexé.
Protection des points de terminaison	Les règles IP pour la prise en charge du pare-feu entrant vous permettent de configurer des plages IP sur lesquelles le service de recherche acceptera les requêtes. Créez un point de terminaison privé à l’aide d’Azure Private Link pour forcer toutes les requêtes via un réseau virtuel.
Accès entrant	Le contrôle d’accès en fonction du rôle Azure attribue des rôles aux utilisateurs et aux groupes dans Microsoft Entra ID pour un accès contrôlé au contenu et aux opérations de recherche. Vous pouvez également utiliser l’authentification basée sur des clés si vous n’avez pas de locataire Azure.
Sécurité sortante (indexeurs)	L’accès aux données via des points de terminaison privés permet à un indexeur de se connecter à des ressources Azure protégées via Azure Private Link. L’accès aux données à l’aide d’une identité approuvée signifie que les chaînes de connexion aux sources de données externes peuvent omettre les noms d’utilisateur et les mots de passe. Lorsqu’un indexeur se connecte à la source de données, la ressource autorise la connexion si le service de recherche a été précédemment enregistré en tant que service approuvé.

Fonctionnalités de portail

Catégorie	Fonctionnalités
Outils de prototypage et d’inspection	Ajouter un index est un concepteur d’index dans le portail que vous pouvez utiliser pour créer un schéma de base constitué de champs avec attributs et d’autres paramètres. Une fois l’index enregistré, vous pouvez le remplir à l’aide d’un Kit de développement logiciel (SDK) ou de l’API REST pour fournir les données. L’Assistant Importer des données crée des index, des indexeurs, des ensembles de compétences et des définitions de source de données. Si vos données existent dans Azure, cet Assistant peut vous faire gagner beaucoup de temps et d’efforts, en particulier pour l’investigation et l’exploration de la preuve de concept. L’explorateur de recherche est utilisé pour tester les requêtes et affiner les profils de scoring. Créer une application de démonstration permet de générer une page HTML qui peut être utilisée pour tester l’expérience de recherche. Les sessions de débogage s’affichent sous la forme d’un éditeur visuel qui vous permet de déboguer un ensemble de compétences de manière interactive. Celui-ci vous montre les dépendances, la sortie et les transformations.
Surveillance et diagnostics	Activez les fonctionnalités de surveillance pour aller au-delà des métriques visibles en un coup d'œil sur le portail. Des mesures sur les requêtes par seconde, la latence et la limitation sont capturées et affichées sur les pages du portail sans aucune configuration supplémentaire.

Catégorie

Fonctionnalités

Outils de prototypage et d’inspection

Ajouter un index est un concepteur d’index dans le portail que vous pouvez utiliser pour créer un schéma de base constitué de champs avec attributs et d’autres paramètres. Une fois l’index enregistré, vous pouvez le remplir à l’aide d’un Kit de développement logiciel (SDK) ou de l’API REST pour fournir les données.

L’Assistant Importer des données crée des index, des indexeurs, des ensembles de compétences et des définitions de source de données. Si vos données existent dans Azure, cet Assistant peut vous faire gagner beaucoup de temps et d’efforts, en particulier pour l’investigation et l’exploration de la preuve de concept.

L’explorateur de recherche est utilisé pour tester les requêtes et affiner les profils de scoring.

Créer une application de démonstration permet de générer une page HTML qui peut être utilisée pour tester l’expérience de recherche.

Les sessions de débogage s’affichent sous la forme d’un éditeur visuel qui vous permet de déboguer un ensemble de compétences de manière interactive. Celui-ci vous montre les dépendances, la sortie et les transformations.

Surveillance et diagnostics

Activez les fonctionnalités de surveillance pour aller au-delà des métriques visibles en un coup d'œil sur le portail. Des mesures sur les requêtes par seconde, la latence et la limitation sont capturées et affichées sur les pages du portail sans aucune configuration supplémentaire.

Programmabilité

Catégorie	Fonctionnalités
REST	L’API REST du service est destinée aux opérations de plan de données, notamment toutes les opérations relatives à l’indexation, aux requêtes et à l’enrichissement par IA. Vous pouvez également utiliser cette bibliothèque de client pour récupérer des informations et des statistiques sur le système. L’API REST de gestion est destinée à la création et au provisionnement de service via Azure Resource Manager. Vous pouvez également utiliser cette API pour gérer les clés et les capacités.
Azure SDK pour .NET	Azure.Search.Documents est destiné aux opérations de plan de données, notamment toutes les opérations relatives à l’indexation, aux requêtes et à l’enrichissement par IA. Vous pouvez également utiliser cette bibliothèque de client pour récupérer des informations et des statistiques sur le système. Microsoft.Azure.Management.Search est destiné à la création et au provisionnement de service via Azure Resource Manager. Vous pouvez également utiliser cette API pour gérer les clés et les capacités.
Kit de développement logiciel (SDK) Azure pour Java	com.azure.search.documents est destiné aux opérations de plan de données, notamment toutes les opérations relatives à l’indexation, aux requêtes et à l’enrichissement par IA. Vous pouvez également utiliser cette bibliothèque de client pour récupérer des informations et des statistiques sur le système. com.microsoft.azure.management.search est destiné à la création et au provisionnement de service via Azure Resource Manager. Vous pouvez également utiliser cette API pour gérer les clés et les capacités.
Kit de développement logiciel (SDK) Azure pour Python	azure-search-documents est destiné aux opérations de plan de données, notamment toutes les opérations relatives à l’indexation, aux requêtes et à l’enrichissement par IA. Vous pouvez également utiliser cette bibliothèque de client pour récupérer des informations et des statistiques sur le système. azure-mgmt-search est destiné à la création et au provisionnement de service via Azure Resource Manager. Vous pouvez également utiliser cette API pour gérer les clés et les capacités.
Kit de développement logiciel (SDK) Azure pour JavaScript/TypeScript	azure/search-documents est destiné aux opérations de plan de données, notamment toutes les opérations relatives à l’indexation, aux requêtes et à l’enrichissement par IA. Vous pouvez également utiliser cette bibliothèque de client pour récupérer des informations et des statistiques sur le système. azure/arm-searchest destiné à la création et au provisionnement de service via Azure Resource Manager. Vous pouvez également utiliser cette API pour gérer les clés et les capacités.

Share via