Partage via


Détection de la base

L’API de détection du fondement détecte si les réponses textuelles de modèles de langage volumineux (LLMs) sont fondées dans les documents sources fournis par les utilisateurs. L’absence de fondement fait référence aux instances où les LLM produisent des informations non factuelles ou inexactes à partir de ce que contenaient les documents sources.

Termes clés

  • Génération augmentée de récupération (RAG) : RAG est une technique permettant d’augmenter les connaissances LLM avec d’autres données. Les modules LLM peuvent raisonner sur des sujets très variés, mais leurs connaissances sont limitées aux données publiques disponibles au moment où elles ont été formées. Si vous souhaitez créer des applications IA qui peuvent raisonner sur les données privées ou les données introduites après la date de coupure d’un modèle, vous devez fournir ces intelligence artificielle spécifiques au modèle. Le processus consistant à apporter les informations appropriées et à les insérer dans l’invite du modèle est connu sous le nom de Génération augmentée de récupération (RAG). Pour plus d’informations, consultez Génération augmentée de récupération (RAG).

  • Présence et absence de fondement dans les LLM : cela fait référence à la mesure dans laquelle les sorties du modèle sont basées sur des informations fournies ou reflètent des sources fiables avec précision. Une réponse fondée adhère étroitement à l’information donnée, évitant ainsi la spéculation ou l’affabulation. Dans les mesures du fondement, les informations sources sont cruciales et servent de source de base.

Fonctionnalités de détection du fondement

  • Sélection de domaine : les utilisateurs peuvent choisir un domaine établi pour garantir une détection plus personnalisée qui s’aligne sur les besoins spécifiques de leur champ. Actuellement, les domaines disponibles sont MEDICAL et GENERIC.
  • Spécification de tâche : cette fonctionnalité vous permet de sélectionner la tâche que vous effectuez, telle que QnA (question et réponse) et Résumé, avec des paramètres réglables en fonction du type de tâche.
  • Vitesse et interprétabilité : il existe deux modes qui permettent de concilier la rapidité et l’interprétabilité des résultats.
    • Mode non raisonné : offre une fonctionnalité de détection rapide, facile à incorporer dans des applications en ligne.
    • Mode raisonné : offre des explications détaillées pour les segments non fondés détectés, cela permet de mieux comprendre et d’atténuer les effets.

Cas d’utilisation

La détection du fondement prend en charge les tâches Résumé et QnA basées sur le texte pour s’assurer que les résumés ou réponses générés sont exacts et fiables. Voici quelques exemples de chaque cas d’usage :

Tâches de résumé :

  • Résumé médical : dans le contexte d’articles d’actualités médicales, la détection du fondement peut être utilisée pour s’assurer que le résumé ne contient pas d’informations fabriquées ou trompeuses, garantissant que les lecteurs obtiennent des informations médicales précises et fiables.
  • Résumé des documents universitaires : lorsque le modèle génère des résumés d’articles universitaires ou de recherche, la fonction peut contribuer à garantir que le contenu résumé représente avec précision les résultats et contributions clés sans introduire de fausses informations.

Tâches QnA :

  • Chatbots de support client : dans le support client, la fonction peut être utilisée pour valider les réponses fournies par les chatbots IA, ce qui garantit que les clients reçoivent des informations précises et fiables lorsqu’ils posent des questions sur les produits ou services.
  • QnA médical : pour le QnA médical, la fonction permet de vérifier la précision des réponses médicales et des conseils fournis par les systèmes d’IA aux professionnels de la santé et aux patients, ce qui réduit le risque d’erreurs médicales.
  • QnA éducatif : dans les paramètres éducatifs, la fonction peut être appliquée aux tâches QnA pour confirmer que les réponses aux questions académiques ou aux requêtes de préparation de test sont exactes de façon factuelle, favorisant le processus d’apprentissage.

Limites

Disponibilité de la langue

Actuellement, l’API de détection du fondement prend en charge le contenu en langue anglaise. Bien que notre API ne limite pas la soumission de contenu non anglais, nous ne pouvons pas garantir le même niveau de qualité et de précision dans l’analyse de contenu dans une autre langue. Nous recommandons aux utilisateurs d’envoyer du contenu principalement en anglais pour garantir les résultats les plus fiables et précis de l’API.

Limitations de longueur du texte

La limite maximale de caractères pour les sources de fondement est de 55 000 caractères par appel d’API, et pour le texte et la requête, elle est de 7 500 caractères par appel d’API. Si votre entrée (texte ou sources de fondement) dépasse ces limitations de caractères, vous rencontrerez une erreur.

Régions

Pour utiliser cette API, devez créer votre ressource Azure AI Sécurité du contenu dans les régions prises en charge. Consultez Disponibilité dans les régions.

Limitations de TPS

Consultez Taux de requête.

Si vous avez besoin d’un débit plus élevé, contactez-nous pour le demander.

Étapes suivantes

Suivez le guide de démarrage rapide pour commencer à utiliser Azure AI Sécurité du contenu pour détecter le fondement.