Partager via


Détection de la base

L’API de détection du fondement détecte si les réponses textuelles de modèles de langage volumineux (LLMs) sont fondées dans les documents sources fournis par les utilisateurs. L’absence de fondement fait référence aux instances où les LLM produisent des informations non factuelles ou inexactes à partir de ce que contenaient les documents sources.

Termes clés

  • Génération augmentée de récupération (RAG) : RAG est une technique permettant d’augmenter les connaissances LLM avec d’autres données. Les modules LLM peuvent raisonner sur des sujets très variés, mais leurs connaissances sont limitées aux données publiques disponibles au moment où elles ont été formées. Si vous souhaitez créer des applications IA qui peuvent raisonner sur les données privées ou les données introduites après la date de coupure d’un modèle, vous devez fournir ces intelligence artificielle spécifiques au modèle. Le processus consistant à apporter les informations appropriées et à les insérer dans l’invite du modèle est connu sous le nom de Génération augmentée de récupération (RAG). Pour plus d’informations, consultez Génération augmentée de récupération (RAG).
  • Présence et absence de fondement dans les LLM : ceci fait référence à la mesure dans laquelle les sorties du modèle sont basées sur des informations fournies, ou reflètent avec exactitude des sources fiables. Une réponse fondée adhère étroitement à l’information donnée, évitant ainsi la spéculation ou l’affabulation. Dans les mesures du fondement, les informations sources sont cruciales et servent de source de base.

Options de détection de fondement

Les options suivantes sont disponibles pour la détection de fondement dans Azure AI Sécurité du Contenu :

  • Sélection de domaine : les utilisateurs peuvent choisir un domaine établi pour garantir une détection plus personnalisée qui s’aligne sur les besoins spécifiques de leur champ. Les domaines disponibles sont MEDICAL et GENERIC.
  • Spécification de tâche : cette fonctionnalité vous permet de sélectionner la tâche que vous effectuez, telle que QnA (question et réponse) et Résumé, avec des paramètres réglables en fonction du type de tâche.
  • Vitesse et interprétabilité : il existe deux modes qui permettent de concilier la rapidité et l’interprétabilité des résultats.
    • Mode non raisonné : offre une fonctionnalité de détection rapide, facile à incorporer dans des applications en ligne.
    • Mode raisonné : offre des explications détaillées pour les segments non fondés détectés, cela permet de mieux comprendre et d’atténuer les effets.

Cas d’utilisation

La détection du fondement prend en charge les tâches Résumé et QnA basées sur le texte pour s’assurer que les résumés ou réponses générés sont exacts et fiables. Voici quelques exemples de chaque cas d’usage :

Tâches de résumé :

  • Résumé médical : dans le contexte d’articles d’actualités médicales, la détection du fondement peut être utilisée pour s’assurer que le résumé ne contient pas d’informations fabriquées ou trompeuses, garantissant que les lecteurs obtiennent des informations médicales précises et fiables.
  • Résumé des documents universitaires : lorsque le modèle génère des résumés d’articles universitaires ou de recherche, la fonction peut contribuer à garantir que le contenu résumé représente avec précision les résultats et contributions clés sans introduire de fausses informations.

Tâches QnA :

  • Chatbots de support client : dans le support client, la fonction peut être utilisée pour valider les réponses fournies par les chatbots IA, ce qui garantit que les clients reçoivent des informations précises et fiables lorsqu’ils posent des questions sur les produits ou services.
  • QnA médical : pour le QnA médical, la fonction permet de vérifier la précision des réponses médicales et des conseils fournis par les systèmes d’IA aux professionnels de la santé et aux patients, ce qui réduit le risque d’erreurs médicales.
  • QnA éducatif : dans les paramètres éducatifs, la fonction peut être appliquée aux tâches QnA pour confirmer que les réponses aux questions académiques ou aux requêtes de préparation de test sont exactes de façon factuelle, favorisant le processus d’apprentissage.

Correction du fondement

L’API de détection de fondement comprend une fonctionnalité de correction qui corrige automatiquement toute absence de fondement détectée dans le texte en fonction des sources de référence fournies. Lorsque la fonctionnalité de correction est activée, la réponse inclut un champ corrected Text qui présente le texte corrigé, aligné sur les sources de fondement.

Cas d’utilisation

Vous trouverez ci-dessous plusieurs scénarios courants qui illustrent comment et quand appliquer ces fonctionnalités pour obtenir les meilleurs résultats possible.

Résumé dans les contextes médicaux

Vous résumez des documents médicaux. Il est essentiel que les noms des patients figurant dans les résumés soient exacts et cohérents par rapport aux sources de référence fournies.

Exemple de requête d’API :

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Résultat attendu :

La fonctionnalité de correction détecte que Kevin n’est pas fondé, car il est en conflit avec la source de référence Jane. L’API retourne le texte corrigé : "The patient name is Jane."

Tâche de question/réponse (QnA) avec des données de support

Vous implémentez un système QnA pour un chatbot de support. Il est essentiel que les réponses fournies par l’IA correspondent aux informations les plus récentes et les plus exactes disponibles.

Exemple de requête d’API :

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Résultat attendu :

L’API détecte que 5% n’est pas fondé, car il ne correspond pas à la source de référence fournie 4.5%. La réponse inclut le texte de correction : "The interest rate is 4.5%."

Création de contenu avec des données historiques

Vous créez du contenu impliquant des événements ou données historiques où l’exactitude est essentielle pour préserver la crédibilité et éviter la désinformation.

Exemple de requête d’API :

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Résultat attendu :

L’API détecte la date infondée 1065 et la remplace par 1066 en fonction de la source de base. La réponse inclut le texte corrigé : "The Battle of Hastings occurred in 1066."

Résumé de la documentation interne

Vous résumez des documents internes où les noms de produits, les numéros de version ou d’autres points de données spécifiques doivent rester cohérents.

Exemple de requête d’API :

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Résultat attendu :

La fonctionnalité de correction identifie SuperWidget v2.1 comme étant non fondé, et le remplace par SuperWidget v2.2 dans la réponse. La réponse retourne le texte corrigé : "Our latest product is SuperWidget v2.2."

Bonnes pratiques

Respectez les meilleures pratiques suivantes quand vous configurez les systèmes RAG pour optimiser les performances de l’API de détection de fondement :

  • Quand vous utilisez des noms de produits ou des numéros de version, utilisez des sources de référence directement à partir des notes de publication internes ou de la documentation officielle du produit pour garantir l’exactitude des informations.
  • Pour le contenu historique, croisez vos sources de référence avec des bases de données universitaires ou historiques approuvées afin de garantir le plus haut niveau d’exactitude.
  • Dans un environnement dynamique tel que la finance, utilisez toujours les sources de référence les plus récentes et les plus fiables pour garantir l’exactitude et la pertinence des informations fournies par le système IA.
  • Vérifiez toujours que vos sources de référence sont exactes et à jour, en particulier dans les domaines sensibles tels que la santé. Cela réduit le risque d’erreurs dans le processus de résumé.

Limites

Disponibilité de la langue

Actuellement, l’API de détection du fondement prend en charge le contenu en langue anglaise. Bien que notre API ne limite pas la soumission de contenu non anglais, nous ne pouvons pas garantir le même niveau de qualité et de précision dans l’analyse de contenu dans une autre langue. Nous recommandons aux utilisateurs d’envoyer du contenu principalement en anglais pour garantir les résultats les plus fiables et précis de l’API.

Limitations de longueur du texte

Consultez les exigences d’entrée pour connaître les limites de longueur de texte maximales.

Disponibilité dans les régions

Pour utiliser cette API, devez créer votre ressource Azure AI Sécurité du contenu dans les régions prises en charge. Consultez Disponibilité dans les régions.

Limitations de taux

Consultez Taux de requête.

Si vous avez besoin d’un débit plus élevé, contactez-nous pour le demander.

Étapes suivantes

Suivez le guide de démarrage rapide pour commencer à utiliser Azure AI Sécurité du contenu pour détecter le fondement.