Geaardheidsdetectie

Artikel
10/16/2024

De Groundedness Detection-API detecteert of de tekstreacties van grote taalmodellen (LLM's) worden geaard in de bronmaterialen die door de gebruikers worden geleverd. Niet-geaardheid verwijst naar instanties waarbij de LLM's informatie produceren die niet feitelijk of onnauwkeurig is van wat aanwezig was in de bronmaterialen.

Belangrijke termen

Ophalen augmented generation (RAG): RAG is een techniek voor het uitbreiden van LLM-kennis met andere gegevens. LLM's kunnen reden hebben voor brede onderwerpen, maar hun kennis is beperkt tot de openbare gegevens die beschikbaar waren op het moment dat ze werden getraind. Als u AI-toepassingen wilt bouwen die kunnen redeneren over persoonlijke gegevens of gegevens die na de afkapdatum van een model zijn geïntroduceerd, moet u het model voorzien van die specifieke informatie. Het proces voor het ophalen van de juiste informatie en het invoegen ervan in de modelprompt wordt RAG (Retrieval Augmented Generation) genoemd. Zie Rag (Retrieval-augmented generation) voor meer informatie.
Groundedness and Ungroundedness in LLMs: Dit verwijst naar de mate waarin de uitvoer van het model is gebaseerd op verstrekte informatie of betrouwbare bronnen nauwkeurig weergeeft. Een geaard antwoord houdt zich nauw aan de gegeven informatie, waardoor speculatie of fabricatie wordt vermeden. Bij grondmetingen is broninformatie van cruciaal belang en fungeert deze als de grondbron.

Opties voor detectie van geaardheid

De volgende opties zijn beschikbaar voor groundedness-detectie in Azure AI Content Safety:

Domeinselectie: gebruikers kunnen een ingesteld domein kiezen om meer op maat gemaakte detectie te garanderen die overeenkomt met de specifieke behoeften van hun veld. De huidige beschikbare domeinen zijn MEDICAL en GENERIC.
Taakspecificatie: Met deze functie kunt u de taak selecteren die u uitvoert, zoals QnA (vraag en antwoord) en Samenvatting, met aanpasbare instellingen op basis van het taaktype.
Snelheid versus interpreteerbaarheid: er zijn twee modi die snelheid afruilen met resultaatinterpreteerbaarheid.
- Niet-redeneringsmodus: biedt snelle detectiemogelijkheden; eenvoudig in te sluiten in onlinetoepassingen.
- Redeneringsmodus: biedt gedetailleerde uitleg voor gedetecteerde niet-geaarde segmenten; beter te begrijpen en te beperken.

Gebruiksgevallen

Groundedness-detectie ondersteunt op tekst gebaseerde samenvattings- en QnA-taken om ervoor te zorgen dat de gegenereerde samenvattingen of antwoorden nauwkeurig en betrouwbaar zijn. Hier volgen enkele voorbeelden van elke use-case:

Samenvattingstaken:

Medische samenvatting: In de context van medische nieuwsartikelen kan geaardheidsdetectie worden gebruikt om ervoor te zorgen dat de samenvatting geen ge fabriceerde of misleidende informatie bevat, zodat lezers nauwkeurige en betrouwbare medische informatie verkrijgen.
Samenvatting van academische documenten: Wanneer het model samenvattingen van academische documenten of onderzoeksartikelen genereert, kan de functie ervoor zorgen dat de samengevatte inhoud de belangrijkste bevindingen en bijdragen nauwkeurig vertegenwoordigt zonder valse claims te introduceren.

QnA-taken:

Chatbots voor klantondersteuning: In klantondersteuning kan de functie worden gebruikt om de antwoorden van AI-chatbots te valideren, zodat klanten nauwkeurige en betrouwbare informatie ontvangen wanneer ze vragen stellen over producten of services.
Medische QnA: Voor medische QnA helpt de functie bij het controleren van de nauwkeurigheid van medische antwoorden en advies van AI-systemen aan zorgprofessionals en patiënten, waardoor het risico op medische fouten wordt verminderd.
Educatieve QnA: In onderwijsinstellingen kan de functie worden toegepast op QnA-taken om te bevestigen dat antwoorden op academische vragen of testvoorbereidingsquery's feitelijk nauwkeurig zijn, waardoor het leerproces wordt ondersteund.

Aardingscorrectie

De groundedness detection-API bevat een correctiefunctie waarmee alle gedetecteerde niet-geaardheid in de tekst automatisch wordt gecorrigeerd op basis van de opgegeven grondbronnen. Wanneer de correctiefunctie is ingeschakeld, bevat het antwoord een corrected Text veld waarin de gecorrigeerde tekst wordt weergegeven die is uitgelijnd met de grondbronnen.

Gebruiksgevallen

Hieronder ziet u verschillende veelvoorkomende scenario's die laten zien hoe en wanneer u deze functies toepast om de beste resultaten te behalen.

Samenvatting in medische contexten

U vat medische documenten samen en het is van cruciaal belang dat de namen van patiënten in de samenvattingen nauwkeurig en consistent zijn met de verstrekte grondbronnen.

Voorbeeld van API-aanvraag:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Verwacht resultaat:

Met de correctiefunctie wordt gedetecteerd dat deze Kevin niet is geaard omdat deze conflicteert met de grondbron Jane. De API retourneert de gecorrigeerde tekst: "The patient name is Jane."

Vraag- en antwoordtaak (QnA) met klantondersteuningsgegevens

U implementeert een QnA-systeem voor een chatbot voor klantenondersteuning. Het is essentieel dat de antwoorden van de AI overeenkomen met de meest recente en nauwkeurige informatie die beschikbaar is.

Voorbeeld van API-aanvraag:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Verwacht resultaat:

De API detecteert dat 5% deze niet is geaard omdat deze niet overeenkomt met de opgegeven grondbron 4.5%. Het antwoord bevat de correctietekst: "The interest rate is 4.5%."

Inhoud maken met historische gegevens

U maakt inhoud met historische gegevens of gebeurtenissen, waarbij nauwkeurigheid essentieel is om geloofwaardigheid te behouden en onjuiste informatie te voorkomen.

Voorbeeld van API-aanvraag:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Verwacht resultaat:

De API detecteert de niet-geaarde datum 1065 en corrigeert deze 1066 op basis van de grondbron. Het antwoord bevat de gecorrigeerde tekst: "The Battle of Hastings occurred in 1066."

Samenvatting van interne documentatie

U geeft een samenvatting van interne documenten waarin productnamen, versienummers of andere specifieke gegevenspunten consistent moeten blijven.

Voorbeeld van API-aanvraag:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Verwacht resultaat:

De correctiefunctie identificeert SuperWidget v2.1 als niet-geaard en werkt deze SuperWidget v2.2 bij in het antwoord. Het antwoord retourneert de gecorrigeerde tekst: "Our latest product is SuperWidget v2.2."

Aanbevolen procedures

Houd u aan de volgende aanbevolen procedures bij het instellen van RAG-systemen om de beste prestaties te verkrijgen van de groundedness detection-API:

Wanneer u te maken hebt met productnamen of versienummers, gebruikt u grondbronnen rechtstreeks vanuit interne releaseopmerkingen of officiële productdocumentatie om de nauwkeurigheid te garanderen.
Voor historische inhoud verwijst u kruislings naar uw grondbronnen met vertrouwde academische of historische databases om het hoogste nauwkeurigheidsniveau te garanderen.
Gebruik in een dynamische omgeving zoals financiën altijd de meest recente en betrouwbare grondbronnen om ervoor te zorgen dat uw AI-systeem nauwkeurige en tijdige informatie biedt.
Zorg er altijd voor dat uw grondbronnen nauwkeurig en up-to-date zijn, met name op gevoelige gebieden zoals gezondheidszorg. Dit minimaliseert het risico op fouten in het samenvattingsproces.

Beperkingen

Beschikbaarheid van taal

Momenteel ondersteunt de Groundedness detection-API inhoud in het Engels. Hoewel onze API het verzenden van niet-Engelse inhoud niet beperkt, kunnen we niet hetzelfde kwaliteitsniveau en dezelfde nauwkeurigheid garanderen bij de analyse van andere taalinhoud. We raden gebruikers aan om inhoud voornamelijk in het Engels in te dienen om de meest betrouwbare en nauwkeurige resultaten van de API te garanderen.

Beperkingen voor tekstlengte

Zie de invoervereisten voor maximale tekstlengtebeperkingen.

Regionale beschikbaarheid

Als u deze API wilt gebruiken, moet u uw Azure AI Content Safety-resource maken in de ondersteunde regio's. Zie beschikbaarheid van regio's.

Frequentiebeperkingen

Zie queryfrequenties.

Als u een hoger tarief nodig hebt, neem dan contact met ons op om dit aan te vragen.

Volgende stappen

Volg de quickstart om aan de slag te gaan met Azure AI Content Safety om grondheid te detecteren.

Quickstart voor detectie van aardheid

Delen via

Geaardheidsdetectie

Belangrijke termen

Opties voor detectie van geaardheid

Gebruiksgevallen

Aardingscorrectie

Gebruiksgevallen

Samenvatting in medische contexten

Vraag- en antwoordtaak (QnA) met klantondersteuningsgegevens

Inhoud maken met historische gegevens

Samenvatting van interne documentatie

Aanbevolen procedures

Beperkingen

Beschikbaarheid van taal

Beperkingen voor tekstlengte

Regionale beschikbaarheid

Frequentiebeperkingen

Volgende stappen

Feedback

Aanvullende resources