Erdungsdetektionsfilter

Die Erkennung der Verankerung in Azure KI Inhaltssicherheit hilft Ihnen, sicherzustellen, dass die Antworten des großen Sprachmodells (LLM) auf Ihrem bereitgestellten Quellmaterial basieren, und das Risiko von unfaktischen oder fabricierten Ausgaben zu reduzieren.

Ungroundedness bezieht sich auf Situationen, in denen LLMs Informationen erzeugen, die nicht den Tatsachen entsprechen oder ungenau im Vergleich zu den im Ausgangsmaterial vorhandenen Informationen sind.

Die Erkennung der Bodenständigkeit erfordert Dokumenteinbettung und -formatierung.

Um die Bodenhaftungserkennung zu verstehen, ist es hilfreich, mit diesen Kernkonzepten vertraut zu sein:

Schlüsselbegriffe

  • Retrieval Augmented Generation (RAG): RAG ist eine Technik zur Erweiterung von LLM-Wissen mit anderen Daten. LLMs können über umfangreiche Themen nachdenken, aber ihre Kenntnisse sind auf die öffentlichen Daten beschränkt, die zum Zeitpunkt der Ausbildung verfügbar waren. Wenn Sie KI-Anwendungen erstellen möchten, die auf private Daten oder Daten schließen, die nach einem Cutoff-Datum des Modells eingeführt wurden, müssen Sie dem Modell diese spezifischen Informationen bereitstellen. Der Prozess, die passenden Informationen abzurufen und sie in den Modellaufruf zu integrieren, wird als "Retrieval Augmented Generation (RAG)" bezeichnet. Weitere Informationen finden Sie unter "Retrieval-Augmented Generation (RAG)".
  • Geerdetheit und Grundlosigkeit in LLMs: Dies bezieht sich auf den Umfang, in dem die Ausgaben des Modells auf bereitgestellten Informationen basieren oder zuverlässige Quellen genau wiedergeben. Eine geerdete Antwort hält sich eng an die gegebenen Informationen und vermeidet Spekulationen oder Erfindungen. Bei Erdungsmessungen sind Quellinformationen von entscheidender Bedeutung und dienen als Erdungsquelle.

Erkennungsmodi

Die Erddheitserkennung bietet zwei Modi, um Geschwindigkeit mit Interpretationsfähigkeit zu ausgleichen:

  • Nicht-Reasoning-Modus: Schnelle Erkennung für Onlineanwendungen. Gibt binäre geerdete/nicht geerdete Ergebnisse ohne ausführliche Erläuterungen zurück.
  • Begründungsmodus: Bietet detaillierte Erläuterungen für erkannte unbegründete Segmente. Besser für das Verständnis von Ursachen und Entschärfungsstrategien.

Wählen Sie den Modus "Nicht-Denken" für Echtzeitanwendungen aus, bei denen es auf niedrige Latenz ankommt. Verwenden Sie den Reasoning-Modus während der Entwicklung und beim Debuggen, um zu verstehen, warum Inhalte gekennzeichnet sind.

Domänenauswahl

Wählen Sie eine Domäne aus, um die Erkennung für Ihren Anwendungsfall zu optimieren:

  • Medizin: Optimiert für medizinische, gesundheitliche und wissenschaftliche Inhalte, bei denen Genauigkeit von entscheidender Bedeutung ist.
  • Generisch: Geeignet für allgemeine Inhalte, einschließlich Kundensupport, Dokumentation und Geschäftskommunikation

Die Auswahl der Domäne stimmt die Empfindlichkeit und das Korrekturverhalten des Erkennungsmodells für domänenspezifische Terminologie und Muster ab.

Vorgangsspezifikation

Geben Sie den Aufgabentyp an, um die Erkennung zu optimieren:

  • Zusammenfassung: Zur Validierung generierter Zusammenfassungen gegen Quelldokumente
  • QnA: Zur Validierung von Frage-und-Antwort-Antworten gegen Wissensdatenbanken

Die Aufgabenauswahl passt Erkennungsempfindlichkeit und Korrekturlogik für aufgabenspezifische Muster an.

Korrektur der Bodenhaftung (Vorschau)

Die Fundiertheitserkennungs-API enthält eine optionale Korrekturfunktion, die nicht nur unfundierten Inhalt erkennt, sondern ihn basierend auf Ihren Fundierungsquellen automatisch korrigiert. Dies ist nützlich für:

  • Automatisches Beheben von Faktenfehlern in generierten Zusammenfassungen
  • Sicherstellen, dass KI-Antworten am Quellmaterial ausgerichtet sind
  • Verringern der manuellen Überprüfungszeit für Inhalte mit hohem Volumen

Benutzerszenarien

Die Verankerungserkennung unterstützt textbasierte Zusammenfassungs- und Fragen-und-Antworten-Aufgaben, um sicherzustellen, dass die generierten Zusammenfassungen oder Antworten präzise und zuverlässig sind.

Zusammenfassungsaufgaben:

  • Medizinische Zusammenfassung: Im Zusammenhang mit medizinischen Nachrichtenartikeln kann die Groundedness-Erkennung verwendet werden, um sicherzustellen, dass die Zusammenfassung keine erfundenen oder irreführenden Informationen enthält und so garantieren, dass die Leser genaue und zuverlässige medizinische Informationen erhalten.
  • Zusammenfassung der wissenschaftlichen Arbeit: Wenn das Modell Zusammenfassungen von akademischen Veröffentlichungen oder Forschungsartikeln generiert, kann die Funktion sicherstellen, dass der zusammengefasste Inhalt die wichtigsten Ergebnisse und Beiträge korrekt darstellt, ohne falsche Ansprüche einzuführen.

QnA-Aufgaben:

  • Kundensupport-Chatbots: Im Kundensupport kann die Funktion verwendet werden, um die Antworten von KI-Chatbots zu validieren, um sicherzustellen, dass Kunden genaue und vertrauenswürdige Informationen erhalten, wenn sie Fragen zu Produkten oder Dienstleistungen stellen.
  • Medizinische QnA: Für medizinische QnA hilft die Funktion dabei, die Genauigkeit medizinischer Antworten und Beratungen zu überprüfen, die von KI-Systemen für Medizinische Fachkräfte und Patienten bereitgestellt werden, um das Risiko von medizinischen Fehlern zu verringern.
  • Bildungs-QnA: In Bildungseinstellungen kann die Funktion auf QnA-Aufgaben angewendet werden, um zu bestätigen, dass Antworten auf akademische Fragen oder Testvorfragen sachlich genau sind und den Lernprozess unterstützen.

Im Folgenden finden Sie mehrere gängige Szenarien, die veranschaulichen, wie und wann diese Features angewendet werden, um die besten Ergebnisse zu erzielen.

Zusammenfassung in medizinischen Kontexten

Sie fassen medizinische Dokumente zusammen, und es ist wichtig, dass die Namen der Patienten in den Zusammenfassungen mit den verwendeten Quellen genau und konsistent sind.

Beispiel-API-Anforderung:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Erwartetes Ergebnis:

Die Korrekturfunktion erkennt, dass Kevin nicht geerdet ist, da sie mit der Erdungsquelle Janein Konflikt steht. Die API gibt den korrigierten Text zurück: "The patient name is Jane."

Frage- und Antwortaufgabe (QnA) mit Kundensupportdaten

Sie implementieren ein QnA-System für einen Kundensupport-Chatbot. Es ist wichtig, dass die von der KI bereitgestellten Antworten mit den neuesten und genauen Informationen übereinstimmen, die verfügbar sind.

Beispiel-API-Anforderung:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Erwartetes Ergebnis:

Die API erkennt, dass 5% nicht geerdet ist, da sie nicht mit der bereitgestellten Erdungsquelle 4.5%übereinstimmt. Die Antwort enthält den Korrekturtext: "The interest rate is 4.5%."

Inhaltserstellung mit historischen Daten

Sie erstellen Inhalte, die historische Daten oder Ereignisse beinhalten, bei denen genauigkeit wichtig ist, um Glaubwürdigkeit aufrechtzuerhalten und Fehlinformationen zu vermeiden.

Beispiel-API-Anforderung:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Erwartetes Ergebnis:

Die API identifiziert das ungebundene Datum 1065 und korrigiert 1066, basierend auf der Referenzquelle. Die Antwort enthält den korrigierten Text: "The Battle of Hastings occurred in 1066."

Interne Dokumentationszusammenfassung

Sie fassen interne Dokumente zusammen, bei denen Produktnamen, Versionsnummern oder andere bestimmte Datenpunkte konsistent bleiben müssen.

Beispiel-API-Anforderung:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Erwartetes Ergebnis:

Das Korrekturfeature identifiziert SuperWidget v2.1 als unbegründet und aktualisiert es in der Antwort zu SuperWidget v2.2. Die Antwort gibt den korrigierten Text zurück: "Our latest product is SuperWidget v2.2."

Einschränkungen

Verfügbarkeit der Sprache

Derzeit unterstützt die Überprüfung auf Sachlichkeit nur Inhalte in englischer Sprache. Während die API keine nicht englischen Übermittlungen einschränkt, sind Genauigkeit und Qualität für Englisch optimiert.

Textlängenbeschränkungen

Die maximale Textlänge variiert je nach Modus. Siehe Eingabeanforderungen für aktuelle Grenzwerte.

Verfügbarkeit der Region

Die Bodenhaftungserkennung ist in bestimmten Azure-Regionen verfügbar. Siehe Regionsverfügbarkeit für unterstützte Regionen.

Preisbeschränkungen

Standard-Abfrageratenbegrenzungen gelten. Wenden Sie sich an den Support für Inhaltssicherheit, um höhere Durchsatzanforderungen zu erzielen.