Was ist die Dokument- Konversationszusammenfassung?

Wichtig

Unsere Vorschauregion „Schweden, Mitte“ zeigt unsere neuesten und ständig weiterentwickelten LLM-Optimierungstechniken auf der Grundlage von GPT-Modellen. Sie können sie gerne mit einer Sprachressource in der Region „Schweden, Mitte“ ausprobieren.

Die Konversationszusammenfassung ist nur verfügbar mit:

  • REST-API
  • Python
  • C#

Die Zusammenfassung ist eine der Funktionen von Azure KI Language, einer Sammlung von Algorithmen für maschinelles Lernen und KI in der Cloud zur Entwicklung intelligenter Anwendungen, die mit geschriebener Sprache arbeiten. In diesem Artikel erfahren Sie mehr über dieses Feature und wie Sie es in Ihren Anwendungen nutzen können.

Die Dienste werden zwar als Dokument- bzw. Konversationszusammenfassung bezeichnet, aber die Dokumentzusammenfassung akzeptiert nur Nur-Text-Blöcke, und die Konversationszusammenfassung akzeptiert verschiedene Sprachartefakte, damit das Modell mehr lernen kann. Wenn Sie eine Konversation verarbeiten möchten, sich aber nur für den Text interessieren, können Sie in diesem Szenario die Dokumentzusammenfassung verwenden.

Diese Dokumentation enthält die folgenden Arten von Artikeln:

  • Schnellstarts sind Anleitungen zu den ersten Schritten, die Sie durch das Senden von Anforderungen an den Dienst führen.
  • Schrittanleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.

Die Dokumentzusammenfassung verwendet Techniken zur Verarbeitung natürlicher Sprache, um eine Zusammenfassung für Dokumente zu erstellen. Es gibt drei unterstützte API-Ansätze für automatische Zusammenfassungen: extraktiv, abstrakt und abfrageorientiert.

Die extraktive Zusammenfassung extrahiert Sätze, die zusammen die wichtigsten oder relevantesten Informationen innerhalb des ursprünglichen Inhalts darstellen. Die abstrahierende Zusammenfassung generiert eine Zusammenfassung mit prägnanten, zusammenhängenden Sätzen oder Wörtern, die keine wörtlich aus dem Originaldokument extrahierten Sätze sind. Diese Features wurden entwickelt, um Inhalte zu kürzen, die als zum Lesen zu lang betrachtet werden könnten.

Unterstützung von nativen Dokumenten

Ein natives Dokument bezieht sich auf das Dateiformat, das zur Erstellung des Originaldokuments verwendet wurde, z. B. Microsoft Word (docx) oder eine portierbare Dokumentdatei (pdf). Durch die Unterstützung nativer Dokumente ist vor der Nutzung von Azure KI Language-Ressourcen keine Textvorverarbeitung mehr erforderlich. Derzeit ist die Unterstützung nativer Dokumente sowohl für AbstractiveSummarization- als auch für ExtractiveSummarization-Funktionen verfügbar.

Derzeit unterstützt Dokumentzusammenfassung die folgenden nativen Dokumentformate:

Dateityp Dateierweiterung Beschreibung
Text .txt Ein unformatiertes Textdokument.
Adobe PDF .pdf Ein als portierbare Dokumentdatei formatiertes Dokument
Microsoft Word .docx Eine Microsoft Word-Dokumentdatei

Weitere Informationen finden Sie unterVerwenden nativer Dokumente für die Sprachverarbeitung.

Schlüsselfunktionen

Es gibt die Aspekte der Dokumentenzusammenfassung, die diese API bietet:

  • Extraktive Zusammenfassung: Erstellt eine Zusammenfassung durch Extrahieren markanter Sätze innerhalb des Dokuments.

    • Mehrere extrahierte Sätze: Diese Sätze vermitteln zusammen die Hauptidee des Dokuments. Es sind Originalsätze, die aus dem Inhalt des Eingabedokuments extrahiert wurden.
    • Rangbewertung: Die Rangbewertung gibt an, wie relevant ein Satz für das Hauptthema eines Dokuments ist. Die Dokumentzusammenfassung versieht die extrahierten Sätze mit einem Rang, und Sie können bestimmen, ob sie in der Reihenfolge, in der sie im Text vorkommen, oder auf der Grundlage ihres Rangs zurückgegeben werden sollen.
    • Mehrere zurückgegebene Sätze: Legen Sie die maximale Anzahl der zurückzugebenden Sätze fest. Wenn Sie beispielsweise eine Zusammenfassung in drei Sätzen anfordern, gibt die extraktive Zusammenfassung die drei am höchsten bewerteten Sätze zurück.
    • Positionsinformationen: Die Startposition und die Länge der extrahierten Sätze
  • Abstrahierende Zusammenfassung: Generiert eine Zusammenfassung, die nicht die gleichen Wörter wie im Dokument verwendet, aber den Hauptgedanken wiedergibt.

    • Zusammenfassungstexte: Die abstrakte Zusammenfassung gibt eine Zusammenfassung für jeden kontextbezogenen Eingabebereich im Dokument zurück. Ein langes Dokument kann segmentiert werden, sodass mehrere Gruppen von Zusammenfassungstexten mit ihrem kontextbezogenen Eingabebereich zurückgegeben werden können.
    • Kontextbezogener Eingabebereich: Der Bereich innerhalb des Eingabedokuments, der zum Generieren des Zusammenfassungstexts verwendet wurde.
  • Abfrageorientierte Zusammenfassung: Generiert eine Zusammenfassung basierend auf einer Abfrage

Betrachten Sie beispielsweise den folgenden Textabschnitt:

„Wir bei Microsoft sind bestrebt, die KI über die bestehenden Techniken hinaus zu verbessern, indem wir einen ganzheitlicheren, menschenzentrierten Ansatz für das Lernen und Verstehen wählen. Als Chief Technology Officer von Azure KI Services habe ich mit einem Team von erstaunlichen Wissenschaftlern und Ingenieuren zusammengearbeitet, um dieses Vorhaben in die Tat umzusetzen. „In meiner Rolle sehe ich die Beziehung der drei Attribute der menschlichen Wahrnehmung aus einer ganz besonderen Perspektive: einsprachiger Text (X), Audiosignale oder visuelle Signale (Y) und mehrsprachiger Text (Z).“ Die Schnittmenge dieser drei Attribute ist jedoch der Schlüssel. Wir bezeichnen das als XYZ-Code (Abbildung 1). Durch das Zusammenspiel dieser Faktoren können wir leistungsfähigere KI schaffen, die sprechen, hören, sehen und Menschen besser verstehen kann. Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg. Das Ziel besteht in der Verfügbarkeit vortrainierter Modelle, die gemeinsam Darstellungen erlernen können, um eine Vielzahl von nachgelagerten KI-Aufgaben zu unterstützen, ganz ähnlich wie Menschen es heute tun. Im Lauf der letzten fünf Jahre haben wir bei Benchmarks für Spracherkennung in Unterhaltungen, maschinelle Übersetzung, Beantwortung von Fragen im Unterhaltungskontext, maschinelles Leseverständnis und Bildbeschriftung ein menschliches Leistungsniveau erzielt. Diese fünf Durchbrüche waren für uns ein starkes Signal im Hinblick auf unser ehrgeizigeres Ziel, einen Sprung in den KI-Fähigkeiten zu erreichen, indem wir zu einem multisensorischen und mehrsprachigen Lernen gelangen, das dem menschlichen Lernen und Verstehen ähnlicher ist. Meiner Meinung nach ist gemeinsamer XYZ-Code eine Grundkomponente dieser Aufgabe, wenn er sich auf externe Wissensquellen in den nachgelagerten KI-Aufgaben stützt."

Die API-Anforderung zur Dokumentzusammenfassung wird nach Eingang der Anforderung verarbeitet, indem ein Auftrag für das API-Back-End erstellt wird. Wenn der Auftrag erfolgreich war, wird die Ausgabe der API zurückgegeben. Die Ausgabe kann 24 Stunden lang abgerufen werden. Anschließend wird die Ausgabe gelöscht. Aufgrund der Unterstützung von Emojis und mehreren Sprachen enthält der Antworttext unter Umständen Textversätze. Weitere Informationen finden Sie unter Verarbeiten von Versätzen.

Wenn wir das obige Beispiel verwenden, könnte die API diese zusammengefassten Sätze zurückgeben:

Extraktive Zusammenfassung:

  • „Wir bei Microsoft sind bestrebt, die KI über die bestehenden Techniken hinaus zu verbessern, indem wir einen ganzheitlicheren, menschenzentrierten Ansatz für das Lernen und Verstehen wählen.“
  • „Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg.“
  • „Das Ziel besteht in der Verfügbarkeit vortrainierter Modelle, die gemeinsam Darstellungen erlernen können, um eine Vielzahl von nachgelagerten KI-Aufgaben zu unterstützen, ganz ähnlich wie Menschen es heute tun.“

Abstrakte Zusammenfassung:

  • „Microsoft verfolgt einen ganzheitlicheren, auf den Menschen ausgerichteten Ansatz für das Lernen und Verstehen. Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg. In den letzten fünf Jahren haben wir bei Benchmarks in der Spracherkennung menschliche Leistungen erzielt.“

Erste Schritte mit der Zusammenfassung

Zur Verwendung der Zusammenfassung übermitteln Sie Text zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird. Es gibt zwei Möglichkeiten, die Zusammenfassung zu verwenden:

Entwicklungsoption BESCHREIBUNG
Language Studio Language Studio ist eine webbasierte Plattform, mit der Sie ohne Azure-Konto und mit Ihren eigenen Daten die Verknüpfung von Entitäten mit Textbeispielen ausprobieren können, wenn Sie sich registrieren. Weitere Informationen finden Sie auf der Language Studio-Website oder im Language Studio-Schnellstart.
REST-API oder Clientbibliothek (Azure SDK) Integrieren Sie die Dokumentzusammenfassung mithilfe der REST-API oder der Clientbibliothek, die in verschiedenen Sprachen verfügbar ist, in Ihre Anwendungen. Weitere Informationen finden Sie im Schnellstart zur Zusammenfassung.

Eingabeanforderungen und Dienstgrenzwerte

  • Bei der Zusammenfassung wird Text für die Analyse verwendet. Weitere Informationen finden Sie in der Schrittanleitung unter Daten- und Dienstgrenzwerte.
  • Die Zusammenfassung funktioniert mit verschiedenen geschriebenen Sprachen. Weitere Informationen finden Sie unter Sprachunterstützung.

Referenzdokumentation und Codebeispiele

Wenn Sie die Dokumentzusammenfassung in Ihren Anwendungen verwenden, lesen Sie die folgende Referenzdokumentation und Beispiele für Azure KI Language:

Entwicklungsoption/Sprache Referenzdokumentation Beispiele
C# C#-Dokumentation Beispiele für C#
Java Java-Dokumentation Java-Beispiele
JavaScript JavaScript-Dokumentation JavaScript samples (JavaScript-Beispiele)
Python Python-Dokumentation Python-Beispiele

Verantwortungsbewusste künstliche Intelligenz

Zu einem KI-System gehört nicht nur die Technologie, sondern auch die Personen, die es verwenden, die davon betroffenen Personen und die Bereitstellungsumgebung. Weitere Informationen zur verantwortungsbewussten Verwendung und Bereitstellung von KI in Ihren Systemen finden Sie im Transparenzhinweis für die Zusammenfassung. Weitere Informationen finden Sie in den folgenden Artikeln: