Freigeben über


Was ist Zusammenfassung?

Wichtig

Unsere Vorschauregion „Schweden, Mitte“ zeigt unsere neuesten und ständig weiterentwickelten LLM-Optimierungstechniken auf der Grundlage von GPT-Modellen. Sie können sie gerne mit einer Sprachressource in der Region „Schweden, Mitte“ ausprobieren.

Die Konversationszusammenfassung ist nur verfügbar mit:

  • REST-API
  • Python
  • C#

Die Zusammenfassung ist eine der Funktionen von Azure KI Language, einer Sammlung von Algorithmen für maschinelles Lernen und KI in der Cloud zur Entwicklung intelligenter Anwendungen, die mit geschriebener Sprache arbeiten. In diesem Artikel erfahren Sie mehr über dieses Feature und wie Sie es in Ihren Anwendungen nutzen können.

Die Dienste werden zwar als Text- bzw. Konversationszusammenfassung bezeichnet, aber die Textzusammenfassung akzeptiert nur Nur-Text-Blöcke, und die Konversationszusammenfassung akzeptiert verschiedene Sprachartefakte, damit das Modell mehr lernen kann. Wenn Sie eine Konversation verarbeiten möchten, sich aber nur für den Text interessieren, können Sie in diesem Szenario die Textzusammenfassung verwenden.

Diese Dokumentation enthält die folgenden Arten von Artikeln:

  • Schnellstarts sind Anleitungen zu den ersten Schritten, die Sie durch das Senden von Anforderungen an den Dienst führen.
  • Schrittanleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.

Die Textzusammenfassung verwendet Techniken zur Verarbeitung natürlicher Sprache, um eine Zusammenfassung für Dokumente zu erstellen. Es gibt zwei unterstützte API-Ansätze für die automatische Zusammenfassung: extraktiv und abstrahierend.

Die extraktive Zusammenfassung extrahiert Sätze, die zusammen die wichtigsten oder relevantesten Informationen innerhalb des ursprünglichen Inhalts darstellen. Die abstrahierende Zusammenfassung generiert eine Zusammenfassung mit prägnanten, zusammenhängenden Sätzen oder Wörtern, die keine wörtlich aus dem Originaldokument extrahierten Sätze sind. Diese Features wurden entwickelt, um Inhalte zu kürzen, die als zum Lesen zu lang betrachtet werden könnten.

Schlüsselfunktionen der Textzusammenfassung

Diese API bietet zwei Aspekte der Textzusammenfassung:

  • Extraktive Zusammenfassung: Erstellt eine Zusammenfassung durch Extrahieren markanter Sätze innerhalb des Dokuments.

    • Mehrere extrahierte Sätze: Diese Sätze vermitteln zusammen die Hauptidee des Dokuments. Es sind Originalsätze, die aus dem Inhalt des Eingabedokuments extrahiert wurden.
    • Rangbewertung: Die Rangbewertung gibt an, wie relevant ein Satz für das Hauptthema eines Dokuments ist. Die Textzusammenfassung bringt extrahierte Sätze in eine Rangfolge, und Sie können bestimmen, ob sie in der Reihenfolge zurückgegeben werden, in der sie im Text vorkommen, oder entsprechend ihrem Rang.
    • Mehrere zurückgegebene Sätze: Legen Sie die maximale Anzahl der zurückzugebenden Sätze fest. Wenn Sie beispielsweise eine Zusammenfassung in drei Sätzen anfordern, gibt die extraktive Zusammenfassung die drei am höchsten bewerteten Sätze zurück.
    • Positionsinformationen: Die Startposition und die Länge der extrahierten Sätze
  • Abstrahierende Zusammenfassung: Generiert eine Zusammenfassung, die nicht die gleichen Wörter wie im Dokument verwendet, aber den Hauptgedanken wiedergibt.

    • Zusammenfassungstexte: Die abstrakte Zusammenfassung gibt eine Zusammenfassung für jeden kontextbezogenen Eingabebereich im Dokument zurück. Ein langes Dokument kann segmentiert werden, sodass mehrere Gruppen von Zusammenfassungstexten mit ihrem kontextbezogenen Eingabebereich zurückgegeben werden können.
    • Kontextbezogener Eingabebereich: Der Bereich innerhalb des Eingabedokuments, der zum Generieren des Zusammenfassungstexts verwendet wurde.

Betrachten Sie beispielsweise den folgenden Textabschnitt:

„Wir bei Microsoft sind bestrebt, die KI über die bestehenden Techniken hinaus zu verbessern, indem wir einen ganzheitlicheren, menschenzentrierten Ansatz für das Lernen und Verstehen wählen. Als Chief Technology Officer von Azure KI Services habe ich mit einem Team von erstaunlichen Wissenschaftlern und Ingenieuren zusammengearbeitet, um dieses Vorhaben in die Tat umzusetzen. „In meiner Rolle sehe ich die Beziehung der drei Attribute der menschlichen Wahrnehmung aus einer ganz besonderen Perspektive: einsprachiger Text (X), Audiosignale oder visuelle Signale (Y) und mehrsprachiger Text (Z).“ Die Schnittmenge dieser drei Attribute ist jedoch der Schlüssel. Wir bezeichnen das als XYZ-Code (Abbildung 1). Durch das Zusammenspiel dieser Faktoren können wir leistungsfähigere KI schaffen, die sprechen, hören, sehen und Menschen besser verstehen kann. Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg. Das Ziel besteht in der Verfügbarkeit vortrainierter Modelle, die gemeinsam Darstellungen erlernen können, um eine Vielzahl von nachgelagerten KI-Aufgaben zu unterstützen, ganz ähnlich wie Menschen es heute tun. Im Lauf der letzten fünf Jahre haben wir bei Benchmarks für Spracherkennung in Unterhaltungen, maschinelle Übersetzung, Beantwortung von Fragen im Unterhaltungskontext, maschinelles Leseverständnis und Bildbeschriftung ein menschliches Leistungsniveau erzielt. Diese fünf Durchbrüche waren für uns ein starkes Signal im Hinblick auf unser ehrgeizigeres Ziel, einen Sprung in den KI-Fähigkeiten zu erreichen, indem wir zu einem multisensorischen und mehrsprachigen Lernen gelangen, das dem menschlichen Lernen und Verstehen ähnlicher ist. Meiner Meinung nach ist gemeinsamer XYZ-Code eine Grundkomponente dieser Aufgabe, wenn er sich auf externe Wissensquellen in den nachgelagerten KI-Aufgaben stützt."

Die Anforderung der Textzusammenfassung-API wird nach Erhalt der Anforderung verarbeitet, indem ein Auftrag für das API Back-End erstellt wird. Wenn der Auftrag erfolgreich war, wird die Ausgabe der API zurückgegeben. Die Ausgabe kann 24 Stunden lang abgerufen werden. Anschließend wird die Ausgabe gelöscht. Aufgrund der Unterstützung von Emojis und mehreren Sprachen enthält der Antworttext unter Umständen Textversätze. Weitere Informationen finden Sie unter Verarbeiten von Versätzen.

Wenn wir das obige Beispiel verwenden, könnte die API diese zusammengefassten Sätze zurückgeben:

Extraktive Zusammenfassung:

  • „Wir bei Microsoft sind bestrebt, die KI über die bestehenden Techniken hinaus zu verbessern, indem wir einen ganzheitlicheren, menschenzentrierten Ansatz für das Lernen und Verstehen wählen.“
  • „Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg.“
  • „Das Ziel besteht in der Verfügbarkeit vortrainierter Modelle, die gemeinsam Darstellungen erlernen können, um eine Vielzahl von nachgelagerten KI-Aufgaben zu unterstützen, ganz ähnlich wie Menschen es heute tun.“

Abstrakte Zusammenfassung:

  • „Microsoft verfolgt einen ganzheitlicheren, auf den Menschen ausgerichteten Ansatz für das Lernen und Verstehen. Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg. In den letzten fünf Jahren haben wir bei Benchmarks in der Spracherkennung menschliche Leistungen erzielt.“

Erste Schritte mit der Zusammenfassung

Zur Verwendung der Zusammenfassung übermitteln Sie Text zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird. Es gibt zwei Möglichkeiten, die Zusammenfassung zu verwenden:

Entwicklungsoption BESCHREIBUNG
Language Studio Language Studio ist eine webbasierte Plattform, mit der Sie ohne Azure-Konto und mit Ihren eigenen Daten die Verknüpfung von Entitäten mit Textbeispielen ausprobieren können, wenn Sie sich registrieren. Weitere Informationen finden Sie auf der Language Studio-Website oder im Language Studio-Schnellstart.
REST-API oder Clientbibliothek (Azure SDK) Integrieren Sie die Textzusammenfassung mithilfe der REST-API oder der Clientbibliothek, die in verschiedenen Sprachen verfügbar ist, in Ihre Anwendungen. Weitere Informationen finden Sie im Schnellstart zur Zusammenfassung.

Eingabeanforderungen und Dienstgrenzwerte

  • Bei der Zusammenfassung wird Text für die Analyse verwendet. Weitere Informationen finden Sie in der Schrittanleitung unter Daten- und Dienstgrenzwerte.
  • Die Zusammenfassung funktioniert mit verschiedenen geschriebenen Sprachen. Weitere Informationen finden Sie unter Sprachunterstützung.

Referenzdokumentation und Codebeispiele

Wenn Sie die Textzusammenfassung in Ihren Anwendungen verwenden, lesen Sie die folgende Referenzdokumentation und Beispiele für Azure KI Language:

Entwicklungsoption/Sprache Referenzdokumentation Beispiele
C# C#-Dokumentation Beispiele für C#
Java Java-Dokumentation Java-Beispiele
JavaScript JavaScript-Dokumentation JavaScript samples (JavaScript-Beispiele)
Python Python-Dokumentation Python-Beispiele

Verantwortungsbewusste künstliche Intelligenz

Zu einem KI-System gehört nicht nur die Technologie, sondern auch die Personen, die es verwenden, die davon betroffenen Personen und die Bereitstellungsumgebung. Weitere Informationen zur verantwortungsbewussten Verwendung und Bereitstellung von KI in Ihren Systemen finden Sie im Transparenzhinweis für die Zusammenfassung. Weitere Informationen finden Sie in den folgenden Artikeln: