Freigeben über


Was ist Zusammenfassung?

Wichtig

Unsere Vorschauregion „Schweden, Mitte“ zeigt unsere neuesten und ständig weiterentwickelten LLM-Optimierungstechniken auf der Grundlage von GPT-Modellen. Sie können sie gerne mit einer Sprachressource in der Region „Schweden, Mitte“ ausprobieren.

Die Konversationszusammenfassung ist nur verfügbar mit:

  • REST-API
  • Python
  • C#

Die Zusammenfassung ist ein Feature von Azure AI Language, einer Kombination aus generativen Modellen für große Sprachen und aufgabenoptimierten Encodermodellen, die Zusammenfassungslösungen mit höherer Qualität, Kosteneffizienz und geringerer Latenz bieten. In diesem Artikel erfahren Sie mehr über dieses Feature und wie Sie es in Ihren Anwendungen nutzen können.

Standardmäßig bietet der Dienst Zusammenfassungslösungen für drei Arten von Genres: einfache Texte, Unterhaltungen und native Dokumente. Textzusammenfassung akzeptiert nur Nur-Text-Blöcke. Die Unterhaltungszusammenfassung akzeptiert Unterhaltungseingaben, einschließlich verschiedener Sprachaudiosignale. Native Dokumentzusammenfassung akzeptiert Dokumente in ihren nativen Formaten, z. B. Word, PDF oder Nur-Text. Weitere Informationen finden Sie unterUnterstützte Dokumentformate.

Tipp

Testen Sie die Zusammenfassung im Azure AI Foundry-Portal. Dort können Sie eine derzeit vorhandene Language Studio-Ressource verwenden oder eine neue Azure AI Foundry-Ressource erstellen , um diesen Dienst verwenden zu können.

Fähigkeiten

Diese Dokumentation enthält die folgenden Arten von Artikeln:

  • Schnellstarts sind Anleitungen zu den ersten Schritten, die Sie durch das Senden von Anforderungen an den Dienst führen.
  • Schrittanleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.

Typischer Workflow

Um dieses Feature zu verwenden, übermitteln Sie Daten zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird.

  1. Erstellen Sie eine Azure KI Language-Ressource, die Ihnen den Zugriff auf die Features von Azure KI Language ermöglicht. Hierbei werden ein Kennwort (als „Schlüssel“ bezeichnet) und eine Endpunkt-URL generiert, die Sie zum Authentifizieren von API-Anforderungen verwenden können.

  2. Erstellen Sie eine Anforderung, indem Sie entweder die REST-API oder die Clientbibliothek für C#, Java, JavaScript oder Python verwenden. Sie können auch asynchrone Aufrufe per Batchanforderung senden, um API-Anforderungen für mehrere Features in einem gemeinsamen Aufruf zu kombinieren.

  3. Senden Sie die Anforderung, die Ihre Textdaten enthält. Ihr Schlüssel und Endpunkt werden für die Authentifizierung verwendet.

  4. Streamen oder speichern Sie die Antwort lokal.

Schlüsselfunktionen der Textzusammenfassung

Die Textzusammenfassung verwendet Techniken für die Verarbeitung natürlicher Sprache, um eine Zusammenfassung für unformatierte Texte zu generieren, die aus einem Dokument, einer Unterhaltung oder beliebigen Texten stammen können. Diese API bietet zwei Ansätze für die Textzusammenfassung:

  • Extrahierende Zusammenfassung: Erzeugt eine Zusammenfassung, indem wichtige Sätze aus dem Quelltext extrahiert und die Positionierungsinformationen dieser Sätze angegeben werden.

    • Mehrere extrahierte Sätze: Diese Sätze vermitteln zusammen die Hauptidee des Eingabetexts. Sie sind ursprüngliche Sätze, die aus dem Eingabetextinhalt extrahiert werden.
    • Rangbewertung: Die Rangbewertung gibt an, wie relevant ein Satz für das Hauptthema ist. Die Textzusammenfassung bringt extrahierte Sätze in eine Rangfolge, und Sie können bestimmen, ob sie in der Reihenfolge zurückgegeben werden, in der sie im Text vorkommen, oder entsprechend ihrem Rang. Wenn Sie beispielsweise eine Zusammenfassung in drei Sätzen anfordern, gibt die extraktive Zusammenfassung die drei am höchsten bewerteten Sätze zurück.
    • Positionsinformationen: Die Startposition und die Länge der extrahierten Sätze
  • Abstrakte Zusammenfassung: Generiert eine Zusammenfassung mit prägnanten, kohärenten Sätzen oder Wörtern, die nicht wörtlich aus der ursprünglichen Quelle extrahiert sind.

    • Zusammenfassungstexte: Die abstrakte Zusammenfassung gibt eine Zusammenfassung für jeden kontextbezogenen Eingabebereich zurück. Eine lange Eingabe kann segmentiert werden, sodass mehrere Gruppen von Zusammenfassungstexten mit ihrem kontextbezogenen Eingabebereich zurückgegeben werden können.
    • Kontextbezogener Eingabebereich: Der Bereich innerhalb der Eingabe, der zum Generieren des Zusammenfassungstexts verwendet wurde.

Betrachten Sie beispielsweise den folgenden Textabschnitt:

„Wir bei Microsoft sind bestrebt, die KI über die bestehenden Techniken hinaus zu verbessern, indem wir einen ganzheitlicheren, menschenzentrierten Ansatz für das Lernen und Verstehen wählen. Als Chief Technology Officer von Azure KI Services habe ich mit einem Team von erstaunlichen Wissenschaftlern und Ingenieuren zusammengearbeitet, um dieses Vorhaben in die Tat umzusetzen. „In meiner Rolle sehe ich die Beziehung der drei Attribute der menschlichen Wahrnehmung aus einer ganz besonderen Perspektive: einsprachiger Text (X), Audiosignale oder visuelle Signale (Y) und mehrsprachiger Text (Z).“ Die Schnittmenge dieser drei Attribute ist jedoch der Schlüssel. Wir bezeichnen das als XYZ-Code (Abbildung 1). Durch das Zusammenspiel dieser Faktoren können wir leistungsfähigere KI schaffen, die sprechen, hören, sehen und Menschen besser verstehen kann. Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg. Das Ziel besteht in der Verfügbarkeit vortrainierter Modelle, die gemeinsam Darstellungen erlernen können, um eine Vielzahl von nachgelagerten KI-Aufgaben zu unterstützen, ganz ähnlich wie Menschen es heute tun. Im Lauf der letzten fünf Jahre haben wir bei Benchmarks für Spracherkennung in Unterhaltungen, maschinelle Übersetzung, Beantwortung von Fragen im Unterhaltungskontext, maschinelles Leseverständnis und Bildbeschriftung ein menschliches Leistungsniveau erzielt. Diese fünf Durchbrüche waren für uns ein starkes Signal im Hinblick auf unser ehrgeizigeres Ziel, einen Sprung in den KI-Fähigkeiten zu erreichen, indem wir zu einem multisensorischen und mehrsprachigen Lernen gelangen, das dem menschlichen Lernen und Verstehen ähnlicher ist. Meiner Meinung nach ist gemeinsamer XYZ-Code eine Grundkomponente dieser Aufgabe, wenn er sich auf externe Wissensquellen in den nachgelagerten KI-Aufgaben stützt."

Die Anforderung der Textzusammenfassung-API wird nach Erhalt der Anforderung verarbeitet, indem ein Auftrag für das API Back-End erstellt wird. Wenn der Auftrag erfolgreich war, wird die Ausgabe der API zurückgegeben. Die Ausgabe kann 24 Stunden lang abgerufen werden. Anschließend wird die Ausgabe gelöscht. Aufgrund der Unterstützung von Emojis und mehreren Sprachen enthält der Antworttext unter Umständen Textversätze. Weitere Informationen finden Sie unter Verarbeiten von Versätzen.

Wenn wir das vorangehende Beispiel verwenden, gibt die API möglicherweise die folgenden Zusammenfassungen zurück:

Extraktive Zusammenfassung:

  • „Wir bei Microsoft sind bestrebt, die KI über die bestehenden Techniken hinaus zu verbessern, indem wir einen ganzheitlicheren, menschenzentrierten Ansatz für das Lernen und Verstehen wählen.“
  • „Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg.“
  • „Das Ziel besteht in der Verfügbarkeit vortrainierter Modelle, die gemeinsam Darstellungen erlernen können, um eine Vielzahl von nachgelagerten KI-Aufgaben zu unterstützen, ganz ähnlich wie Menschen es heute tun.“

Abstrakte Zusammenfassung:

  • „Microsoft verfolgt einen ganzheitlicheren, auf den Menschen ausgerichteten Ansatz für das Lernen und Verstehen. Wir sind der Meinung, dass XYZ-Code uns die Möglichkeit gibt, unsere langfristige Vision zu realisieren: domänenübergreifender Lerntransfer über Modalitäten und Sprachgrenzen hinweg. In den letzten fünf Jahren haben wir bei Benchmarks in der Spracherkennung menschliche Leistungen erzielt.“

Erste Schritte mit der Zusammenfassung

Zur Verwendung der Zusammenfassung übermitteln Sie Text zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird. Es gibt zwei Möglichkeiten, die Zusammenfassung zu verwenden:

Entwicklungsoption BESCHREIBUNG
Azure AI Foundry Azure AI Foundry ist eine webbasierte Plattform, auf der Sie Entitätsverknüpfung mit Textbeispielen mit Ihren eigenen Daten verwenden können, wenn Sie sich registrieren. Weitere Informationen finden Sie auf der Azure AI Foundry-Website oder in der Azure AI Foundry-Dokumentation.
REST-API oder Clientbibliothek (Azure SDK) Integrieren Sie die Textzusammenfassung mithilfe der REST-API oder der Clientbibliothek, die in verschiedenen Sprachen verfügbar ist, in Ihre Anwendungen. Weitere Informationen finden Sie im Schnellstart zur Zusammenfassung.

Eingabeanforderungen und Dienstgrenzwerte

  • Bei der Zusammenfassung wird Text für die Analyse verwendet. Weitere Informationen finden Sie in der Schrittanleitung unter Daten- und Dienstgrenzwerte.
  • Die Zusammenfassung funktioniert mit verschiedenen geschriebenen Sprachen. Weitere Informationen finden Sie unter Sprachunterstützung.

Referenzdokumentation und Codebeispiele

Wenn Sie die Textzusammenfassung in Ihren Anwendungen verwenden, lesen Sie die folgende Referenzdokumentation und Beispiele für Azure KI Language:

Entwicklungsoption/Sprache Referenzdokumentation Beispiele
C# C#-Dokumentation Beispiele für C#
Java Java-Dokumentation Java-Beispiele
JavaScript JavaScript-Dokumentation JavaScript samples (JavaScript-Beispiele)
Python Python-Dokumentation Python-Beispiele für Batch

Verantwortungsbewusste künstliche Intelligenz

Zu einem KI-System gehört nicht nur die Technologie, sondern auch die Personen, die es verwenden, die davon betroffenen Personen und die Bereitstellungsumgebung. Weitere Informationen zur verantwortungsbewussten Verwendung und Bereitstellung von KI in Ihren Systemen finden Sie im Transparenzhinweis für die Zusammenfassung. Weitere Informationen finden Sie in den folgenden Artikeln: