Erklären der extrahierenden Zusammenfassung
Die Extrahierende Zusammenfassung erzeugt eine Zusammenfassung, indem wesentliche Sätze direkt aus dem Originaltext extrahiert werden. Anstatt neuen Text zu generieren, verwendet es Techniken zur Verarbeitung natürlicher Sprache, um die Sätze zu finden, die zusammen die primäre Idee oder den Kontext eines Dokuments vermitteln.
Die extrahierende Zusammenfassung erfolgt mithilfe der summarize_extractive()-Funktion, die im azure_cognitive-Schema der azure_ai-Erweiterung enthalten ist. Das azure_cognitive-Schema enthält drei Überladungen der summarize_extractive()-Funktion. Die Liste der Argumente, welche die drei erwarteten Funktionsüberladungen umfassen:
| Streitpunkt | Typ | Standard | BESCHREIBUNG |
|---|---|---|---|
| text |
text oder text[] |
Die Texte, für die Zusammenfassungen generiert werden sollen. | |
| Sprachtext |
text oder text[] |
Sprachcode (oder Array von Sprachcodes), der die Sprache des zusammenzufassenden Texts darstellt. Überprüfen Sie die Liste der unterstützten Sprachen, um die erforderlichen Sprachcodes abzurufen. | |
| Satzanzahl | integer |
3 | Die Anzahl der zu generierenden Zusammenfassungssätze. |
| sort_by | text |
'offset' | Die Sortierreihenfolge für die generierten Sammelsätze. Zulässige Werte sind „offset“ und „rank“, wobei der Offset die Startposition jedes extrahierten Satzes innerhalb des ursprünglichen Inhalts darstellt und als KI-generierter Indikator für die Relevanz eines Satzes für die Hauptidee des Inhalts einen Rang zuweist. |
| Batch-Größe | integer |
25 | Nur für die beiden Überladungen, die eine Eingabe von text[] erwarten. Gibt die Anzahl der gleichzeitig zu verarbeitenden Datensätze an. |
| disable_service_logs | boolean |
Falsch | Flag, das angibt, ob Dienstprotokolle deaktiviert werden sollen. |
| timeout_ms | integer |
NULL | Timeout in Millisekunden, nach dem der Vorgang beendet wird. |
| throw_on_error | boolean |
Wahr | Flag, das angibt, ob die Funktion beim Fehler eine Ausnahme auslösen soll, was zu einem Rollback der Umbruchtransaktionen führt. |
| Maximale Versuche | integer |
1 | Anzahl der Wiederholungen des Aufrufs von Foundry Tools im Falle eines Fehlers. |
| retry_delay_ms | integer |
1000 | Zeitdauer in Millisekunden, um zu warten, bevor versucht wird, den Endpunkt "Foundry Tools" erneut aufzurufen. |
Jede Funktion gibt ein Array extrahierter Sätze und einer Priorisierungsbewertung für jeden Satz zurück, wobei der zusammengesetzte Typ azure_cognitive.sentence verwendet wird, wie in der folgenden Tabelle dargestellt:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
Die azure_cognitive.sentence ist ein zusammengesetzter Typ, der den Text eines extrahierenden Satzes und eine Priorisierungsbewertung für jeden Satz enthält. Die Priorisierungsbewertung, ein Wert zwischen 0 und 1 (inklusiv), gibt an, wie relevant ein Satz für die Hauptidee des ursprünglichen Dokuments ist. Die Dokumentzusammenfassung bewertet extrahierte Sätze, und Sie können bestimmen, ob sie in der Reihenfolge zurückgegeben werden, in der sie erscheinen oder entsprechend ihrer Rangfolge mithilfe des sort_by-Parameters der Funktion.
Generieren von extrahierenden Zusammenfassungen für Eigenschaftenbeschreibungen
Als Entwickler für Margie's Travel möchten Sie die extraktive Zusammenfassungstechnik auswerten, die über die azure_ai Erweiterung und die Foundry-Tools zugänglich ist, und die Fähigkeit der Methode bewerten, präzise, natürliche Sprachzusammenfassungen von umfangreichen Objektdarstellungen zu generieren, wie diese Beschreibung von der ersten Auflistung in der Datenbank.
„Fühlen Sie sich zu Hause in dieser charmanten Ein-Zimmer-Wohnung, zentral auf der Westseite von Queen Anne Hill. Diese elegant eingerichtete, private Wohnung (unteres Geschoss eines Zweifamilienhauses) verfügt über einen offenen Grundriss, Bambusböden, eine voll ausgestattete Küche, einen Fernseher, einen DVD-Player, einfaches Kabelfernsehen und ein gemütliches Schlafzimmer mit Doppelbett. Die Wohnung bietet Platz für bis zu vier Personen (zwei im Schlafzimmer und zwei auf der bequemen ausklappbaren Couch, Bettwäsche inklusive) und verfügt über kostenloses WLAN und die Möglichkeit, Wäsche zu waschen. Die Wohnung hat eine private Terrasse mit eigenem Grill und Blick auf einen Garten und einen Wald aus schwarzem Bambus. Das Apartment ist perfekt gelegen und nur einen Häuserblock von den Buslinien entfernt, sodass Sie mit dem Bus in 15 Minuten die Innenstadt von Seattle und in 10 Minuten das historische Ballard erreichen. In nur fünf Minuten erreichen Sie zu Fuß ein Lebensmittelgeschäft und ein Café. Oder machen Sie einfach einen fünfzehnminütigen Spaziergang auf den Queen Anne Hill, wo Sie vielseitige Geschäfte, Bars und Restaurants finden.“
Sie fordern eine Zusammenfassung in zwei Sätzen der obigen Eigenschaftsbeschreibung mithilfe der folgenden Abfrage an:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Die extrahierende Zusammenfassung gibt die beiden Sätze mit der höchsten Punktzahl aus dem ursprünglichen Text zusammen mit der Priorisierungsbewertung für die einzelnen Sätze zurück:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}