Schlüsselbegriffe extrahieren

Abgeschlossen

Die Schlüsselbegriffserkennung ist eine Funktion, die von Azure KI Language angeboten wird. Sie identifiziert die Schlüsselbegriffe oder wichtigsten Konzepte im Text.

Es gibt mehrere Möglichkeiten, die Schlüsselbegriffserkennungs-API aufzurufen. Hier verwenden Sie die azure_ai-Erweiterung, um Schlüsselbegriffe in SQL-Abfragen zu extrahieren.

Voraussetzungen

Sie benötigen eine Instanz von Azure Database for PostgreSQL – Flexibler Server mit aktivierter und konfigurierter azure_ai-Erweiterung. Sie müssen die Instanz auch bei Azure Cognitive Services autorisieren, indem Sie den Schlüssel und Endpunkt einer Sprachressource festlegen.

Szenarien

Die Schlüsselbegriffserkennung wird auf verschiedene Aufgaben angewendet:

  • Zusammenfassung: Verwenden Sie Schlüsselbegriffe, um lange Dokumente auf Kernthemen zu reduzieren. Sie können z. B. Themen identifizieren, die in Audiotranskripten oder Besprechungsnotizen behandelt werden.
  • Inhaltskategorisierung: Verwenden Sie Schlüsselbegriffe, um Dokumente für die Suche zu indizieren. Schlüsselbegriffe können auch verwendet werden, um Dokumente in Wortwolken zu visualisieren.
  • Dokumentclustering: Umfangreiche Sammlungen von Supporttickets, Produktrezensionen und anderen unstrukturierten Eingaben können mithilfe von Schlüsselbegriffen gruppiert und analysiert werden.

Verwenden der Schlüsselbegriffserkennung in SQL mit Azure Cognitive Services

Die azure_ai-Erweiterung für Azure Database for PostgreSQL – Flexibler Server bietet benutzerdefinierte Funktionen (User-Defined Functions, UDFs), um direkt in SQL auf KI-Funktionen zuzugreifen. Auf die Schlüsselbegriffserkennungs-API wird mit der azure_cognitive.extract_key_phrases-Funktion zugegriffen:

azure_cognitive.extract_key_phrases(
 text TEXT,
 language TEXT,
 timeout_ms INTEGER DEFAULT 3600000,
 throw_on_error BOOLEAN DEFAULT TRUE,
 disable_service_logs BOOLEAN DEFAULT FALSE
)

Die erforderlichen Parameter sind text, die Eingabe, und language, die Sprache, in der der text geschrieben ist. Beispielsweise ist en-us US-Englisch und fr Französisch. Eine vollständige Liste der verfügbaren Sprachen finden Sie unter Sprachunterstützung.

Die Schlüsselbegriffserkennung wird standardmäßig beendet, wenn sie nicht in 3.600.000 ms (1 Stunde) abgeschlossen ist. Sie können diese Verzögerung anpassen, indem Sie timeout_ms ändern.

Wenn ein Fehler auftritt, besteht das Standardverhalten darin, eine Ausnahme auszulösen, was zu einem Transaktionsrollback führt. Sie können dieses Verhalten deaktivieren, indem Sie throw_on_error auf „false“ festlegen.

Eine vollständige Parameterdokumentation finden Sie in der Dokumentation zur Azure Cognitive Services-Erweiterung.

Wenn Sie beispielsweise diese Abfrage aufrufen:

SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');

Erhalten Sie folgendes Ergebnis:

 extract_key_phrases 
---------------------
 {food,staff}

Sie können Tabellenspalten für den Eingabetext verwenden:

SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;

Dadurch wird Folgendes zurückgegeben (mit \x für die erweiterte Anzeige):

description    | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}

Zusammenfassung

Die Schlüsselbegriffserkennung wählt die wichtigsten Konzepte im Text aus. Das Azure Cognitive Services-Sprachmodell ist dafür verantwortlich, natürliche Sprache auf Schlüsselwörter oder -begriffe zu reduzieren. Die azure_ai-Erweiterung für Azure Database for PostgreSQL stellt die azure_cognitive.extract_key_phrases-API bereit, um direkt in SQL-Abfragen auf die Schlüsselbegriffserkennung zuzugreifen.