ai_extract
-Funktion
Gilt für: Databricks SQL
Wichtig
Dieses Feature befindet sich in der Public Preview.
In der Preview ist Folgendes enthalten:
- Das zugrunde liegende Sprachmodell kann mehrere Sprachen verarbeiten. Diese Funktionen sind jedoch für Englisch optimiert.
- Für die zugrunde liegenden Foundation-Modell-APIs gibt es Ratenbegrenzung. Weitere Informationen finden Sie unter Foundation Model-APIs, um diese Grenzwerte zu aktualisieren.
Mit der ai_extract()
-Funktion können Sie ein hochmodernes Modell für generative KI aufrufen, um Entitäten zu extrahieren, die mithilfe von SQL durch Bezeichnungen aus einem bestimmten Text angegeben wurden. Diese Funktion verwendet einen Bereitstellungsendpunkt für Chatmodelle, der durch die Basismodell-APIs von Databricks verfügbar gemacht wird.
Anforderungen
Wichtig
Die zugrunde liegenden Modelle, die derzeit möglicherweise verwendet werden, sind unter der Apache 2.0-Lizenz oder der Llama 2-Communitylizenz lizenziert. Databricks empfiehlt, diese Lizenzen zu überprüfen, um die Einhaltung der geltenden Bedingungen zu gewährleisten. Sollten künftig Modelle den internen Benchmarks von Databricks zufolge besser funktionieren, ändert Databricks möglicherweise das Modell (sowie die Liste der anwendbaren Lizenzen auf dieser Seite).
Derzeit ist Mixtral-8x7B Instruct das zugrunde liegende Modell, das als Basis für die KI-Funktionen fungiert.
- Diese Funktion ist ausschließlich für Arbeitsbereiche in den Regionen mit Unterstützung für die tokenbasierte Bezahlung der Basismodell-APIs verfügbar.
- Diese Funktion ist in Azure Databricks SQL Classic nicht verfügbar.
- Weitere Informationen finden Sie auf der Seite zu den Preisen von Databricks SQL.
Syntax
ai_extract(content, labels)
Argumente
content
: EinSTRING
-Ausdruck.labels
: EinARRAY<STRING>
-Literal. Jedes Element ist ein Entitätstyp, der extrahiert werden soll.
Gibt zurück
Ein STRUCT
-Ausdruck, bei dem jedes Feld einem in labels
angegebenen Entitätstyp entspricht. Jedes Feld enthält eine Zeichenfolge, die die extrahierte Entität darstellt. Wenn mehrere potenzielle Entitätstypen gefunden werden, wird lediglich einer zurückgegeben.
Wenn content
NULL
ist, ist das Ergebnis NULL
.
Beispiele
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}
Zugehörige Funktionen
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für