ai_classify
-Funktion
Gilt für: Databricks SQL Databricks Runtime
Wichtig
Dieses Feature befindet sich in der Public Preview.
In der Preview ist Folgendes enthalten:
- Das zugrunde liegende Sprachmodell kann mehrere Sprachen verarbeiten. Diese Funktionen sind jedoch für Englisch optimiert.
- Für die zugrunde liegenden Foundation-Modell-APIs gibt es Ratenbegrenzung. Weitere Informationen finden Sie unter Foundation Model-APIs, um diese Grenzwerte zu aktualisieren.
Mit der ai_classify()
-Funktion können Sie ein hochmodernes Modell für generative KI aufrufen, um Eingabetext mithilfe von SQL nach Bezeichnungen zu klassifizieren, die Sie bereitstellen. Diese Funktion verwendet einen Bereitstellungsendpunkt für Chatmodelle, der durch die Basismodell-APIs von Databricks verfügbar gemacht wird.
Anforderungen
Wichtig
Die zugrunde liegenden Modelle, die derzeit möglicherweise verwendet werden, sind unter der Apache 2.0-Lizenz oder der Llama 2-Communitylizenz lizenziert. Databricks empfiehlt, diese Lizenzen zu überprüfen, um die Einhaltung der geltenden Bedingungen zu gewährleisten. Sollten künftig Modelle den internen Benchmarks von Databricks zufolge besser funktionieren, ändert Databricks möglicherweise das Modell (sowie die Liste der anwendbaren Lizenzen auf dieser Seite).
Derzeit ist Mixtral-8x7B Instruct das zugrunde liegende Modell, das als Basis für die KI-Funktionen fungiert.
- Diese Funktion ist ausschließlich für Arbeitsbereiche in den Regionen mit Unterstützung für die tokenbasierte Bezahlung der Basismodell-APIs verfügbar.
- Diese Funktion ist in Azure Databricks SQL Classic nicht verfügbar.
- Weitere Informationen finden Sie auf der Seite zu den Preisen von Databricks SQL.
Hinweis
In Databricks Runtime 15.1 und höher wird diese Funktion in Databricks-Notebooks unterstützt, einschließlich in Notebooks, die als Task in einem Databricks-Workflow ausgeführt werden.
Syntax
ai_classify(content, labels)
Argumente
content
: EinSTRING
-Ausdruck – der Text, der klassifiziert werden solllabels
: EinARRAY<STRING>
-Literal – die erwarteten Klassifizierungsbezeichnungen der Ausgabe. Es muss zwei bis 20 Elemente enthalten.
Gibt zurück
Ein STRING
. Der Wert stimmt mit einer der Zeichenfolgen überein, die im labels
-Argument angegeben sind. Gibt null
zurück, wenn content
nicht klassifiziert werden kann
Beispiele
> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
urgent
> SELECT
description,
ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
FROM
products