Fonction ai_classify

S’applique à :check marked yes Databricks SQL

Important

Cette fonctionnalité est disponible en préversion publique.

Dans la préversion,

  • Le modèle de langue sous-jacent peut gérer plusieurs langues, mais ces fonctions sont optimisées pour l’anglais.
  • Il existe une limitation de débit pour les API Foundation Model sous-jacentes ; consultez Limites des API Foundation Model pour mettre à jour ces limites.

La fonction ai_classify() vous permet d’appeler un modèle IA génératif de pointe pour classifier le texte d’entrée en fonction des étiquettes que vous fournissez à l’aide de SQL. Cette fonction utilise un modèle de conversation servant un point de terminaison rendu disponible par des API Databricks Foundation Model.

Spécifications

Important

Les modèles sous-jacents qui peuvent être utilisés pour l’instant sont concédés sous la licence Apache 2.0 ou la licence de la communauté Llama 2. Databricks recommande d’examiner ces licences pour vérifier la conformité avec les conditions applicables. Si des modèles fonctionnant mieux d’après les points de référence internes de Databricks venaient à émerger, Databricks peut changer de modèle (et la liste des licences applicables fournies sur cette page).

Actuellement, Mixtral-8x7B Instruct est le modèle sous-jacent qui alimente ces fonctions d’IA.

Syntaxe

ai_classify(content, labels)

Arguments

  • content : une expression STRING, le texte à classer.
  • labels: un littéral ARRAY<STRING>, des étiquettes de classification de sortie attendues. Doit contenir au moins 2 éléments, et pas plus de 20 éléments.

Retours

STRING. La valeur correspond à l’une des chaînes fournies dans l’argument labels. Retourne null si content ne peut pas être classé.

Exemples

> SELECT ai_classify("My password is leaked.", ARRAY("urgent", "not urgent"));
  urgent

> SELECT
    description,
    ai_classify(description, ARRAY('clothing', 'shoes', 'accessories', 'furniture')) AS category
  FROM
    products