Note
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de changer d’annuaire.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de changer d’annuaire.
S’applique à :
Databricks SQL
Databricks Runtime
Important
Cette fonctionnalité est en préversion publique et conforme HIPAA.
Pendant l'aperçu :
- Le modèle de langage sous-jacent peut gérer plusieurs langues, mais cette fonction IA est paramétrée pour l’anglais.
- Consultez Fonctionnalités avec une disponibilité régionale limitée pour la disponibilité de la région AI Functions.
La fonction ai_extract() vous permet d’appeler un modèle d’IA générative de pointe pour extraire des entités spécifiées par des étiquettes dans un texte donné en utilisant SQL. Cette fonction utilise un point de terminaison de mise en service de modèles de conversation rendu disponible par des API Databricks Foundation Model.
Spécifications
Important
Les modèles sous-jacents qui peuvent être utilisés à ce stade sont concédés sous licence sous la licence Apache 2.0 License, Copyright © The Apache Software Foundation ou the LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Tous les droits réservés. Il incombe aux clients de veiller au respect des licences des modèles applicables.
Databricks recommande de passer en revue ces licences pour vérifier leur conformité avec les conditions applicables. Si les modèles émergent à l’avenir qui fonctionnent mieux en fonction des benchmarks internes de Databricks, Databricks peut modifier le modèle (et la liste des licences applicables fournies sur cette page).
- Cette fonction est disponible uniquement sur les espaces de travail dans les régions qui prennent en charge AI Functions optimisé pour l’inférence par lots.
- Cette fonction n’est pas disponible sur Azure Databricks SQL classique.
- Consultez la page de tarification de Databricks SQL.
- Dans Databricks Runtime 15.1 et versions ultérieures, cette fonction est prise en charge dans les notebooks Databricks, notamment ceux exécutés en tant que tâche dans un workflow Databricks.
- Les charges de travail d’inférence par lots nécessitent Databricks Runtime 15.4 ML LTS pour améliorer les performances.
Remarque
Dans Databricks Runtime 15.1 et versions ultérieures, cette fonction est prise en charge dans les notebooks Databricks, notamment ceux exécutés en tant que tâche dans un workflow Databricks.
Syntaxe
ai_extract(content, labels)
Les arguments
-
content: une expressionSTRING. -
labels: UnARRAY<STRING>littéral. Chaque élément est un type d’entité à extraire.
Retours
UnSTRUCT où chaque champ correspond à un type d’entité spécifié dans labels. Chaque champ contient une chaîne représentant l’entité extraite. Si plusieurs candidats pour un type d’entité sont trouvés, un seul est retourné.
Si content est NULL, le résultat est NULL.
Exemples
> SELECT ai_extract(
'John Doe lives in New York and works for Acme Corp.',
array('person', 'location', 'organization')
);
{"person": "John Doe", "location": "New York", "organization": "Acme Corp."}
> SELECT ai_extract(
'Send an email to jane.doe@example.com about the meeting at 10am.',
array('email', 'time')
);
{"email": "jane.doe@example.com", "time": "10am"}