Fonction `ai_summarize`

Article
31/01/2025

S’applique à : case marquée oui Databricks SQL Databricks Runtime

Important

Cette fonctionnalité est disponible en préversion publique.

Dans la préversion :

Le modèle de langage sous-jacent peut gérer plusieurs langues. Toutefois, ces fonctions sont optimisées pour l’anglais.
Il existe une limitation de débit pour les API Foundation Model sous-jacentes. Consultez Limites des API Foundation Model pour mettre à jour ces limites.
En raison de la limitation du débit, cette fonction est conçue pour les tests sur de petits jeux de données qui ont moins de 100 lignes. Pour les cas d’usage avec plus de 100 lignes de données, Databricks recommande d’utiliser ai_query et un point de terminaison de débit approvisionné. Voir Effectuer une inférence LLM par lot à l'aide de l’ai_query.

Cette fonction ai_summarize() vous permet d’invoquer un modèle d’IA génératif de pointe pour générer un résumé d’un texte donné à l’aide de SQL. Cette fonction utilise un modèle de conversation servant un point de terminaison rendu disponible par des API Databricks Foundation Model.

Spécifications

Important

Les modèles sous-jacents qui peuvent être utilisés à ce stade sont sous licence sous licence Apache 2.0, Copyright © The Apache Software Foundation ou LLAMA 3.1 Community License © Meta Platforms, Inc. Tous les droits réservés. Les clients sont tenus de d’assurer de leur conformité vis-à-vis des licences de modèle applicables.

Databricks recommande de passer en revue ces licences pour vérifier leur conformité avec les conditions applicables. Si les modèles émergent à l’avenir qui fonctionnent mieux en fonction des benchmarks internes de Databricks, Databricks peut modifier le modèle (et la liste des licences applicables fournies sur cette page).

Actuellement, Meta-Llama-3.1-70B-Instruct est le modèle sous-jacent qui alimente ces fonctions IA.

Cette fonction est disponible uniquement pour les espaces de travail des régions prises en charge AI Functions avec les API Foundation Model.
Cette fonction n’est pas disponible sur Azure Databricks SQL classique.
Consultez la page de tarification de Databricks SQL.

Notes

Dans Databricks Runtime 15.1 et versions ultérieures, cette fonction est prise en charge dans les notebooks Databricks, notamment ceux exécutés en tant que tâche dans un workflow Databricks.

Syntaxe

ai_summarize(content[, max_words])

Arguments

content : expression STRING , texte à résumer.
max_words : une expression numérique intégrale non négative facultative représentant un effort optimal du nombre cible de mots dans le texte résumé renvoyé. La valeur par défaut est 50. Si la valeur est 0, il n’existe aucune limite de mots.

Retours

STRING.

Si content est NULL, le résultat est NULL.

Exemples

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."

Partager via

Fonction `ai_summarize`

Spécifications

Syntaxe

Arguments

Retours

Exemples

Commentaires

Ressources supplémentaires

Partager via

Fonction ai_summarize

Spécifications

Syntaxe

Arguments

Retours

Exemples

Fonctions connexes

Commentaires

Ressources supplémentaires

Fonction `ai_summarize`