Condividi tramite


Funzione ai_summarize

Si applica a: segno di spunta sì Databricks SQL segno di spunta sì Databricks Runtime

Importante

Questa funzionalità è disponibile in anteprima pubblica.

Nell'anteprima:

  • Il modello linguistico sottostante può gestire diverse lingue, ma queste funzioni vengono ottimizzate per l'inglese.
  • Esiste una limitazione della frequenza per le API del modello di base sottostanti. Vedere Limiti delle API del modello di base per aggiornare questi limiti.

La ai_summarize() funzione consente di richiamare un modello di intelligenza artificiale generativa all'avanguardia per generare un riepilogo di un determinato testo usando SQL. Questa funzione usa un modello di chat che gestisce l'endpoint reso disponibile dalle API del modello di Databricks Foundation.

Requisiti

Importante

I modelli sottostanti che potrebbero essere usati in questo momento sono concessi in licenza con la licenza apache 2.0 o la licenza community llama 2. Databricks consiglia di esaminare queste licenze per garantire la conformità alle condizioni applicabili. Se i modelli emergono in futuro che offrono prestazioni migliori in base ai benchmark interni di Databricks, Databricks può modificare il modello (e l'elenco delle licenze applicabili fornite in questa pagina).

Attualmente, Mixtral-8x7B Instruct è il modello sottostante che supporta queste funzioni di intelligenza artificiale.

  • Questa funzione è disponibile solo nelle aree di lavoro nelle API modello di base supportate con pagamento per token.
  • Questa funzione non è disponibile in Azure Databricks SQL Classico.
  • Controllare la pagina dei prezzi di Databricks SQL.

Nota

In Databricks Runtime 15.1 e versioni successive questa funzione è supportata nei notebook di Databricks, inclusi i notebook eseguiti come attività in un flusso di lavoro di Databricks.

Sintassi

ai_summarize(content[, max_words])

Argomenti

  • contentSTRING: espressione, testo da riepilogare.
  • max_words: espressione numerica integrale facoltativa non negativa che rappresenta il numero di parole di destinazione ottimale nel testo di riepilogo restituito. Il valore predefinito è 50. Se impostato su 0, non esiste alcun limite di parole.

Valori restituiti

Un oggetto STRING.

Se content è NULL, il risultato è NULL.

Esempi

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."