Funktionen ai_summarize
Gäller för: Databricks SQL Databricks Runtime
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
I förhandsversionen:
- Den underliggande språkmodellen kan hantera flera språk, men dessa funktioner är anpassade för engelska.
- Det finns hastighetsbegränsning för de underliggande FOUNDATION Model-API:erna. Se Foundation Model-API:er för att uppdatera dessa gränser.
Med ai_summarize()
funktionen kan du anropa en toppmodern generativ AI-modell för att generera en sammanfattning av en viss text med hjälp av SQL. Den här funktionen använder en chattmodell som betjänar slutpunkten som görs tillgänglig av Databricks Foundation-modell-API:er.
Krav
Viktigt!
De underliggande modeller som kan användas just nu är licensierade under Apache 2.0-licensen eller Llama 2 Community-licensen. Databricks rekommenderar att du granskar dessa licenser för att säkerställa efterlevnad av tillämpliga villkor. Om modeller dyker upp i framtiden som presterar bättre enligt Databricks interna riktmärken kan Databricks ändra modellen (och listan över tillämpliga licenser som tillhandahålls på den här sidan).
För närvarande är Mixtral-8x7B Instruct den underliggande modellen som driver dessa AI-funktioner.
- Den här funktionen är endast tillgänglig på arbetsytor i AI Functions med hjälp av FOUNDATION Model API:er som stöds.
- Den här funktionen är inte tillgänglig i Azure Databricks SQL Classic.
- Kontrollera prissättningssidan för Databricks SQL.
Kommentar
I Databricks Runtime 15.1 och senare stöds den här funktionen i Databricks Notebooks, inklusive notebook-filer som körs som en uppgift i ett Databricks-arbetsflöde.
Syntax
ai_summarize(content[, max_words])
Argument
content
: EttSTRING
uttryck, texten som ska sammanfattas.max_words
: Ett valfritt icke-negativt, numeriskt uttryck som representerar det bästa målantalet ord i den returnerade sammanfattningstexten. Standardvärdet är 50. Om värdet är 0 finns det ingen ordgräns.
Returer
En STRING
.
Om content
är NULL
är NULL
resultatet .
Exempel
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
)
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."