ai_summarize-functie

Van toepassing op:check marked yes Databricks SQL

Belangrijk

Deze functie is beschikbaar als openbare preview.

In de preview

  • Het onderliggende taalmodel kan verschillende talen verwerken, maar deze functies zijn afgestemd op Engels.
  • Er is snelheidsbeperking voor de onderliggende Foundation Model-API's. Zie De limieten voor foundationmodel-API's om deze limieten bij te werken.

Met ai_summarize() de functie kunt u een state-of-the-art AI-model aanroepen om een samenvatting van een bepaalde tekst te genereren met behulp van SQL. Deze functie maakt gebruik van een chatmodel voor eindpunten dat beschikbaar wordt gesteld door Databricks Foundation Model-API's.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0-licentie of llama 2-communitylicentie. Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als er in de toekomst modellen ontstaan die beter presteren op basis van de interne benchmarks van Databricks, kan Databricks het model wijzigen (en de lijst met toepasselijke licenties op deze pagina).

Momenteel is Mixtral-8x7B Instruct het onderliggende model dat deze AI-functies mogelijk maakt.

  • Deze functie is alleen beschikbaar voor werkruimten in foundationmodel-API's die per token worden ondersteund.
  • Deze functie is niet beschikbaar in Azure Databricks SQL Classic.
  • Controleer de pagina met prijzen voor Databricks SQL.

Syntaxis

ai_summarize(content[, max_words])

Argumenten

  • content: Een STRING expressie, de tekst die moet worden samengevat.
  • max_words: Een optionele niet-negatieve integrale numerieke expressie die het best effort-doelaantal woorden in de geretourneerde samenvattingstekst vertegenwoordigt. De standaardwaarde is 50. Als deze optie is ingesteld op 0, is er geen woordlimiet.

Retouren

A STRING.

Als content dat het is NULL, is NULLhet resultaat .

Voorbeelden

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."