Sdílet prostřednictvím


Funkce ai_summarize

Platí pro: zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview.

Ve verzi Preview:

  • Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
  • Pro základní rozhraní API základního modelu existuje omezení rychlosti. Pokud chcete tyto limity aktualizovat, podívejte se na omezení rozhraní API základního modelu.

Tato ai_summarize() funkce umožňuje vyvolat nejmodernější model generující umělé inteligence k vygenerování souhrnu daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.

Požadavky

Důležité

Základní modely, které se v tuto chvíli můžou používat, jsou licencované v rámci licence Apache 2.0 nebo licence komunity Llama 2. Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely objeví v budoucnu, které fungují lépe podle interních srovnávacích testů Databricks, může Databricks změnit model (a seznam použitelných licencí uvedených na této stránce).

Mixtral-8x7B Instruct je v současné době základní model, který tyto funkce umělé inteligence využívá.

Poznámka:

V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.

Syntaxe

ai_summarize(content[, max_words])

Argumenty

  • content: Výraz STRING , text, který se má shrnout.
  • max_words: Volitelný nezáporný celočíselný číselný výraz představující cílový počet slov v vráceném souhrnném textu. Výchozí hodnota je 50. Pokud je nastavená hodnota 0, neexistuje žádný limit pro slovo.

Návraty

Úloha STRING.

Pokud content je NULL, výsledek je NULL.

Příklady

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."