Sdílet prostřednictvím


Funkce ai_summarize

Platí pro:zaškrtnuté ano Databricks SQL zaškrtnuté ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview a kompatibilní se standardem HIPAA.

Během náhledu:

Funkce ai_summarize() umožňuje vyvolat nejmodernější model generující umělé inteligence k vygenerování souhrnu daného textu pomocí SQL. Tato funkce používá chatovací model obsluhující koncový bod dostupný rozhraními API modelu Foundation Databricks.

Požadavky

Důležité

Základní modely, které lze v současnosti používat, jsou licencovány v rámci licenčníhoApache 2.0, Copyright © The Apache Software Foundation nebo LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Všechna práva vyhrazena. Zákazníci nesou odpovědnost za zajištění dodržování platných licencí pro model.

Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely objeví v budoucnu, které fungují lépe podle interních srovnávacích testů Databricks, může Databricks změnit model (a seznam použitelných licencí uvedených na této stránce).

  • Tato funkce je dostupná pouze v pracovních prostorech v oblastech, které podporují funkce AI optimalizované pro dávkové odvozování.
  • Tato funkce není dostupná v Azure Databricks SQL Classic.
  • Podívejte se na stránku s cenami SQL služby Databricks.
  • Úlohy hromadné inferencí vyžadují pro zvýšení výkonu Databricks Runtime 15.4 ML LTS.

Syntaxe

ai_summarize(content[, max_words])

Argumenty

  • content: Výraz STRING , text, který se má shrnout.
  • max_words: Volitelný nezáporný celočíselný číselný výraz představující cílový počet slov v vráceném souhrnném textu. Výchozí hodnota je 50. Pokud je nastavená hodnota 0, neexistuje žádný limit pro slovo.

Návraty

Úloha STRING.

Pokud content je NULL, výsledek je NULL.

Příklady

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."