Freigeben über


ai_summarize-Funktion

Gilt für: durch Häkchen mit „Ja“ markiert Databricks SQL durch Häkchen mit „Ja“ markiert Databricks Runtime

Wichtig

Dieses Feature befindet sich in der Public Preview.

In der Preview ist Folgendes enthalten:

  • Das zugrunde liegende Sprachmodell kann mehrere Sprachen verarbeiten. Diese Funktionen sind jedoch für Englisch optimiert.
  • Für die zugrunde liegenden Foundation-Modell-APIs gibt es Ratenbegrenzung. Weitere Informationen finden Sie unter Foundation Model-APIs, um diese Grenzwerte zu aktualisieren.

Mit der ai_summarize()-Funktion können Sie ein hochmodernes Modell für generative KI aufrufen, um mithilfe von SQL die Zusammenfassung eines bestimmten Texts zu generieren. Diese Funktion verwendet einen Bereitstellungsendpunkt für Chatmodelle, der durch die Basismodell-APIs von Databricks verfügbar gemacht wird.

Anforderungen

Wichtig

Die zugrunde liegenden Modelle, die derzeit möglicherweise verwendet werden, sind unter der Apache 2.0-Lizenz oder der Llama 2-Communitylizenz lizenziert. Databricks empfiehlt, diese Lizenzen zu überprüfen, um die Einhaltung der geltenden Bedingungen zu gewährleisten. Sollten künftig Modelle den internen Benchmarks von Databricks zufolge besser funktionieren, ändert Databricks möglicherweise das Modell (sowie die Liste der anwendbaren Lizenzen auf dieser Seite).

Derzeit ist Mixtral-8x7B Instruct das zugrunde liegende Modell, das als Basis für die KI-Funktionen fungiert.

Hinweis

In Databricks Runtime 15.1 und höher wird diese Funktion in Databricks-Notebooks unterstützt, einschließlich in Notebooks, die als Task in einem Databricks-Workflow ausgeführt werden.

Syntax

ai_summarize(content[, max_words])

Argumente

  • content: Ein STRING-Ausdruck – der Text, der zusammengefasst werden soll
  • max_words: Ein optionaler, nicht negativer integraler numerischer Ausdruck, der die bestmögliche Zielanzahl von Wörtern im zurückgegebenen Zusammenfassungstext darstellt. Der Standardwert ist 50. Wenn dieser Wert auf null festgelegt ist, wird die Wortanzahl nicht begrenzt.

Gibt zurück

Ein STRING.

Wenn contentNULL ist, ist das Ergebnis NULL.

Beispiele

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."