Partekatu honen bidez:


ai_summarizeFunción

Se aplica a:casilla marcada como Sí Databricks SQL casilla marcada como Sí Databricks Runtime

Importante

Esta funcionalidad está en versión preliminar pública y compatible con HIPAA.

Durante la versión preliminar:

La función ai_summarize() permite invocar un modelo de IA generativa de última generación para generar un resumen de un texto determinado mediante SQL. Esta función usa un modelo de puntos de conexión de servicio de chat que ofrece API de modelos fundacionales de Databricks.

Requisitos

Importante

Los modelos subyacentes que se pueden usar en este momento tienen licencia en virtud de la licencia de Apache 2.0, Copyright © The Apache Software Foundation o el LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Todos los derechos reservados. Los clientes son responsables de garantizar el cumplimiento de las licencias de modelo aplicables.

Databricks recomienda revisar estas licencias para garantizar el cumplimiento de los términos aplicables. Si los modelos surgen en el futuro que funcionan mejor según las pruebas comparativas internas de Databricks, Databricks podría cambiar el modelo (y la lista de licencias aplicables proporcionadas en esta página).

Sintaxis

ai_summarize(content[, max_words])

Argumentos

  • content: expresión STRING, el texto que se va a resumir.
  • max_words: expresión numérica integral no negativa opcional que representa el número de destino de mejor esfuerzo de palabras en el texto de resumen devuelto. El valor predeterminado es 50. Si se establece en 0, no hay ningún límite de palabras.

Devoluciones

STRING.

Si content es NULL, el resultado es NULL.

Ejemplos

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."