Função ai_summarize
Aplica-se a: Databricks SQL Databricks Runtime
Importante
Esta funcionalidade está em Pré-visualização Pública.
Na pré-visualização:
- O modelo de linguagem subjacente pode lidar com vários idiomas, no entanto, essas funções são ajustadas para o inglês.
- Há limite de taxa para as APIs subjacentes do Modelo de Base. Consulte Limites das APIs do Modelo de Base para atualizar esses limites.
A ai_summarize()
função permite que você invoque um modelo de IA generativa de última geração para gerar um resumo de um determinado texto usando SQL. Essa função usa um modelo de chat que serve o ponto de extremidade disponibilizado pelas APIs do Databricks Foundation Model.
Requisitos
Importante
Os modelos subjacentes que podem ser usados neste momento são licenciados sob a licença Apache 2.0 ou licença da comunidade Llama 2. A Databricks recomenda a revisão dessas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os benchmarks internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).
Atualmente, o Mixtral-8x7B Instruct é o modelo subjacente que alimenta essas funções de IA.
- Esta função só está disponível em espaços de trabalho em regiões suportadas por pagamento por token de APIs do Modelo de Base.
- Esta função não está disponível no Azure Databricks SQL Classic.
- Verifique a página de preços do Databricks SQL.
Nota
No Databricks Runtime 15.1 e superior, essa função é suportada em blocos de anotações Databricks, incluindo blocos de anotações que são executados como uma tarefa em um fluxo de trabalho Databricks.
Sintaxe
ai_summarize(content[, max_words])
Argumentos
content
: UmaSTRING
expressão, o texto a ser resumido.max_words
: Uma expressão numérica integral não negativa opcional que representa o número de palavras alvo de melhor esforço no texto de resumo retornado. O valor predefinido é 50. Se definido como 0, não há limite de palavras.
Devoluções
A STRING
.
Se content
for NULL
, o resultado é NULL
.
Exemplos
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
)
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."
Funções relacionadas
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários