ai_summarize
함수
적용 대상: Databricks SQL
Databricks Runtime
중요
이 기능은 공개 미리 보기 상태입니다.
미리 보기에서:
- 기본 언어 모델은 여러 언어를 처리할 수 있지만 이러한 함수는 영어로 조정됩니다.
- 기본 Foundation Model API에 대한 속도 제한이 있습니다. 이러한 제한을 업데이트하려면
Foundation Model API 제한을 참조하세요. - 이 함수에는 보수적인 기본 속도 제한이 적용됩니다. 높은 처리량 애플리케이션의 경우 지원에 문의하세요.
ai_summarize()
함수를 사용하면 최신 생성 AI 모델을 호출하여 SQL을 사용하여 지정된 텍스트의 요약을 생성할 수 있습니다. 이 함수는 Databricks Foundation 모델 API에서 사용할 수 있는 엔드포인트를 제공하는 채팅 모델을 사용합니다.
중요
현재 사용할 수 있는 기본 모델은 Apache 2.0 라이선스, Copyright © The Apache Software Foundation 또는 LLAMA 3.3 Community License Copyright © Meta Platforms, Inc.에 따라 라이선스가 부여됩니다. 모든 권한이 예약되어 있습니다. 고객은 해당 모델 라이선스를 준수할 책임이 있습니다.
Databricks는 해당 조건을 준수하도록 이러한 라이선스를 검토할 것을 권장합니다. Databricks의 내부 벤치마크에 따라 더 나은 성능을 제공하는 모델이 향후에 나타날 경우 Databricks는 모델(및 이 페이지에 제공된 해당 라이선스 목록)을 변경할 수 있습니다.
- 이 함수는 Foundation Model API 지원 지역을 사용하여 AI Functions의 작업 영역에서 만 사용할 수 있습니다.
- 이 기능은 Azure Databricks SQL 클래식에서는 사용할 수 없습니다.
- Databricks SQL 가격 페이지를 확인하세요.
참고
Databricks Runtime 15.1 이상에서는 이 함수가 Databricks 노트북에서 지원됩니다. 여기에는 Databricks 워크플로 내에서 태스크로 실행되는 노트북도 포함됩니다.
ai_summarize(content[, max_words])
-
content
: 요약할 텍스트인STRING
표현식입니다. -
max_words
: 반환된 요약 텍스트에서 최상의 목표 단어 수를 나타내는 선택적 비음수 정수 숫자 식입니다. 기본값은 50입니다. 0으로 설정하면 단어 제한이 없습니다.
STRING
.
content
가 NULL
이면 결과는 NULL
입니다.
> SELECT ai_summarize(
'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
'engine that supports general execution graphs. It also supports a rich set ' ||
'of higher-level tools including Spark SQL for SQL and structured data ' ||
'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
'computation and stream processing.',
20
);
"Apache Spark is a unified, multi-language analytics engine for large-scale data processing
with additional tools for SQL, machine learning, graph processing, and stream computing."