Поделиться через


Функция ai_summarize

Область применения: флажок Databricks SQL флажок Databricks Runtime

Внимание

Эта функция предоставляется в режиме общедоступной предварительной версии.

В предварительной версии:

  • Базовая языковая модель может обрабатывать несколько языков, однако эти функции настраиваются для английского языка.
  • Существует ограничение скорости для базовых API-интерфейсов модели Foundation. Сведения об ограничениях для обновления этих ограничений см . в api-интерфейсах модели Foundation.

Эта ai_summarize() функция позволяет вызывать модель создания искусственного интеллекта для создания сводки заданного текста с помощью SQL. Эта функция использует конечную точку обслуживания чата , доступную API модели Databricks Foundation.

Требования

Внимание

Базовые модели, которые могут использоваться в настоящее время, лицензируются в соответствии с лицензией Apache 2.0 или лицензией сообщества Llama 2. Databricks рекомендует просматривать эти лицензии, чтобы обеспечить соответствие любым применимым условиям. Если модели появляются в будущем, которые лучше работают в соответствии с внутренними тестами Databricks, Databricks может изменить модель (и список применимых лицензий, предоставленных на этой странице).

В настоящее время mixtral-8x7B Instruct является базовой моделью, которая управляет этими функциями ИИ.

Примечание.

В Databricks Runtime 15.1 и более поздних версиях эта функция поддерживается в записных книжках Databricks, включая записные книжки, которые выполняются как задача в рабочем процессе Databricks.

Синтаксис

ai_summarize(content[, max_words])

Аргументы

  • contentSTRING: выражение, текст, сводные данные.
  • max_words: необязательное неотрицательное числовое выражение, представляющее целевое количество слов в возвращаемом сводном тексте. Значение по умолчанию — 50. Если задано значение 0, ограничение слова отсутствует.

Возвраты

STRING.

Если content равно NULL, то результат – NULL.

Примеры

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  )
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."