Функция ai_similarity
Область применения: Databricks SQL Databricks Runtime
Внимание
Эта функция предоставляется в режиме общедоступной предварительной версии.
В предварительной версии:
- Базовая языковая модель может обрабатывать несколько языков, однако эти функции настраиваются для английского языка.
- Существует ограничение скорости для базовых API-интерфейсов модели Foundation. Сведения об ограничениях для обновления этих ограничений см . в api-интерфейсах модели Foundation.
Функция ai_similarity()
вызывает модель создания искусственного интеллекта из API модели Databricks Foundation для сравнения двух строк и вычислений семантической оценки сходства с помощью SQL.
Требования
Внимание
Базовые модели, которые могут использоваться в настоящее время, лицензируются в соответствии с лицензией MIT или лицензией сообщества Llama 2. Databricks рекомендует просматривать эти лицензии, чтобы обеспечить соответствие любым применимым условиям. Если модели появляются в будущем, которые лучше работают в соответствии с внутренними тестами Databricks, Databricks может изменить модель (и список применимых лицензий, предоставленных на этой странице).
В настоящее время bge-large-en-v1.5 является базовой моделью, которая управляет этой функцией ИИ.
- Эта функция доступна только в рабочих областях в функциях ИИ с помощью поддерживаемых регионов API модели Foundation.
- Эта функция недоступна в Классической версии SQL Azure Databricks.
- Проверьте страницу цен на Databricks SQL.
Примечание.
В Databricks Runtime 15.1 и более поздних версиях эта функция поддерживается в записных книжках Databricks, включая записные книжки, которые выполняются как задача в рабочем процессе Databricks.
Синтаксис
ai_similarity(expr1, expr2)
Аргументы
expr1
: ВыражениеSTRING
.expr2
: ВыражениеSTRING
.
Возвраты
FLOAT
Значение, представляющее семантику сходства между двумя входными строками. Оценка выходных данных является относительной и должна использоваться только для ранжирования. Оценка 1 означает, что два текста равны.
Примеры
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.