Share via


ai_similarity 函式

適用於:check marked yes Databricks SQL

重要

這項功能處於公開預覽狀態

在預覽中,

  • 基礎語言模型可以處理數種語言,不過這些函式會針對英文進行調整。
  • 基礎基礎模型 API 有速率限制,請參閱 基礎模型 API 限制 來更新這些限制。

ai_similarity() 式會從 Databricks Foundation 模型 API 叫用最先進的產生 AI 模型,以比較兩個字串,並使用 SQL 計算語意相似度分數。

需求

重要

目前可能使用的基礎模型會根據 MIT 授權或 Llama 2 社群授權獲得授權。 Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果模型在未來根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面提供的適用授權清單)。

目前 bge-large-en-v1.5 是支援此 AI 函式的基礎模型。

語法

ai_similarity(expr1, expr2)

引數

  • expr1STRING:表達式。
  • expr2STRING:表達式。

傳回

值,表示兩個 FLOAT 輸入字串之間的語意相似性。 輸出分數是相對的,而且應該只用於排名。 分數 1 表示兩個文字相等。

範例

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.