ai_similarity
函式
適用於: Databricks SQL Databricks Runtime
函 ai_similarity()
式會從 Databricks Foundation 模型 API 叫用最先進的產生 AI 模型,以比較兩個字串,並使用 SQL 計算語意相似度分數。
需求
重要
目前可能使用的基礎模型會根據 MIT 授權或 Llama 2 社群授權獲得授權。 Databricks 建議檢閱這些授權,以確保符合任何適用的條款。 如果模型在未來根據 Databricks 的內部基準檢驗而表現更好,Databricks 可能會變更模型(以及此頁面提供的適用授權清單)。
目前 bge-large-en-v1.5 是支援此 AI 函式的基礎模型。
- 此函式僅適用於基礎模型 API 支援的每個令牌付費區域工作區。
- Azure Databricks SQL 傳統無法使用此函式。
- 檢查 Databricks SQL 定價頁面。
注意
在 Databricks Runtime 15.1 和更新版本中,Databricks 筆記本支援此函式,包括以 Databricks 工作流程中工作身分執行的筆記本。
語法
ai_similarity(expr1, expr2)
引數
expr1
STRING
:表達式。expr2
STRING
:表達式。
傳回
值,表示兩個 FLOAT
輸入字串之間的語意相似性。 輸出分數是相對的,而且應該只用於排名。 分數 1 表示兩個文字相等。
範例
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 1
Databricks Inc.