`ai_similarity`函式

發行項
08/29/2024

適用於： 檢查標示為是 Databricks SQL Databricks Runtime

重要

這項功能處於公開預覽狀態。

預覽中：

基礎語言模型可以處理數種語言，不過這些函式會針對英文進行調整。
基礎基礎模型 API 有速率限制。請參閱基礎模型 API 限制以更新這些限制。

函 ai_similarity() 式會從 Databricks Foundation 模型 API 叫用最先進的產生 AI 模型，以比較兩個字串，並使用 SQL 計算語意相似度分數。

需求

重要

目前可能使用的基礎模型會根據 MIT 授權或 Llama 2 社群授權獲得授權。 Databricks 建議檢閱這些授權，以確保符合任何適用的條款。如果模型在未來根據 Databricks 的內部基準檢驗而表現更好，Databricks 可能會變更模型（以及此頁面提供的適用授權清單）。

目前 bge-large-en-v1.5 是支援此 AI 函式的基礎模型。

此函式僅適用於基礎模型 API 支援的每個令牌付費區域工作區。
Azure Databricks SQL 傳統無法使用此函式。
檢查 Databricks SQL 定價頁面。

注意

在 Databricks Runtime 15.1 和更新版本中，Databricks 筆記本支援此函式，包括以 Databricks 工作流程中工作身分執行的筆記本。

語法

ai_similarity(expr1, expr2)

引數

expr1STRING：表達式。
expr2STRING：表達式。

傳回

值，表示兩個 FLOAT 輸入字串之間的語意相似性。輸出分數是相對的，而且應該只用於排名。分數 1 表示兩個文字相等。

範例

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.

共用方式為

`ai_similarity`函式

需求

語法

引數

傳回

範例

意見反應

其他資源

共用方式為

ai_similarity函式

需求

語法

引數

傳回

範例

意見反應

其他資源

`ai_similarity`函式