Sdílet prostřednictvím


Funkce ai_similarity

Platí pro: zaškrtnutí označeného ano Databricks SQL zaškrtnutí označeného ano Databricks Runtime

Důležité

Tato funkce je ve verzi Public Preview.

Ve verzi Preview:

  • Základní jazykový model dokáže zpracovat několik jazyků, ale tyto funkce jsou vyladěné pro angličtinu.
  • Pro základní rozhraní API základního modelu existuje omezení rychlosti. Pokud chcete tyto limity aktualizovat, podívejte se na omezení rozhraní API základního modelu.

Funkce ai_similarity() vyvolá špičkový model AI z rozhraní API modelu Databricks Foundation k porovnání dvou řetězců a vypočítá sémantické skóre podobnosti pomocí SQL.

Požadavky

Důležité

Základní modely, které lze v tuto chvíli použít, jsou licencované v rámci licence MIT License nebo Llama 2 community license. Databricks doporučuje zkontrolovat tyto licence, abyste zajistili soulad s platnými podmínkami. Pokud se modely objeví v budoucnu, které fungují lépe podle interních srovnávacích testů Databricks, může Databricks změnit model (a seznam použitelných licencí uvedených na této stránce).

Bge-large-en-v1.5 je v současné době základním modelem, který tuto funkci AI využívá.

Poznámka:

V Databricks Runtime 15.1 a novějších je tato funkce podporovaná v poznámkových blocích Databricks, včetně poznámkových bloků, které se spouští jako úkol v pracovním postupu Databricks.

Syntaxe

ai_similarity(expr1, expr2)

Argumenty

  • expr1: Výraz STRING .
  • expr2: Výraz STRING .

Návraty

Hodnota FLOAT představující sémantickou podobnost mezi dvěma vstupními řetězci. Výstupní skóre je relativní a mělo by se použít pouze pro řazení. Skóre 1 znamená, že se oba texty rovnají.

Příklady

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.