Partilhar via


Função ai_similarity

Aplica-se a: Marque Sim Databricks SQL

Importante

Esta funcionalidade está em Pré-visualização Pública.

Na pré-visualização:

  • O modelo de linguagem subjacente pode lidar com vários idiomas, no entanto, essas funções são ajustadas para o inglês.
  • Há limite de taxa para as APIs subjacentes do Modelo de Base. Consulte Limites das APIs do Modelo de Base para atualizar esses limites.

A ai_similarity() função invoca um modelo de IA generativa de última geração das APIs do Databricks Foundation Model para comparar duas cadeias de caracteres e calcula a pontuação de semelhança semântica usando SQL.

Requisitos

Importante

Os modelos subjacentes que podem ser usados neste momento são licenciados sob a Licença MIT ou Licença da comunidade Llama 2. A Databricks recomenda a revisão dessas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os benchmarks internos da Databricks, a Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecida nesta página).

Atualmente, bge-large-en-v1.5 é o modelo subjacente que alimenta essa função de IA.

Sintaxe

ai_similarity(expr1, expr2)

Argumentos

  • expr1: Uma STRING expressão.
  • expr2: Uma STRING expressão.

Devoluções

Um FLOAT valor, que representa a semelhança semântica entre as duas cadeias de entrada. A pontuação de saída é relativa e só deve ser usada para classificação. Pontuação de 1 significa que os dois textos são iguais.

Exemplos

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.