Condividi tramite


Funzione ai_similarity

Si applica a: segno di spunta sì Databricks SQL segno di spunta sì Databricks Runtime

Importante

Questa funzionalità è disponibile in anteprima pubblica.

Nell'anteprima:

  • Il modello linguistico sottostante può gestire diverse lingue, ma queste funzioni sono state ottimizzate per l'inglese.
  • Esiste una limitazione della velocità per le API del modello di base sottostanti. Vedere Limiti delle API del modello di base per aggiornare questi limiti.

La funzione ai_similarity() richiama un modello di intelligenza artificiale generativa all'avanguardia dalle API del modello di base di Databricks per confrontare due stringhe e calcola il punteggio di somiglianza semantica usando SQL.

Requisiti

Importante

I modelli sottostanti che potrebbero essere usati in questo momento sono concessi in licenza con la licenza apache 2.0, copyright © Apache Software Foundation o LLAMA 3.1 Community License © Meta Platforms, Inc. Tutti i diritti riservati. I clienti sono tenuti a garantire la conformità con i modelli di licenza applicabili.

Databricks consiglia di esaminare queste licenze per garantire la conformità con le condizioni applicabili. Se i modelli emergono in futuro che offrono prestazioni migliori in base ai benchmark interni di Databricks, Databricks potrebbe modificare il modello (e l'elenco delle licenze applicabili fornite in questa pagina).

Attualmente, GTE Large (inglese) è il modello sottostante che supporta questa funzione di intelligenza artificiale.

Nota

In Databricks Runtime 15.1 e versioni successive questa funzione è supportata nei notebook di Databricks, inclusi i notebook eseguiti come attività in un flusso di lavoro di Databricks.

Sintassi

ai_similarity(expr1, expr2)

Argomenti

  • expr1: un’espressione STRING.
  • expr2: un’espressione STRING.

Valori restituiti

Valore FLOAT che rappresenta la somiglianza semantica tra le due stringhe di input. Il punteggio di output è relativo e deve essere usato solo per la classificazione. Il punteggio 1 indica che i due testi sono uguali.

Esempi

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 1

  Databricks Inc.