Delen via


ai_similarity-functie

Van toepassing op:aangevinkt als ja Databricks SQL aangevinkt als ja Databricks Runtime

Belangrijk

Deze functie is beschikbaar als openbare preview.

Tijdens de preview kan het onderliggende taalmodel verschillende talen verwerken, maar deze AI-functie is afgestemd op Engels.

De ai_similarity() functie roept een state-of-the-art AI-model aan van Databricks Foundation Model-API's om twee tekenreeksen te vergelijken en berekent de semantische overeenkomstenscore met behulp van SQL.

Vereisten

Belangrijk

De onderliggende modellen die op dit moment kunnen worden gebruikt, hebben een licentie onder de Apache 2.0 License, Copyright © The Apache Software Foundation of de LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Alle rechten voorbehouden. Klanten zijn verantwoordelijk voor het garanderen van naleving van toepasselijke modellicenties.

Databricks raadt aan deze licenties te controleren om ervoor te zorgen dat alle toepasselijke voorwaarden worden nageleefd. Als modellen in de toekomst beter presteren volgens de interne benchmarks van Databricks, kan Databricks het model (en de lijst met toepasselijke licenties op deze pagina) wijzigen.

  • Deze functie is alleen beschikbaar voor werkruimten in AI-functies met Foundation Model API's in ondersteunde regio's.
  • Deze functie is niet beschikbaar in Azure Databricks SQL Classic.
  • Controleer de pagina met prijzen voor Databricks SQL.
  • In Databricks Runtime 15.1 en hoger wordt deze functie ondersteund in Databricks-notebooks, waaronder notebooks die worden uitgevoerd als een taak in een Databricks-werkstroom.
  • Batch-inference workloads vereisen Databricks Runtime 15.4 ML LTS voor betere prestaties.

Syntaxis

ai_similarity(expr1, expr2)

Argumenten

  • expr1: Een STRING expressie.
  • expr2: Een STRING expressie.

Retouren

Een FLOAT waarde, die de semantische gelijkenis tussen de twee invoertekenreeksen vertegenwoordigt. De uitvoerscore is relatief en mag alleen worden gebruikt voor classificatie. Score van 1 betekent dat de twee tekst gelijk zijn.

Voorbeelden

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 10;

  Databricks Inc.