Che cos'è la ricerca vettoriale?

Completato

La ricerca vettoriale è una nuova funzionalità disponibile in AI Search usata per indicizzare, archiviare e recuperare l'incorporamento di vettori da un indice di ricerca. Puoi usarlo per supportare le applicazioni che implementano l'architettura RAG (Retrieval Augmented Generation), la somiglianza e le ricerche multi modale o i motori di raccomandazione.

Di seguito è riportata un'illustrazione dei flussi di lavoro di indicizzazione e query per la ricerca vettoriale.

Diagram of the indexing and query workflows.

Una query vettoriale può essere usata per trovare i criteri in diversi tipi di dati di origine fornendo una rappresentazione matematica del contenuto generato dai modelli di Machine Learning. In questo modo, vengono eliminate le limitazioni delle ricerche basate su testo che restituiscono risultati pertinenti usando la finalità della query.

Ecco alcuni scenari in cui è consigliabile usare la ricerca vettoriale:

  • Usa i modelli OpenAI o open source per codificare il testo e usa query codificate come vettori per recuperare i documenti.
  • Esegui una ricerca di somiglianza tra immagini codificate, testo, video e audio o una combinazione di questi (multi-modale).
  • Rappresenta documenti in lingue diverse usando un modello incorporato multilingue per trovare documenti in qualsiasi lingua.
  • Crea ricerche ibride da campi di testo vettoriali e ricercabili quando le ricerche vettoriali vengono implementate a livello di campo. I risultati verranno uniti per restituire una singola risposta.
  • Applica filtri ai campi di testo e ai campi numerici e includili nella query per ridurre i dati che la ricerca vettoriale deve elaborare.
  • Creare un database vettoriale per fornire una Knowledge Base esterna o usare come memoria a lungo termine.

Limiti

Quando si usa la ricerca vettoriale, devi tenere presente alcune limitazioni:

  • È necessario fornire gli incorporamenti usando OpenAI di Azure o una soluzione open source simile, perché Azure AI Search non genera questi elementi per il contenuto.
  • Le chiavi gestite dal cliente (CMK) non sono supportate.
  • Esistono limitazioni di archiviazione applicabili, pertanto dovresti controllare le quote del servizio.

Nota

Se i documenti sono di grandi dimensioni, considera usare la suddivisione in blocchi. Per altre informazioni, usare i documenti di grandi dimensioni per le soluzioni di ricerca vettoriale nella documentazione di AI Search.