Episodio
Beyond Keywords: Image similarity search in Azure Cosmos DB for PostgreSQL | Giorno dell'analisi scientifica dei dati Python
con Foteini Savvidou
La ricerca vettoriale, nota anche come ricerca di somiglianza vettoriale, è un metodo che consente di trovare elementi simili in base al contenuto anziché alle corrispondenze esatte su proprietà come parole chiave, tag o altri metadati, come i sistemi di ricerca basati su parole chiave. Sfrutta l'apprendimento automatico per acquisire il significato dei dati, consentendo di trovare elementi simili in base al contenuto. L'idea chiave alla base della ricerca vettoriale è la traduzione di dati non strutturati, ad esempio testo, immagini, video e audio, in vettori altamente dimensionali (noti anche come incorporamenti) e l'applicazione di algoritmi vicini più vicini per trovare dati simili.
In questa sessione di avvio rapido si lavorerà insieme per creare un sistema di ricerca di somiglianza delle immagini usando Python, Azure Cosmos DB per PostgreSQL e pgvector, un'estensione di ricerca di somiglianza del vettore open source per PostgreSQL. Verrà esaminato il processo di generazione di incorporamenti vettoriali usando l'API incorporamenti multi modali di Visione artificiale di Azure e l'abilitazione dell'estensione pgvector. Verrà quindi descritta la ricerca esatta e approssimativa del vicino più vicino e si userà Azure Cosmos DB per PostgreSQL per l'archiviazione e l'esecuzione di query sui dati vettoriali.
Capitoli
- 00:00 - Ricerca somiglianza delle immagini in Azure CosmosDB per PostgreSQL
- 00:56 - Perché la ricerca vettoriale?
- 01:49 - Agenda
- 02:14 - Trasformare i dati in vettori
- 03:02 - Proiettare i vettori nello spazio vettoriale 2D
- 03:37 - Come misurare se 2 vettori sono simlar
- 03:56 - Flusso di lavoro di ricerca vettoriale
- 04:34 - Ricerca vettoriale in PostgreSQL
- 05:01 - Creare una tabella per archiviare gli incorporamenti
- 05:34 - Incorporamenti di query
- 06:01 - Demo
- 07:00 - Strategie di ricerca vettoriale
- 08:21 - Creare un indice IVFFlat in pgvector
- 09:30 - Demo
- 10:01 - Risorse
Risorse consigliate
- Project - GitHub Repository
- pgvector - Repository GitHub
- Vettori in Azure Cosmos DB per PostgreSQL
- API di incorporamento delle funzionalità di incorporamento di Vision per intelligenza artificiale di Azure
Episodi correlati
Connessione
- Foteini Savvidou | Twitter/X: @SavvidouFoteini
La ricerca vettoriale, nota anche come ricerca di somiglianza vettoriale, è un metodo che consente di trovare elementi simili in base al contenuto anziché alle corrispondenze esatte su proprietà come parole chiave, tag o altri metadati, come i sistemi di ricerca basati su parole chiave. Sfrutta l'apprendimento automatico per acquisire il significato dei dati, consentendo di trovare elementi simili in base al contenuto. L'idea chiave alla base della ricerca vettoriale è la traduzione di dati non strutturati, ad esempio testo, immagini, video e audio, in vettori altamente dimensionali (noti anche come incorporamenti) e l'applicazione di algoritmi vicini più vicini per trovare dati simili.
In questa sessione di avvio rapido si lavorerà insieme per creare un sistema di ricerca di somiglianza delle immagini usando Python, Azure Cosmos DB per PostgreSQL e pgvector, un'estensione di ricerca di somiglianza del vettore open source per PostgreSQL. Verrà esaminato il processo di generazione di incorporamenti vettoriali usando l'API incorporamenti multi modali di Visione artificiale di Azure e l'abilitazione dell'estensione pgvector. Verrà quindi descritta la ricerca esatta e approssimativa del vicino più vicino e si userà Azure Cosmos DB per PostgreSQL per l'archiviazione e l'esecuzione di query sui dati vettoriali.
Capitoli
- 00:00 - Ricerca somiglianza delle immagini in Azure CosmosDB per PostgreSQL
- 00:56 - Perché la ricerca vettoriale?
- 01:49 - Agenda
- 02:14 - Trasformare i dati in vettori
- 03:02 - Proiettare i vettori nello spazio vettoriale 2D
- 03:37 - Come misurare se 2 vettori sono simlar
- 03:56 - Flusso di lavoro di ricerca vettoriale
- 04:34 - Ricerca vettoriale in PostgreSQL
- 05:01 - Creare una tabella per archiviare gli incorporamenti
- 05:34 - Incorporamenti di query
- 06:01 - Demo
- 07:00 - Strategie di ricerca vettoriale
- 08:21 - Creare un indice IVFFlat in pgvector
- 09:30 - Demo
- 10:01 - Risorse
Risorse consigliate
- Project - GitHub Repository
- pgvector - Repository GitHub
- Vettori in Azure Cosmos DB per PostgreSQL
- API di incorporamento delle funzionalità di incorporamento di Vision per intelligenza artificiale di Azure
Episodi correlati
Connessione
- Foteini Savvidou | Twitter/X: @SavvidouFoteini
Per inviare suggerimenti, Invia un problema qui.