Présentation
Les applications IA nécessitent un stockage et une récupération efficaces des incorporations vectorielles pour alimenter la recherche sémantique, les recommandations et la génération augmentée par récupération. Ce module vous guide tout au long de l’implémentation de fonctionnalités de recherche vectorielle dans Azure Database pour PostgreSQL à l’aide de l’extension pgvector, ce qui vous permet de créer des solutions IA qui trouvent du contenu sémantiquement similaire à partir de vos données.
Imaginez que vous êtes un développeur qui crée un système de recherche de base de connaissances pour un cabinet de services juridiques. Le système doit aider les avocats à trouver des documents de cas, des contrats et des précédents juridiques pertinents en fonction de la signification de leurs requêtes plutôt que des correspondances exactes de mots clés. Lorsqu’un avocat recherche « violation de l’obligation fiduciaire dans la fusion d’entreprise », le système doit retourner des documents qui traitent de concepts similaires même s’ils utilisent une terminologie différente.
Votre équipe a choisi Azure Database pour PostgreSQL, car la société stocke déjà les métadonnées de document et les informations clientes là-bas. Au lieu d’introduire une base de données vectorielle distincte et de gérer la synchronisation des données, vous souhaitez ajouter des fonctionnalités de recherche vectorielle directement à l’instance PostgreSQL existante. Le système doit gérer des centaines de milliers de documents juridiques, prendre en charge des requêtes en temps réel avec des temps de réponse de sous-seconde et mettre à jour les incorporations à mesure que de nouveaux documents arrivent quotidiennement.
Vous devez activer l’extension pgvector, concevoir un schéma qui stocke des incorporations en même temps que les métadonnées de document, créer des index qui équilibrent la vitesse de recherche par rapport à la précision et créer des requêtes qui récupèrent les documents les plus pertinents pour les assistants de recherche juridiques basés sur RAG.
Une fois ce module terminé, vous pourrez :
- Stocker et interroger des incorporations de vecteurs à l’aide de l’extension pgvector dans Azure Database pour PostgreSQL
- Exécuter des recherches de similarité vectorielle à l’aide de métriques et d’opérateurs de distance différents
- Créer et gérer des index vectoriels pour optimiser les performances de recherche
- Implémenter des stratégies de mise à jour et d’actualisation incorporées pour l’évolution des jeux de données
- Créer des modèles de récupération qui intègrent la recherche vectorielle PostgreSQL avec des pipelines RAG