Introductie

3 minuten

AI-toepassingen vereisen efficiënte opslag en retrieval van vector embeddings om semantische zoekopdrachten, aanbevelingen en generatie verrijkt met retrieval mogelijk te maken. In deze module wordt u begeleid bij het implementeren van vectorzoekmogelijkheden in Azure Database for PostgreSQL met behulp van de pgvector-extensie, zodat u AI-oplossingen kunt bouwen die semantisch vergelijkbare inhoud van uw gegevens vinden.

Stel dat u een ontwikkelaar bent die een knowledge base-zoeksysteem bouwt voor een juridische dienstverlener. Het systeem moet advocaten helpen relevante zakendocumenten, contracten en juridische precedenten te vinden op basis van de betekenis van hun query's in plaats van exacte trefwoordovereenkomsten. Wanneer een advocaat zoekt naar "schending van fiduciaire plicht bij bedrijfsfusie", moet het systeem documenten retourneren die vergelijkbare concepten bespreken, zelfs als ze verschillende terminologie gebruiken.

Uw team heeft Azure Database for PostgreSQL gekozen omdat het bedrijf daar al documentmetagegevens en clientgegevens opslaat. In plaats van een afzonderlijke vectordatabase te introduceren en gegevenssynchronisatie te beheren, wilt u vectorzoekmogelijkheden rechtstreeks toevoegen aan het bestaande PostgreSQL-exemplaar. Het systeem moet honderden duizenden juridische documenten verwerken, realtime query's ondersteunen met sub-seconde reactietijden en insluitingen bijwerken naarmate nieuwe documenten dagelijks binnenkomen.

U moet de pgvector-extensie inschakelen, een schema ontwerpen waarin insluitingen naast documentmetagegevens worden opgeslagen, indexen maken die de zoeksnelheid afwegen tegen nauwkeurigheid en query's bouwen waarmee de meest relevante documenten voor juridisch onderzoeksassistenten op basis van RAG worden opgehaald.

Nadat u deze module hebt voltooid, kunt u het volgende doen:

Insluitingen van vectoren opslaan en opvragen met behulp van de pgvector-extensie in Azure Database for PostgreSQL
Vector similarity-zoekopdrachten uitvoeren met behulp van verschillende metrische gegevens over afstand en operators
Vectorindexen maken en beheren om de zoekprestaties te optimaliseren
Strategieën voor het bijwerken en vernieuwen van embeddings in veranderende datasets implementeren
Ophaalpatronen bouwen waarmee PostgreSQL-vectorzoekopdrachten worden geïntegreerd met RAG-pijplijnen

Feedback

Is deze pagina nuttig?