מבוא

הושלמה

יישומי בינה מלאכותית דורשים אחסון ושליפה יעילים של הטבעות וקטוריות כדי להניע חיפוש סמנטי, המלצות ויצירת שחזור מוגבר. מודול זה מדריך אותך ביישום יכולות חיפוש וקטורי ב-Azure Database עבור PostgreSQL באמצעות ההרחבה pgvector, מה שמאפשר לך לבנות פתרונות בינה מלאכותית שמוצאים תוכן סמנטי דומה מהנתונים שלך.

דמיין שאתה מפתח שבונה מערכת חיפוש בסיס ידע עבור משרד שירותים משפטיים. המערכת צריכה לסייע לעורכי דין למצוא מסמכי תיק, חוזים ותקדימים משפטיים רלוונטיים בהתבסס על משמעות השאילתות שלהם ולא התאמות מדויקות של מילות מפתח. כאשר עורך דין מחפש "הפרת חובת נאמנות במיזוג תאגידי", המערכת חייבת להחזיר מסמכים הדונים מושגים דומים, גם אם הם משתמשים במונחים שונים.

הצוות שלך בחר ב-Azure Database עבור PostgreSQL כי החברה כבר מאחסנת שם מטא-דאטה של מסמכים ומידע על לקוחות. במקום להכניס מסד נתונים וקטורי נפרד ולנהל סנכרון נתונים, תרצה להוסיף יכולות חיפוש וקטורי ישירות למופע PostgreSQL הקיים. המערכת חייבת לטפל במאות אלפי מסמכים משפטיים, לתמוך בשאילתות בזמן אמת עם זמני תגובה בפחות משנייה, ולעדכן את ההטבעות ככל שמסמכים חדשים מגיעים מדי יום.

עליך להפעיל את ההרחבה pgvector, לעצב סכימה שמאחסנת הטמעות לצד מטא-דאטה של מסמכים, ליצור אינדקסים שמאזנים בין מהירות החיפוש לדיוק, ולבנות שאילתות שמחזירות את המסמכים הרלוונטיים ביותר עבור עוזרי מחקר משפטיים המופעלים על ידי RAG.

לאחר השלמת מודול זה, תוכל:

  • אחסון ושאילתת הטמעות וקטוריות באמצעות ההרחבה pgvector במסד הנתונים Azure עבור PostgreSQL
  • בצע חיפושי דמיון וקטורי באמצעות מדדי מרחק שונים ואופרטורים
  • ליצור ולנהל אינדקסים וקטוריים כדי לאופטימיזציה של ביצועי החיפוש
  • יישום אסטרטגיות עדכון ועדכון הטמעה לפיתוח מערכי נתונים
  • בנה דפוסי שליפה שמשלבים חיפוש וקטורי PostgreSQL עם צינורות RAG