מבוא

3 דקות

יישומי בינה מלאכותית דורשים חיפוש וקטורי מהיר ואמין כדי להפעיל תכונות כמו שליפה סמנטית, מנועי המלצה וצינורות RAG. מסדי נתונים לא מכוונים היטב יוצרים צווארי בקבוק להשהיה שמפחיתים את חוויית המשתמש ומגבילים את קצב התפוקה. מודול זה מדריך אותך באופטימיזציה של Azure Database עבור PostgreSQL ו-pgvector כדי להשיג את הביצועים שפתרונות הבינה המלאכותית שלך דורשים.

דמיין שאתה מפתח שבונה מנוע המלצות מוצר לפלטפורמת מסחר אלקטרוני. המערכת משתמשת בהטמעות וקטוריות כדי למצוא מוצרים דומים בהתבסס על התנהגות המשתמש, תיאורי המוצר ותכונות ויזואליות. כאשר משתמשים גולשים באתר, ההמלצות חייבות להופיע תוך פחות מ-100 מילישניות כדי לא להפריע לחוויית הקנייה. במהלך מכירות מהירות ושיאי חגים, הפלטפורמה מטפלת בעשרות אלפי משתמשים בו-זמנית המבקשים המלצות מותאמות אישית.

הפריסה הראשונית שלך מתפקדת היטב עם קטלוג של 50,000 מוצרים, אך ככל שהמלאי גדל לשני מיליון פריטים והתנועה מזנקת במהלך מבצעים, עיכוב השאילתות עולה מ-30 מילישניות ליותר משנייה אחת. שיעורי ההמרה יורדים כאשר משתמשים נוטשים דפים שנטשים לאט. אתה צריך לכוון את מסד הנתונים, לבחור את אינדקס הווקטורים הנכון, ולהרחיב את התשתית כדי לספק המלצות מהירות מבלי להוציא יותר מדי על משאבי חישוב.

תסריט זה מייצג אתגרים נפוצים ביישומי בינה מלאכותית: ביצועי החיפוש הווקטורי מתדרדרים ככל שהנתונים גדלים, המשתמשים במקביל מגבלות חיבור מתוחים, והפשרה בין דיוק למהירות הופכת לקריטית. הטכניקות שתלמד במודול הזה מיושמות בין אם אתה בונה מערכות המלצות, חיפוש סמנטי, צינורות RAG או תכונות וקטוריות אחרות.

לאחר השלמת מודול זה, תוכל:

כוונן את פרמטרי הקונפיגורציה של PostgreSQL ו-pgvector כדי לאופטם את השהיית השאילתות ושימוש בזיכרון עבור עומסי עבודה של בינה מלאכותית
בחר והגדר את סוג אינדקס הווקטור המתאים בהתבסס על גודל מאגר נתונים, דפוסי שאילתה ודרישות דיוק
עיצוב פריסות נתונים שמקדמות את האחסון הווקטורי ואת ביצועי סינון המטא-דאטה
Scale Azure Database for PostgreSQL לטיפול בעומסי עבודה וקטוריים בנפח גבוה
יישמו אסטרטגיות איגוד חיבורים וניהול סשנים ליישומי בינה מלאכותית

משוב

האם עמוד זה היה מועיל?