בינה מלאכותית ושילוב וקטור

הושלמה

SQL Server 2025 מציג ערכה חדשה של פונקציות AI ופונקציות וקטוריות המאפשרות למפתחי מסדי נתונים לשלב יכולות המופעלות באמצעות בינה מלאכותית ישירות ב- T-SQL. יכולות חדשות אלה מאפשרות ליצור הטבעות, לחשב דמיון וקטורי ולחפש בנתונים המועשרים בבינה מלאכותית מבלי לצאת מ- SQL Server. רמה זו של אינטגרציה מפחיתה את הצורך בשירותים חיצוניים, מפשטת את ארכיטקטורת היישומים ותומכת בעומסי עבודה חכמים בזמן אמת.

סקירה כללית של AI ופונקציות וקטוריות

תכונות הבינה המלאכותית החדשות ב- SQL Server 2025 מתחלקות לשלוש קטגוריות עיקריות: יצירת בינה מלאכותית, פעולות וקטוריות ויצירת אינדקס וקטורי וחיפוש.

פונקציות יצירת AI

  • AI_GENERATE_CHUNKS – פיצול טקסט או מסמכים גדולים לנתחים קוהרנטיים מבחינה סמנטית שניתן להטביע או לאחסן מאוחר יותר עבור תרחישי יצירה מוגברת לאחזור (RAG).
  • AI_GENERATE_EMBEDDINGS – יצירת הטבעות מקלט טקסט באמצעות מודל חיצוני הרשום ב- SQL Server. ניתן לאחסן הטמעות אלה בטבלאות לשימוש בחיפוש וקטורי, ניתוח דמיון או דירוג סמנטי.

פעולות וקטוריות

  • VECTOR_DISTANCE - מחשב את המרחק בין שני ערכים וקטוריים, התומך במדדי מרחק כגון קוסינוס, אוקלידי ומכפלת נקודות.
  • VECTOR_NORM - החזרת הנורמה הווקטורית (גודל) עבור וקטור נתון.
  • VECTOR_NORMALIZE – החזרת גרסה מנורמלת של וקטור, המשמשת בדרך כלל לפני חיפושי השוואה או דמיון.
  • VECTORPROPERTY – מחזיר מטא נתונים על וקטור, כגון הממדים או סוג הרכיב שלו.

מודלים חיצוניים ואינדקסים וקטוריים

SQL Server 2025 מאפשר לך לרשום ולנהל מודלים חיצוניים של AI באמצעות T-SQL.

  • צור מודל חיצוני / שנה מודל חיצוני / שחרר מודל חיצוני - נהל מודלים של AI המתארחים באופן מקומי או דרך ספקי מודלים נתמכים.
  • צור אינדקס וקטורי - יוצר אינדקס המותאם לנתונים וקטוריים כדי להאיץ חיפושי דמיון.
  • VECTOR_SEARCH - מבצע פעולות חיפוש דמיון על נתונים וקטוריים באמצעות האינדקס הווקטורי, ומחזיר את ההתאמות הקרובות ביותר על סמך מדד המרחק שנבחר.

יכולות אלה מאפשרות ל- SQL Server לשמש כבסיס ליצירה מוגברת לאחזור, למנועי המלצות וליישומי חיפוש סמנטי בתוך מנוע מסד הנתונים.

אחסון וקטורי ברמת דיוק למחצה ובליעה בינארית

וקטורים יכולים כעת להשתמש ברכיבי נקודה צפה (fp16) ברמת דיוק חלקית כדי להפחית את השימוש בזיכרון ולשפר את ביצועי הסריקה בעומסי עבודה כבדים של הטמעה.
באפשרותך גם לטעון וקטורים בצובר בתבנית בינארית באמצעות BULK INSERT או OPENROWSET(BULK ...), מה שמפשט את ייבוא ערכות ההטבעה הגדולות שנוצרו מחוץ ל- SQL Server.

תרחיש לדוגמה: בניית שאילתת המלצה על מוצר

תאר לעצמך שאתה עובד בחברה קמעונאית המאחסנת תיאורי מוצרים במסד נתונים של SQL Server 2025. צוות השיווק רוצה לבנות תכונת המלצה שמציעה מוצרים הדומים מבחינה סמנטית לפריט נבחר. באמצעות תכונות הבינה המלאכותית והווקטור החדשות, אתה יכול ליצור הטמעות עבור תיאורי מוצרים, לאחסן אותם בטבלה ולבצע חיפושי דמיון ללא עיבוד חיצוני.

צור ורשום את המודל

לפני יצירת הטבעות, עליך לרשום מודל חיצוני.

CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
      API_KEY = SECRET('openai_key'),
      MODEL_NAME = 'text-embedding-3-small');

צור ואחסן הטמעות

לאחר רישום המודל, תוכל ליצור הטמעות עבור תיאורי המוצרים שלך ולאחסן אותם בטבלה חדשה.

CREATE TABLE ProductEmbeddings
(
    ProductID INT PRIMARY KEY,
    Description NVARCHAR(MAX),
    Embedding VECTOR(1536)
);

INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
       Description,
       AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;

כדי לשפר את ביצועי החיפוש, צור אינדקס וקטורי כדי להאיץ חיפושי דמיון.

CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');

כעת באפשרותך לבצע חיפוש סמנטי אחר מוצרים קשורים:

DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);

SELECT TOP 5 ProductID, Description,
       VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;

תוצאות

מזהה מוצר תיאור ציון דמיון
105 "תרמיל נסיעות קל משקל עמיד למים" 0.07
116 "חבילת טיולים עם כיסוי גשם וחריץ לחות" 0.10
117 "חבילת יום חיצונית קומפקטית עם עמידות במים" 0.12
101 "תיק גב מוכן לשבילים עם רצועות חיצוניות" 0.15
119 "נסיעות וקמפינג דופל עמיד למים" 0.18

דוגמה זו מדגימה כיצד לשלב מודל AI חיצוני, ליצור הטמעות ישירות בתוך T-SQL ולבצע חיפוש דמיון באמצעות פונקציות וקטוריות מובנות. הכל פועל בתוך SQL Server, מה שמפשט את הפיתוח ומאפשר לעומסי עבודה חכמים להישאר מאובטחים ומפוקחים תחת מדיניות מסד נתונים קיימת.

סיכום

SQL Server 2025 מציג יכולות AI מקוריות המאפשרות למפתחים לבנות אפליקציות מסד נתונים חכמות ישירות ב- T-SQL. פונקציות כגון AI_GENERATE_EMBEDDINGS, VECTOR_DISTANCEולייעל VECTOR_SEARCH את האינטגרציה עם מודלים של בינה מלאכותית תוך שמירה על ביצועים ואבטחה. יחד, תכונות אלה הופכות את SQL Server 2025 לפלטפורמה חזקה לחיפוש סמנטי, המלצות וניתוח מודע להקשר מבלי להסתמך על קווי מחשוב חיצוניים.