एआई और वेक्टर एकीकरण

पूरा किया

SQL Server 2025 AI और वेक्टर फ़ंक्शंस का एक नया सेट पेश करता है जो डेटाबेस डेवलपर्स को AI-संचालित क्षमताओं को सीधे T-SQL में एकीकृत करने में सक्षम बनाता है। ये नई क्षमताएं एसक्यूएल सर्वर को छोड़े बिना एम्बेडिंग उत्पन्न करना, वेक्टर समानता की गणना करना और एआई-समृद्ध डेटा में खोज करना संभव बनाती हैं। एकीकरण का यह स्तर बाहरी सेवाओं की आवश्यकता को कम करता है, एप्लिकेशन आर्किटेक्चर को सरल बनाता है, और वास्तविक समय के बुद्धिमान कार्यभार का समर्थन करता है।

एआई और वेक्टर फ़ंक्शंस अवलोकन

SQL Server 2025 में नई AI सुविधाएँ तीन मुख्य श्रेणियों में आती हैं: AI पीढ़ी, वेक्टर संचालन और वेक्टर अनुक्रमण और खोज।

एआई जनरेशन फ़ंक्शंस

  • AI_GENERATE_CHUNKS – बड़े पाठ या दस्तावेज़ों को शब्दार्थ रूप से सुसंगत विखंडू में विभाजित करता है जिसे बाद में एम्बेड किया जा सकता है या पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG) परिदृश्यों के लिए संग्रहीत किया जा सकता है।
  • AI_GENERATE_EMBEDDINGS – SQL सर्वर में पंजीकृत बाहरी मॉडल का उपयोग करके टेक्स्ट इनपुट से एम्बेडिंग उत्पन्न करता है। इन एम्बेडिंग को वेक्टर खोज, समानता विश्लेषण या सिमेंटिक रैंकिंग में उपयोग के लिए तालिकाओं में संग्रहीत किया जा सकता है।

वेक्टर संचालन

  • VECTOR_DISTANCE - दो वेक्टर मानों के बीच की दूरी की गणना करता है, कोसाइन, यूक्लिडियन और डॉट उत्पाद जैसे दूरी मेट्रिक्स का समर्थन करता है।
  • VECTOR_NORM - किसी दिए गए वेक्टर के लिए वेक्टर मानदंड (परिमाण) लौटाता है।
  • VECTOR_NORMALIZE - एक वेक्टर का एक सामान्यीकृत संस्करण लौटाता है, जो आमतौर पर तुलना या समानता खोजों से पहले उपयोग किया जाता है।
  • VECTORPROPERTY - एक वेक्टर के बारे में मेटाडेटा लौटाता है, जैसे कि इसके आयाम या तत्व प्रकार।

बाहरी मॉडल और वेक्टर इंडेक्स

SQL Server 2025 आपको T-SQL का उपयोग करके बाहरी AI मॉडल को पंजीकृत और प्रबंधित करने की अनुमति देता है।

  • बाहरी मॉडल बनाएं / बाहरी मॉडल बदलें / बाहरी मॉडल छोड़ें - एआई मॉडल प्रबंधित करें जो स्थानीय रूप से या समर्थित मॉडल प्रदाताओं के माध्यम से होस्ट किए जाते हैं।
  • वेक्टर इंडेक्स बनाएं - समानता खोजों में तेजी लाने के लिए वेक्टर डेटा के लिए अनुकूलित एक इंडेक्स बनाता है।
  • VECTOR_SEARCH - वेक्टर इंडेक्स का उपयोग करके वेक्टर डेटा पर समानता खोज संचालन करता है, चयनित दूरी मीट्रिक के आधार पर निकटतम मिलान लौटाता है।

ये क्षमताएँ SQL सर्वर को पूरी तरह से डेटाबेस इंजन के भीतर पुनर्प्राप्ति-संवर्धित जनरेशन, अनुशंसा इंजन और सिमेंटिक खोज अनुप्रयोगों के लिए एक आधार के रूप में सेवा करने की अनुमति देती हैं।

अर्ध-सटीक वेक्टर भंडारण और बाइनरी अंतर्ग्रहण

वैक्टर अब मेमोरी उपयोग को कम करने और एम्बेडिंग-भारी वर्कलोड में स्कैन प्रदर्शन में सुधार करने के लिए अर्ध-सटीक फ़्लोटिंग-पॉइंट (fp16) तत्वों का उपयोग कर सकते हैं।
आप या का उपयोग करके BULK INSERT बाइनरी प्रारूप में OPENROWSET(BULK ...) कर सकते हैं, जो SQL सर्वर के बाहर बनाए गए बड़े एम्बेडिंग सेट को आयात करना सरल बनाता है।

उदाहरण परिदृश्य: उत्पाद अनुशंसा क्वेरी बनाना

कल्पना कीजिए कि आप एक खुदरा कंपनी के लिए काम करते हैं जो उत्पाद विवरण को SQL Server 2025 डेटाबेस में संग्रहीत करती है। मार्केटिंग टीम एक अनुशंसा सुविधा का निर्माण करना चाहती है जो किसी चयनित आइटम के समान उत्पादों का सुझाव देती है। नई एआई और वेक्टर सुविधाओं का उपयोग करके, आप उत्पाद विवरण के लिए एम्बेडिंग उत्पन्न कर सकते हैं, उन्हें एक तालिका में संग्रहीत कर सकते हैं, और बाहरी प्रसंस्करण के बिना समानता खोज कर सकते हैं।

मॉडल बनाएं और पंजीकृत करें

एम्बेडिंग जनरेट करने से पहले, आपको एक बाहरी मॉडल पंजीकृत करना होगा।

CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
      API_KEY = SECRET('openai_key'),
      MODEL_NAME = 'text-embedding-3-small');

एम्बेडिंग जनरेट और स्टोर करें

एक बार मॉडल पंजीकृत हो जाने के बाद, आप अपने उत्पाद विवरण के लिए एम्बेडिंग उत्पन्न कर सकते हैं और उन्हें एक नई तालिका में संग्रहीत कर सकते हैं।

CREATE TABLE ProductEmbeddings
(
    ProductID INT PRIMARY KEY,
    Description NVARCHAR(MAX),
    Embedding VECTOR(1536)
);

INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
       Description,
       AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;

खोज प्रदर्शन को बेहतर बनाने के लिए, समानता खोजों को तेज़ करने के लिए एक वेक्टर अनुक्रमणिका बनाएं।

CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');

अब आप संबंधित उत्पादों के लिए शब्दार्थ खोज कर सकते हैं:

DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);

SELECT TOP 5 ProductID, Description,
       VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;

परिणाम

उत्पाद आईडी विवरण समानतास्कोर
105 "लाइटवेट वाटरप्रूफ ट्रैवल बैकपैक" 0.07
116 "रेन कवर और हाइड्रेशन स्लॉट के साथ हाइकिंग पैक" 0.10
117 "पानी प्रतिरोध के साथ कॉम्पैक्ट आउटडोर डे पैक" 0.12
101 "बाहरी पट्टियों के साथ ट्रेल-रेडी बैकपैक" 0.15
119 "यात्रा और शिविर निविड़ अंधकार डफेल" 0.18

यह उदाहरण दर्शाता है कि बाहरी AI मॉडल को कैसे एकीकृत किया जाए, सीधे T-SQL के भीतर एम्बेडिंग उत्पन्न किया जाए, और अंतर्निहित वेक्टर फ़ंक्शन का उपयोग करके समानता खोज कैसे की जाए। सब कुछ एसक्यूएल सर्वर के अंदर चलता है, जो विकास को सरल बनाता है और बुद्धिमान वर्कलोड को मौजूदा डेटाबेस नीतियों के तहत सुरक्षित और शासित रहने की अनुमति देता है।

सारांश

SQL Server 2025 मूल AI क्षमताओं का परिचय देता है जो डेवलपर्स को सीधे T-SQL में बुद्धिमान डेटाबेस एप्लिकेशन बनाने की अनुमति देता है। प्रदर्शन और सुरक्षा बनाए रखते हुए एआई मॉडल के साथ एकीकरण को सुव्यवस्थित करने जैसे AI_GENERATE_EMBEDDINGS कार्यVECTOR_DISTANCEVECTOR_SEARCH। साथ में, ये सुविधाएँ SQL Server 2025 को बाहरी कंप्यूट पाइपलाइनों पर निर्भर किए बिना सिमेंटिक सर्च, सिफारिशें, और संदर्भ-जागरूक विश्लेषण के लिए एक मजबूत प्लेटफ़ॉर्म बनाती हैं।