إعداد ملحق pgvector في Azure PostgreSQL للاستخدام مع Spring الذكاء الاصطناعي

مكتمل

البحث عن تشابه المتجهات هو تقنية تستخدم للعثور على عناصر مشابهة في مجموعة بيانات عن طريق مقارنة تمثيلات المتجهات الخاصة بها. يتم حساب تشابه المتجهات عادة باستخدام مقاييس المسافة، مثل المسافة الإقليدية أو cosine التشابه. في سياق الذكاء الاصطناعي والتعلم الآلي، تمثل تمثيلات المتجهات أو عمليات التضمين تمثيلا رقميا لنقاط البيانات، مثل الكلمات أو الصور أو استعلامات المستخدم. تلتقط هذه المتجهات المعنى الدلالي لنقاط البيانات، ما يتيح عمليات بحث التشابه الفعالة.

على سبيل المثال، في نظام الإجابة على الأسئلة، يمكن تحويل استعلامات المستخدم إلى تضمينات متجهات. يمكن بعد ذلك مقارنة هذه التضمينات بقاعدة بيانات للتضمينات المحوسبة مسبقا للمطالبات والإجابات السابقة للعثور على أكثرها تشابها. تعرف هذه العملية باسم البحث عن تشابه المتجهات.

ما هو ملحق pgvector؟

الملحق pgvector هو ملحق ل PostgreSQL الذي يضيف الدعم إلى أنواع البيانات المتجهة والعمليات. يمكنك من تخزين تضمينات المتجهات والاستعلام عنها مباشرة داخل قاعدة بيانات PostgreSQL. باستخدام pgvector، يمكنك إجراء عمليات بحث تشابه فعالة باستخدام عمليات المتجهات، ما يجعلها خيارا مثاليا للتطبيقات التي تتطلب قدرات بحث دلالي.

pgvector يتضمن الملحق الميزات الرئيسية التالية:

  • دعم أنواع بيانات المتجهات.
  • فهرسة فعالة والاستعلام عن بيانات المتجهات.
  • التكامل مع الميزات والملحقات الحالية ل PostgreSQL.

ملحق pgvector في Azure PostgreSQL

pgvector يضيف الملحق بحث تشابه متجه مفتوح المصدر إلى PostgreSQL.

قبل أن تتمكن من التمكين pgvector على مثيل خادم Azure Database for PostgreSQL المرن، تحتاج إلى إضافته إلى قائمة السماح الخاصة بك كما هو موضح في السماح بالملحقات. لتحديد ما إذا كنت قد أضفته بشكل صحيح، استخدم الأمر التالي: SHOW azure.extensions;

هام

غالبا ما يشير مجتمع PostgreSQL إلى هذا الملحق على أنه pgvector. ومع ذلك، فإن اسم الثنائي والملحق نفسه هو vector، وهو الاسم الذي يجب استخدامه في قائمة السماح وعند إنشائه في PostgreSQL عبر CREATE EXTENSION الأمر .

بعد إضافة الملحق إلى قائمة السماح، قم بتثبيت الملحق باستخدام أمر SQL التالي:

CREATE EXTENSION IF NOT EXISTS vector;

عمليات pgvector

pgvector يتيح الملحق البحث عن التشابه الفعال، كما هو موضح في المثال التالي:

SELECT id, prompt, response
FROM chat_history
ORDER BY embedding <-> '[0.1,0.2,...]'::vector
LIMIT 3;

تطبيق Spring الذكاء الاصطناعي pgvector

يتضمن Spring الذكاء الاصطناعي تجريدا للتسمية pgvectorVectorStore. يتطلب هذا التنفيذ اثنين من ملحقات PostgreSQL الأخرى: hstore و uuid-ossp.

عند بدء التشغيل، يقوم Spring Boot بتثبيت الملحقات المطلوبة وإنشاء الجدول المطلوب vector_store باستخدام فهرس إذا لم يكن موجودا بالفعل.

ملخص الوحدة

يوفر البحث عن pgvector تشابه المتجهات والملحق قدرات قوية لبناء تطبيقات تعمل الذكاء الاصطناعي تتطلب وظيفة بحث دلالي. باستخدام هذه الأدوات في Azure PostgreSQL، يمكنك تخزين وفهرسة واستعلام تضمينات متجهات بكفاءة، ما يتيح ميزات البحث والاسترداد المتقدمة في تطبيقاتك.

في الوحدة التالية، يمكنك تنفيذ الخطوات لإنشاء قاعدة بيانات PostgreSQL وتكوينها، وتمكين الملحق pgvector ، وإنشاء الجداول المطلوبة للاستخدام مع Spring الذكاء الاصطناعي.