ابحث عن إجابات للأسئلة الشائعة حول Azure الذكاء الاصطناعي Search.
عام
ما هو Azure AI Search؟
يوفر Azure الذكاء الاصطناعي Search محرك بحث مخصصا وتخزينا مستمرا للمحتوى القابل للبحث لسيناريوهات البحث عن النص الكامل والمتجه. كما يتضمن الذكاء الاصطناعي اختيارية ومتكاملة لاستخراج المزيد من النص والبنية من المحتوى الخام، وإلى تقسيم المحتوى واتجاهه للبحث في المتجهات.
كيف أعمل العمل مع Azure الذكاء الاصطناعي Search؟
سير العمل الأساسي هو إنشاء فهرس وتحميله والاستعلام عنه. على الرغم من أنه يمكنك استخدام مدخل Microsoft Azure لمعظم المهام، فإن Azure الذكاء الاصطناعي Search مخصص لاستخدامه برمجيا، مع معالجة الطلبات من التعليمات البرمجية للعميل. يتم توفير الدعم البرمجي من خلال واجهات برمجة تطبيقات REST ومكتبات العملاء في .NET وPython وJava وJavaScript SDKs ل Azure.
هل "Azure Search" و"Azure Cognitive Search" و"Azure الذكاء الاصطناعي Search" هما نفس المنتج؟
تمت إعادة تسمية Azure Search إلى Azure Cognitive Search في أكتوبر 2019 ليعكس الاستخدام الموسع (ولكنه اختياري) للمهارات المعرفية والمعالجة الذكاء الاصطناعي في عمليات الخدمة. تمت إعادة تسمية Azure Cognitive Search إلى Azure الذكاء الاصطناعي Search في أكتوبر 2023 للتوافق مع خدمات Azure الذكاء الاصطناعي.
ما اللغات المدعومة؟
بالنسبة إلى المتجهات، تحدد نماذج التضمين التي تستخدمها التجربة اللغوية.
بالنسبة للسلاسل والأرقام غير القياسية، فإن المحلل الافتراضي المستخدم للرمز المميز هو Lucene القياسي، وهو غير محدد اللغة. وإلا، يتم التعبير عن دعم اللغة من خلال محللات اللغة التي تطبق القواعد اللغوية على المحتوى الوارد (الفهرسة) والصادر (الاستعلامات). تقتصر بعض الميزات، مثل المدقق الإملائيوإعادة كتابة الاستعلام، على مجموعة فرعية من اللغات.
كيف أعمل دمج البحث في الحل الخاص بي؟
يجب أن تستدعي التعليمات البرمجية للعميل مكتبات عميل Azure SDK أو واجهات برمجة تطبيقات REST للاتصال بفهرس بحث وصياغة الاستعلامات ومعالجة الاستجابات. يمكنك أيضا كتابة التعليمات البرمجية التي تقوم بإنشاء فهرس وتحديثه، أو تشغيل المفهرسات برمجيا أو حسب البرنامج النصي.
هل هناك تماثل وظيفي عبر واجهات برمجة التطبيقات المختلفة؟
ليس دائما. واجهة برمجة تطبيقات REST هي دائما الأولى التي تنفذ ميزات جديدة في إصدارات واجهة برمجة التطبيقات المعاينة. ستلتقط مكتبات العميل في Azure SDKs ميزات جديدة بمرور الوقت، ولكن يتم إصدارها في جدولها الزمني الخاص.
على الرغم من أن واجهات برمجة تطبيقات REST هي أولا مع أحدث الميزات، فإن Azure SDKs توفر المزيد من دعم الترميز، ويوصى بها عبر REST ما لم تكن هناك ميزة مطلوبة غير متوفرة.
هل يمكنني إيقاف الخدمة مؤقتا وإيقاف الفوترة؟
لا يمكنك إيقاف خدمة البحث مؤقتا. في Azure الذكاء الاصطناعي Search، يتم تخصيص موارد الحوسبة عند إنشاء الخدمة. لا يمكن إصدار هذه الموارد واستعادتها عند الطلب.
هل يمكنني ترقية الخدمة أو تخفيضها إلى إصدار أحدث؟
يمكن ترقية الخدمات التي تم إنشاؤها قبل أبريل 2024 في مناطق محددة إلى مجموعات ذات سعة أعلى. لا يتم دعم تخفيض الخدمة.
للحصول على المزيد من السعة، يمكنك أيضا التبديل إلى مستوى تسعير أعلى. لا يمكن أن يكون لمنطقتك قيود على السعة على المستوى الأعلى، ويمكنك فقط التنقل لأعلى بين المستويات الأساسية والقياسية (S1 وS2 وS3)، مثل الانتقال من Basic إلى S1. حاليا، لا يمكنك التبديل إلى مستوى أدنى.
هل يمكنني إعادة تسمية الخدمة أو نقلها؟
يتم إصلاح اسم الخدمة والمنطقة طوال مدة بقاء الخدمة.
إذا قمت بترحيل خدمة البحث الخاصة بي إلى اشتراك آخر أو مجموعة موارد أخرى، فهل يجب أن أتوقع أي وقت تعطل؟
طالما تتبع قائمة الاختيار قبل نقل الموارد وتأكد من اكتمال كل خطوة، فلا ينبغي أن يكون هناك أي وقت تعطل.
لماذا أرى حدود تخزين مختلفة لخدمات البحث من المستوى نفسه؟
يمكن أن تختلف حدود التخزين حسب تاريخ إنشاء الخدمة. في معظم المناطق المدعومة، تتمتع الخدمات الأحدث بحدود تخزين أعلى من الخدمات القديمة، حتى لو كانت على نفس المستوى. ومع ذلك، قد تتمكن من ترقية الخدمة القديمة للوصول إلى الحدود الجديدة.
الفهرسة
ماذا يعني "الفهرسة" في Azure الذكاء الاصطناعي Search؟
يشير إلى استيعاب وتحليل وتخزين المحتوى النصي والرموز المميزة التي تملأ فهرس البحث. تقوم الفهرسة بإنشاء فهارس مقلوبة وهياكل بيانات فعلية أخرى تدعم استرداد المعلومات.
يقوم بإنشاء فهارس متجهة إذا كان المخطط يتضمن حقول متجهات.
هل يمكنني نقل الفهارس والنسخ الاحتياطي واستعادتها؟
لا يوجد دعم أصلي لمؤشرات التصدير. تعتبر فهارس البحث هياكل بيانات انتقال البيانات من الخادم، وتقبل المحتوى من مصادر البيانات الأخرى التي تجمع البيانات التشغيلية. على هذا النحو، لا يوجد دعم مضمن لنسخ الفهارس احتياطيا واستعادتها لأن التوقع هو أنك ستقوم بإعادة إنشاء فهرس من بيانات المصدر إذا قمت بحذفه، أو أردت نقله.
ومع ذلك، إذا كنت ترغب في نقل فهرس بين خدمات البحث، يمكنك تجربة نموذج التعليمات البرمجية لعينة الفهرس-النسخ الاحتياطي-الاستعادة في مستودع نموذج Azure الذكاء الاصطناعي Search .NET هذا. هناك أيضا إصدار Python من النسخ الاحتياطي والاستعادة.
هل يمكنني استعادة الفهرس أو الخدمة بمجرد حذفها؟
لا، إذا قمت بحذف فهرس أو خدمة Azure الذكاء الاصطناعي Search، فلا يمكن استرداده. عند حذف خدمة بحث، يتم حذف جميع الفهارس في الخدمة نهائيا.
هل يمكنني الفهرسة من النسخ المتماثلة لقاعدة بيانات SQL؟
إذا كنت تستخدم مفهرس البحث لقاعدة بيانات Azure SQL، فلا توجد قيود على استخدام النسخ المتماثلة الأساسية أو الثانوية كمصدر بيانات عند إنشاء فهرس من البداية. ومع ذلك، يتطلب تحديث فهرس مع تحديثات تزايدية (استنادا إلى السجلات التي تم تغييرها) النسخة المتماثلة الأساسية. يأتي هذا المطلب من قاعدة بيانات SQL، والتي تضمن تعقب التغيير على النسخ المتماثلة الأساسية فقط. إذا حاولت استخدام النسخ المتماثلة الثانوية لحمل عمل تحديث الفهرس، فلا يوجد ما يضمن حصولك على جميع البيانات.
الخطوط المتجهة
ما هو البحث عن المتجهات؟
البحث عن المتجهات هو تقنية تعثر على المستندات الأكثر تشابها من خلال مقارنة تمثيلات المتجهات الخاصة بها. نظرا لأن الهدف من تمثيل المتجه هو التقاط الخصائص الأساسية لعنصر ما بتنسيق رقمي، يمكن لاستعلامات المتجهات تحديد محتوى مشابه حتى إذا لم تكن هناك تطابقات صريحة استنادا إلى الكلمات الأساسية أو العلامات. عندما يقوم مستخدم بإجراء بحث، يتم تلخيص الاستعلام في تمثيل متجه ويحدد محرك البحث المتجه المستندات الأكثر تشابها. لتحسين الكفاءة على قواعد البيانات الكبيرة، غالبا ما يوفر البحث عن المتجهات أقرب الجيران التقريبيين لمتجه استعلام. راجع نظرة عامة على بحث المتجهات للحصول على تفاصيل عرض متجهات Azure الذكاء الاصطناعي Search.
هل يدعم Azure الذكاء الاصطناعي Search البحث في المتجهات؟
يدعم Azure الذكاء الاصطناعي Search فهرسة المتجهات واستردادها. يمكن أن تقوم بتقسيم سلاسل الاستعلام والمحتوى وتتجه إليه إذا كنت تستخدم المتجهات المتكاملة وتأخذ تبعية على المفهرسات ومجموعات المهارات.
كيف يعمل البحث في المتجهات في Azure الذكاء الاصطناعي Search؟
باستخدام البحث عن متجه مستقل، يمكنك أولا استخدام نموذج تضمين لتحويل المحتوى إلى تمثيل متجه داخل مساحة تضمين. يمكنك بعد ذلك توفير هذه المتجهات في حمولة مستند إلى فهرس البحث للفهرسة. لخدمة طلبات البحث، يمكنك استخدام نفس نموذج التضمين لتحويل استعلام البحث إلى تمثيل متجه، ويبحث البحث عن المتجهات الأكثر تشابها ويعيد المستندات المقابلة.
في Azure الذكاء الاصطناعي Search، يمكنك فهرسة بيانات المتجهات كالحقول في المستندات جنبا إلى جنب مع أنواع نصية وأنواع أخرى من المحتوى. هناك أنواع بيانات متعددة لحقول المتجهات.
يمكن إصدار استعلامات المتجهات مستقلة أو بالاشتراك مع أنواع الاستعلامات الأخرى، بما في ذلك استعلامات المصطلحات وعوامل التصفية في نفس طلب البحث.
هل يمكن ل Azure الذكاء الاصطناعي Search تحويل المحتوى أو الاستعلامات الخاصة بي؟
تتوفر الآن المتجهات المتكاملة المضمنة بشكل عام.
هل تدعم خدمة البحث بحث المتجهات؟
تدعم معظم الخدمات الموجودة البحث عن المتجهات. إذا كنت تستخدم حزمة أو واجهة برمجة تطبيقات تدعم البحث عن المتجهات وإنشاء الفهرس، فإن خدمة البحث الأساسية لا تدعم البحث في المتجهات، ويجب إنشاء خدمة جديدة. يمكن أن يحدث هذا لمجموعة فرعية صغيرة من الخدمات التي تم إنشاؤها قبل 1 يناير 2019.
هل يمكنني إضافة بحث متجه إلى فهرس موجود؟
إذا كانت خدمة البحث تدعم البحث في المتجهات، يمكن أن تستوعب الفهارس الحالية والجديدة حقول المتجهات.
لماذا أرى حدودا مختلفة لحجم فهرس المتجهات بين خدمات البحث الجديدة وخدمات البحث الموجودة؟
قامت Azure الذكاء الاصطناعي Search بطرح حدود محسنة لحجم فهرس المتجهات في جميع أنحاء العالم لخدمات البحث الجديدة، ولكن بعض المناطق تواجه قيود على السعة، ولا تحتوي بعض المناطق على البنية الأساسية المطلوبة. يجب أن تشهد خدمات البحث الجديدة التي تم إنشاؤها بعد مايو 2024 في المناطق المدعومة حدودا متزايدة لحجم فهرس المتجهات. بدلا من ذلك، إذا كان لديك خدمة موجودة في منطقة مدعومة، يمكنك ترقية الخدمة للوصول إلى الحدود الجديدة.
لماذا لا يظهر فهرس المتجهات أي تخزين؟
تقوم فهارس المتجهات التي تستخدم خوارزمية Hierarchical Navigable Small World (HNSW) فقط بالإبلاغ عن حجم فهرس المتجهات في مدخل Microsoft Azure. إذا كان الفهرس يستخدم KNN شاملا، يتم الإبلاغ عن حجم فهرس المتجهات على أنه صفر، على الرغم من أن الفهرس يحتوي على خطوط متجهة.
كيف أعمل تمكين البحث المتجه على فهرس بحث؟
لتمكين البحث عن المتجهات في فهرس، يجب عليك:
إضافة حقل متجه واحد أو أكثر إلى مجموعة حقول.
أضف قسم "vectorSearch" إلى مخطط الفهرس الذي يحدد التكوين المستخدم بواسطة حقول البحث في المتجهات، بما في ذلك معلمات خوارزمية التقريبي الأقرب إلى الجوار المستخدمة، مثل HNSW.
استخدم أحدث إصدار مستقر، 2024-07-01، أو Azure SDK لإنشاء الفهرس وتحميل المستندات وإصدار الاستعلامات أو تحديثها. لمزيد من المعلومات، راجع إنشاء فهرس متجه.
الاستعلامات
أين يحدث تنفيذ الاستعلام؟
يتم تنفيذ الاستعلامات عبر فهرس بحث واحد مستضاف على خدمة البحث. لا يمكنك الانضمام إلى فهارس متعددة للبحث في المحتوى في فهرسين أو أكثر، ولكن يمكنك الاستعلام عن فهارس الاسم نفسه في خدمات بحث متعددة.
لماذا لا توجد أي تطابقات على المصطلحات التي أعرف أنها صالحة؟
الحالة الأكثر شيوعا هي عدم معرفة أن كل نوع استعلام يدعم سلوكيات البحث المختلفة ومستويات التحليلات اللغوية. يتضمن البحث عن النص الكامل، وهو حمل العمل السائد، مرحلة تحليل اللغة التي تقسم المصطلحات إلى أشكال جذرية. يؤدي هذا الجانب من تحليل الاستعلام إلى تحويل شبكة أوسع على التطابقات المحتملة، لأن المصطلح المميز يطابق عددا أكبر من المتغيرات.
ومع ذلك، لا يتم تحليل استعلامات أحرف البدل وغير الغامضة و regex مثل استعلامات المصطلح أو العبارة العادية ويمكن أن تؤدي إلى استدعاء ضعيف إذا كان الاستعلام لا يتطابق مع نموذج الكلمة التي تم تحليلها في فهرس البحث. لمزيد من المعلومات حول تحليل الاستعلام وتحليله، راجع بنية الاستعلام.
لماذا تكون عمليات البحث عن أحرف البدل بطيئة؟
تتم إعادة كتابة معظم استعلامات البحث عن أحرف البدل، مثل البادئة وغير الواضحة و regex، داخليا باستخدام مصطلحات مطابقة في فهرس البحث. تضيف هذه المعالجة الإضافية إلى زمن الانتقال. علاوة على ذلك، من المحتمل إعادة كتابة استعلامات البحث الواسعة، مثل a*
، مع العديد من المصطلحات، والتي يمكن أن تكون بطيئة. بالنسبة لعمليات البحث عن أحرف البدل ذات الأداء، ضع في اعتبارك تحديد محلل مخصص.
هل يمكنني البحث عبر فهارس متعددة؟
لا، يتم دائما تحديد نطاق الاستعلام إلى فهرس واحد.
لماذا درجة البحث ثابتة 1.0 لكل تطابق؟
يتم إنشاء درجات البحث لاستعلامات البحث عن النص الكامل، استنادا إلى الخصائص الإحصائية للمصطلحات المطابقة، ويتم ترتيبها من أعلى إلى منخفض في مجموعة النتائج. لا يتم تصنيف أنواع الاستعلامات التي ليست بحث نص كامل (حرف بدل، بادئة، regex) حسب درجة الصلة. فهذا السلوك حسب التصميم. تسمح النتيجة الثابتة بتضمين التطابقات التي تم العثور عليها من خلال توسيع الاستعلام في النتائج، دون التأثير على الترتيب.
على سبيل المثال، افترض أن إدخال "جولة*" في بحث أحرف البدل ينتج تطابقات على "الجولات" و"الجولات" و"الجولات السياحية". نظرا لطبيعة هذه النتائج، لا توجد طريقة للاستدلال بشكل معقول على المصطلحات الأكثر قيمة من غيرها. لهذا السبب، يتم تجاهل ترددات المصطلح عند تسجيل النتائج في استعلامات أنواع حرف البدل والبادئة و regex. يتم إعطاء نتائج البحث المستندة إلى إدخال جزئي درجة ثابتة لتجنب التحيز نحو التطابقات غير المتوقعة المحتملة.
الأمان
أين يخزن Azure الذكاء الاصطناعي Search بيانات العملاء؟
يقوم بتخزين بياناتك في الجغرافيا (الجغرافية) حيث يتم نشر خدمتك. قد تقوم Microsoft بنسخ بياناتك نسخا متماثلا داخل نفس الموقع الجغرافي للحصول على قابلية وصول عالية ومتانة. لمزيد من المعلومات، راجع موقع البيانات في Azure.
هل يرسل Azure الذكاء الاصطناعي Search بيانات العميل إلى خدمات أخرى للمعالجة؟
نعم، تقوم المهارات والموجهات بإجراء مكالمات صادرة من Azure الذكاء الاصطناعي Search إلى موارد Azure الأخرى أو النماذج الخارجية التي تحددها للتضمين أو الدردشة. تحتوي الاستدعاءات إلى واجهات برمجة التطبيقات هذه عادة على محتوى أولي تتم معالجته أو الاستعلامات الموجهة بواسطة نموذج تضمين. بالنسبة لاتصالات Azure إلى Azure، ترسل الخدمة طلبات عبر الشبكة الداخلية. إذا قمت بإضافة مهارة مخصصة أو متجه، يرسل المفهرس المحتوى إلى URI المتوفر في المهارة المخصصة عبر الشبكة العامة ما لم تقم بتكوين ارتباط خاص مشترك.
هل يعالج Azure الذكاء الاصطناعي Search بيانات العملاء في مناطق أخرى؟
يتم تنفيذ المعالجة (التوجيه أو تحويلات الذكاء الاصطناعي المطبقة) في Geo الذي يستضيف خدمات Azure الذكاء الاصطناعي المستخدمة بواسطة المهارات، أو تطبيقات أو وظائف Azure التي تستضيف مهارات مخصصة، أو منطقة Azure OpenAI أو Azure الذكاء الاصطناعي Foundry التي تستضيف نماذجك المنشورة. يتم تحديد هذه الموارد من قبلك، بحيث يمكنك اختيار ما إذا كنت تريد نشرها في نفس الموقع الجغرافي كخدمة البحث أم لا.
إذا قمت بإرسال البيانات إلى نماذج أو خدمات خارجية (غير Azure)، يتم تحديد موقع المعالجة بواسطة الخدمة الخارجية.
هل يمكنني التحكم في الوصول إلى نتائج البحث استنادا إلى هوية المستخدم؟
يمكنك إذا قمت بتنفيذ حل يربط المستندات بهوية مستخدم. عادة ما يكون المستخدمون المخولون بتشغيل تطبيقك مخولين أيضا برؤية جميع نتائج البحث. لا يحتوي Azure الذكاء الاصطناعي Search على دعم مضمن للأذونات على مستوى الصف أو على مستوى المستند، ولكن يمكنك تنفيذ عوامل تصفية الأمان كحل بديل. للحصول على الخطوات والبرامج النصية، راجع بدء استخدام نموذج دردشة مؤسسة Python باستخدام RAG.
هل يمكنني التحكم في الوصول إلى العمليات استنادا إلى هوية المستخدم؟
نعم، يمكنك استخدام التخويل المستند إلى الدور لعمليات مستوى البيانات عبر المحتوى.
هل يمكنني استخدام مدخل Microsoft Azure لعرض محتوى البحث وإدارته إذا كانت خدمة البحث خلف جدار حماية IP أو نقطة نهاية خاصة؟
يمكنك استخدام مدخل Microsoft Azure على خدمة بحث محمية بالشبكة إذا قمت بإنشاء استثناء شبكة يسمح للعميل والمدخل بالوصول. لمزيد من المعلومات، راجع الاتصال من خلال جدار حماية IP أو الاتصال من خلال نقطة نهاية خاصة.
الخطوات التالية
إذا لم تتم الإجابة على سؤالك هنا، يمكنك الرجوع إلى المصادر التالية للحصول على المزيد من الأسئلة والأجوبة.
تجاوز مكدس الذاكرة المؤقتة: Azure الذكاء الاصطناعي Search
كيفية عمل البحث الكامل عن النص في Azure الذكاء الاصطناعي Search
ما هو Azure الذكاء الاصطناعي Search؟