ميزات Azure الذكاء الاصطناعي Search

يوفر Azure الذكاء الاصطناعي Search استرداد المعلومات ويستخدم تكاملا اختياريا الذكاء الاصطناعي لاستخراج المزيد من محتوى النص والبنية.

يلخص الجدول التالي الميزات حسب الفئة. لمزيد من المعلومات حول كيفية مقارنة Azure الذكاء الاصطناعي Search بتقنيات البحث الأخرى، راجع مقارنة خيارات البحث.

هناك تماثل للميزات في جميع السحب العامة والخاصة والسيادية في Azure، ولكن بعض الميزات غير مدعومة في مناطق محددة. لمزيد من المعلومات، راجع توفر المنتج حسب المنطقة.

إشعار

هل تبحث عن ميزات المعاينة؟ راجع قائمة ميزات المعاينة.

ميزات الفهرسة

الفئه الميزات
مصادر البيانات يمكن أن تقبل فهارس البحث النص من أي مصدر، شريطة إرساله كمستند JSON.

المفهرسات هي ميزة تعمل على أتمتة استيراد البيانات من مصادر البيانات المدعومة لاستخراج المحتوى القابل للبحث في مخازن البيانات الأساسية. تتعامل المفهرسات مع تسلسل JSON نيابة عنك ومعظمها يدعم شكلا من أشكال الكشف عن التغيير والحذف. يمكنك الاتصال بمجموعة متنوعة من مصادر البيانات، بما في ذلك Azure SQL Database أو Azure Cosmos DB أو تخزين Azure Blob.
بنيات البيانات الهرمية والمتداخلة تسمح لك الأنواع والمجموعات المعقدة بنمذجة أي نوع من بنية JSON تقريبا داخل فهرس البحث. يمكن التعبير عن العلاقة الأساسية من واحد إلى متعدد ومن متعدد إلى متعدد في الأصل من خلال المجموعات والأنواع المعقدة والمجموعات من الأنواع المعقدة.
التحليل اللغوي المحللات هي مكونات تستخدم لمعالجة النص أثناء عمليات الفهرسة والبحث. بشكل افتراضي، يمكنك استخدام محلل Lucene القياسي للأغراض العامة، أو تجاوز الافتراضي باستخدام محلل لغة أو محلل مخصص تقوم بتكوينه أو محلل آخر معرف مسبقا ينتج رموزا مميزة بالتنسيق الذي تحتاج إليه.

يتم استخدام محللات اللغة من Lucene أو Microsoft للتعامل بذكاء مع اللغويات الخاصة باللغة بما في ذلك صيغ الفعل والجنس والأسم غير المنتظم للتعدد (على سبيل المثال، "الماوس" مقابل "الماوس")، وإزالة التكديس للكلمة، وكسر الكلمات (للغات التي لا تحتوي على مسافات)، والمزيد.

يتم استخدام المحللات المعجمية المخصصة لنماذج الاستعلام المعقدة مثل المطابقة الصوتية والتعبيرات العادية.

الفئه الميزات
فهرسة المُتجهات ضمن فهرس البحث، أضف حقول المتجهات لدعم سيناريوهات البحث عن المتجهات. يمكن أن تتعايش حقول المتجهات مع الحقول غير الوسيطة في نفس مستند البحث.
استعلامات المتجهات صياغة استعلامات متجه واحد ومتعددة.
خوارزميات البحث عن المتجهات استخدم Hierarchical Navigable Small World (HNSW) أو شامل K-Nearest Neighbors (KNN) للعثور على خطوط متجهة مماثلة في فهرس البحث.
عوامل تصفية المتجهات تطبيق عوامل التصفية قبل تنفيذ الاستعلام أو بعده لمزيد من الدقة أثناء استرداد المعلومات.
استرداد المعلومات المختلطة ابحث عن المفاهيم والكلمات الأساسية في طلب استعلام مختلط واحد.

يدمج البحث المختلط البحث في الخطوط المتجهة والنص، مع تحديد مرتبة دلالية اختيارية وضبط الصلة للحصول على أفضل النتائج.
تجميع البيانات المتكاملة وتعميمها (معاينة) تقسيم البيانات الأصلية من خلال مهارة تقسيم النص والتحجيم الأصلي من خلال المتجهات ومهارة AzureOpenAIEmbeddingModel.

يوفر التوجيه المتكامل (معاينة) مسار فهرسة شامل من الملفات المصدر إلى الاستعلامات.
ضغط المتجهات المتكاملة والتكميم استخدم التكميم العددي المضمن لتقليل حجم فهرس المتجهات في الذاكرة وعلى القرص. يمكنك أيضا التخلي عن تخزين المتجهات التي لا تحتاج إليها، أو تعيين أنواع بيانات ضيقة لحقول المتجهات لتقليل متطلبات التخزين.
استيراد البيانات واتجاهها (معاينة) معالج جديد في مدخل Microsoft Azure يقوم بإنشاء مسار فهرسة كامل يتضمن تقسيم البيانات وخطوط المتجهات. ينشئ المعالج كافة الكائنات وإعدادات التكوين.

الذكاء الاصطناعي الإثراء والتنقيب عن المعرفة

الفئه الميزات
الذكاء الاصطناعي المعالجة أثناء الفهرسة يشير الإثراء الذكاء الاصطناعي إلى معالجة الصورة المضمنة واللغة الطبيعية في مسار المفهرس الذي يستخرج النص والمعلومات من المحتوى الذي لا يمكن فهرسته بخلاف ذلك للبحث في النص الكامل. يتم تحقيق الذكاء الاصطناعي المعالجة عن طريق إضافة المهارات والجمع بينها في مجموعة المهارات، والتي يتم إرفاقها بعد ذلك بمفهرس. يمكن أن تكون الذكاء الاصطناعي إما مهارات مضمنة من Microsoft، مثل الترجمة النصية أو التعرف البصري على الحروف (OCR)، أو المهارات المخصصة التي تقدمها.
تخزين المحتوى المخصب للتحليل والاستهلاك في سيناريوهات غير البحث مخزن المعرفة هو تخزين مستمر للمحتوى الذي تم إثرائه، مخصص لسيناريوهات غير البحث مثل استخراج المعرفة ومعالجة علوم البيانات. يتم تعريف مخزن المعرفة في مجموعة مهارات، ولكن يتم إنشاؤه في Azure Storage كعناصر أو مجموعات صفوف جدولية.
عمليات الإثراء المخزنة مؤقتا يشير الإثراء التزايدي (معاينة) إلى عمليات الإثراء المخزنة مؤقتا التي يمكن إعادة استخدامها أثناء تنفيذ مجموعة المهارات. التخزين المؤقت ذو قيمة خاصة في مجموعات المهارات التي تتضمن التعرف البصري على الحروف وتحليل الصور، والتي تكون معالجتها مكلفة.

تجربة الاستعلام والمستخدم

الفئه الميزات
بحث نصي حر البحث عن النص الكامل هو حالة استخدام أساسية لمعظم التطبيقات المستندة إلى البحث. يمكن صياغة الاستعلامات باستخدام بناء جملة معتمد.

يوفر بناء جملة الاستعلام البسيط عوامل تشغيل منطقية، وعوامل تشغيل بحث العبارة، وعوامل تشغيل اللاحقة، وعوامل تشغيل الأسبقية.

يتضمن بناء جملة استعلام Lucene الكامل جميع العمليات في بناء جملة بسيط، مع ملحقات للبحث الغامض والبحث عن التقارب وتعزيز المصطلح والتعبيرات العادية.
الصلة تسجيل النقاط البسيط هو فائدة رئيسية من Azure الذكاء الاصطناعي Search. تستخدم ملفات تعريف تسجيل النقاط لنمذجة الصلة كدالة للقيم في المستندات نفسها. على سبيل المثال، قد ترغب في ظهور منتجات أحدث أو منتجات مخفضة أعلى في نتائج البحث. يمكنك أيضا إنشاء ملفات تعريف تسجيل النقاط باستخدام علامات لتسجيل النقاط المخصص استنادا إلى تفضيلات بحث العملاء التي قمت بتعقبها وتخزينها بشكل منفصل.

Ranker الدلالي هو ميزة متميزة تعيد تجميع النتائج استنادا إلى الصلة الدلالية بالاستعلام. اعتمادا على المحتوى والسيناريو الخاص بك، يمكنه تحسين صلة البحث بشكل كبير بأقل قدر من التكوين أو الجهد تقريبا.
البحث الجيوفضائي تعمل الوظائف الجغرافية المكانية على التصفية وتتطابق مع الإحداثيات الجغرافية. يمكنك المطابقة على المسافة أو عن طريق التضمين في شكل مضلع.
عوامل التصفية والواجهات يتم تمكين التنقل بين الواجهات من خلال معلمة استعلام واحدة. يقوم Azure الذكاء الاصطناعي Search بإرجاع بنية تنقل ذات واجهة يمكنك استخدامها كتعلم برمجي خلف قائمة فئات، للتصفية ذاتية التوجيه (على سبيل المثال، لتصفية عناصر الكتالوج حسب نطاق السعر أو العلامة التجارية).

يمكن استخدام عوامل التصفية لدمج التنقل متعدد الواجهات في واجهة مستخدم التطبيق الخاص بك، وتحسين صياغة الاستعلام، والتصفية استنادا إلى معايير محددة من قبل المستخدم أو المطور. إنشاء عوامل تصفية باستخدام بناء جملة OData.
تجربة المستخدم يمكن تمكين الإكمال التلقائي للاستعلامات حول الكتابة في شريط البحث.

تعمل اقتراحات البحث أيضا خارج إدخالات النص الجزئي في شريط البحث، ولكن النتائج هي مستندات فعلية في الفهرس بدلا من مصطلحات الاستعلام.

تربط المرادفات المصطلحات المكافئة التي توسع ضمنيا نطاق الاستعلام، دون أن يضطر المستخدم إلى توفير المصطلحات البديلة.

يؤدي تمييز الضغط إلى تطبيق تنسيق النص على كلمة أساسية مطابقة في نتائج البحث. يمكنك اختيار الحقول التي ترجع القصاصات المميزة.

يتم تقديم الفرز لحقول متعددة عبر مخطط الفهرس ثم تبديله في وقت الاستعلام باستخدام معلمة بحث واحدة.

يعد ترحيل نتائج البحث وتقييدها أمرا سهلا مع عنصر التحكم المضبط بدقة الذي يوفره Azure الذكاء الاصطناعي Search على نتائج البحث.

ميزات الأمان

الفئه الميزات
تشفير البيانات يتم تضمين التشفير الثابت المدار من قبل Microsoft في طبقة التخزين الداخلية وهو غير قابل للإلغاء.

يمكن استخدام مفاتيح التشفير المدارة من قبل العميل التي تقوم بإنشائها وإدارتها في Azure Key Vault للتشفير التكميلي للفهارس وخرائط المرادفات. بالنسبة للخدمات التي تم إنشاؤها بعد 1 أغسطس 2020، يمتد تشفير CMK إلى البيانات الموجودة على الأقراص المؤقتة، للتشفير المزدوج الكامل للمحتوى المفهرس.
حماية نقطة النهاية تسمح لك قواعد IP لدعم جدار الحماية الوارد بإعداد نطاقات IP التي تقبل خدمة البحث الطلبات عبرها.

إنشاء نقطة نهاية خاصة باستخدام Azure Private Link لفرض جميع الطلبات من خلال شبكة ظاهرية.
الوصول الوارد يعين التحكم في الوصول المستند إلى الدور في Azure أدوارا للمستخدمين والمجموعات في معرف Microsoft Entra للوصول الخاضع للرقابة إلى محتوى البحث والعمليات. يمكنك أيضا استخدام المصادقة المستندة إلى المفتاح إذا لم يكن لديك مستأجر Azure.
الأمان الصادر (المفهرسات) يسمح الوصول إلى البيانات من خلال نقاط النهاية الخاصة للمفهرس بالاتصال بموارد Azure المحمية من خلال Azure Private Link.

يعني الوصول إلى البيانات باستخدام هوية موثوق بها أن سلسلة الاتصال إلى مصادر البيانات الخارجية يمكن أن تحذف أسماء المستخدمين وكلمات المرور. عندما يتصل المفهرس بمصدر البيانات، يسمح المورد بالاتصال إذا تم تسجيل خدمة البحث مسبقا كخدمة موثوق بها.

ميزات المدخل

الفئه الميزات
أدوات للنماذج الأولية والتفتيش إضافة فهرس هو مصمم فهرس في المدخل يمكنك استخدامه لإنشاء مخطط أساسي يتكون من الحقول المنسوبة وبعض الإعدادات الأخرى. بعد حفظ الفهرس، يمكنك تعبئته باستخدام SDK أو واجهة برمجة تطبيقات REST لتوفير البيانات.

يقوم معالج استيراد البيانات بإنشاء الفهارس والمفهرسات ومجموعات المهارات وتعريفات مصدر البيانات. إذا كانت بياناتك موجودة في Azure، يمكن أن يوفر لك هذا المعالج وقتا وجهقا كبيرا، خاصة للتحقيق والاستكشاف لإثبات المفهوم.

يستخدم مستكشف البحث لاختبار الاستعلامات وتحسين ملفات تعريف النقاط.

يتم استخدام إنشاء تطبيق تجريبي لإنشاء صفحة HTML يمكن استخدامها لاختبار تجربة البحث.

Debug Sessions هو محرر مرئي يتيح لك تصحيح مجموعة المهارات بشكل تفاعلي. يظهر لك التبعيات والمخرجات والتحويلات.
الرصد والتشخيص تمكين ميزات المراقبة لتجاوز المقاييس في لمحة مرئية دائما في المدخل. يتم التقاط المقاييس على الاستعلامات في الثانية وزمن الانتقال والتقييد وإعداد تقارير عنها في صفحات المدخل دون الحاجة إلى تكوين إضافي.

قابلية البرمجة

الفئه الميزات
REST واجهة برمجة تطبيقات REST للخدمة مخصصة لعمليات مستوى البيانات، بما في ذلك جميع العمليات المتعلقة بالفهرسة والاستعلامات والإثراء الذكاء الاصطناعي. يمكنك أيضا استخدام مكتبة العميل هذه لاسترداد معلومات النظام والإحصائيات.

إدارة REST API هي لإنشاء الخدمة وتوفيرها من خلال Azure Resource Manager. يمكنك أيضا استخدام واجهة برمجة التطبيقات هذه لإدارة المفاتيح والسعة.
Azure SDK لـ .NET Azure.Search.Documents مخصص لعمليات مستوى البيانات، بما في ذلك جميع العمليات المتعلقة بالفهرسة والاستعلامات وإثراء الذكاء الاصطناعي. يمكنك أيضا استخدام مكتبة العميل هذه لاسترداد معلومات النظام والإحصائيات.

Microsoft.Azure.Management.Search هو لإنشاء الخدمة وتوفيرها من خلال Azure Resource Manager. يمكنك أيضا استخدام واجهة برمجة التطبيقات هذه لإدارة المفاتيح والسعة.
Azure SDK لـ Java com.azure.search.documents مخصص لعمليات مستوى البيانات، بما في ذلك جميع العمليات المتعلقة بالفهرسة والاستعلامات وإثراء الذكاء الاصطناعي. يمكنك أيضا استخدام مكتبة العميل هذه لاسترداد معلومات النظام والإحصائيات.

com.microsoft.azure.management.search هو لإنشاء الخدمة وتوفيرها من خلال Azure Resource Manager. يمكنك أيضا استخدام واجهة برمجة التطبيقات هذه لإدارة المفاتيح والسعة.
Azure SDK لـ Python azure-search-documents مخصص لعمليات مستوى البيانات، بما في ذلك جميع العمليات المتعلقة بالفهرسة والاستعلامات والإثراء الذكاء الاصطناعي. يمكنك أيضا استخدام مكتبة العميل هذه لاسترداد معلومات النظام والإحصائيات.

azure-mgmt-search هو لإنشاء الخدمة وتوفيرها من خلال Azure Resource Manager. يمكنك أيضا استخدام واجهة برمجة التطبيقات هذه لإدارة المفاتيح والسعة.
Azure SDK ل JavaScript/TypeScript azure/search-documents مخصص لعمليات مستوى البيانات، بما في ذلك جميع العمليات المتعلقة بالفهرسة والاستعلامات والإثراء الذكاء الاصطناعي. يمكنك أيضا استخدام مكتبة العميل هذه لاسترداد معلومات النظام والإحصائيات.

azure/arm-search هو لإنشاء الخدمة وتوفيرها من خلال Azure Resource Manager. يمكنك أيضا استخدام واجهة برمجة التطبيقات هذه لإدارة المفاتيح والسعة.

(راجع أيضًا )