التشغيل السريع: إنشاء فهرس بحث في مدخل Azure

في التشغيل السريع ل Azure الذكاء الاصطناعي Search، أنشئ فهرس البحث الأول باستخدام معالج استيراد البيانات ومصدر بيانات نموذجي مضمن يتكون من بيانات فندق وهمية تستضيفها Microsoft. يرشدك المعالج خلال إنشاء فهرس بحث بدون تعليمات برمجية لمساعدتك في كتابة استعلامات مثيرة للاهتمام في غضون دقائق.

ينشئ المعالج كائنات متعددة على خدمة البحث - فهرس قابل للبحث - ولكن أيضا مفهرس واتصال مصدر بيانات لاسترداد البيانات تلقائيا. في نهاية هذا التشغيل السريع، نراجع كل كائن.

إشعار

يتضمن معالج استيراد البيانات خيارات التعرف البصري على الحروف وترجمة النص وإثراء الذكاء الاصطناعي الأخرى غير المشمولة في هذا التشغيل السريع. للحصول على معاينة مماثلة تركز على الذكاء الاصطناعي المطبقة، راجع التشغيل السريع: إنشاء مجموعة مهارات في مدخل Microsoft Azure.

المتطلبات الأساسية

بالنسبة إلى هذا التشغيل السريع، الذي يستخدم بيانات العينة المضمنة، تأكد من عدم وجود عناصر تحكم في الوصول إلى الشبكة في خدمة البحث. تستخدم وحدة تحكم المدخل نقطة النهاية العامة لاسترداد البيانات وبيانات التعريف من نموذج مصدر البيانات المضمن الذي تستضيفه Microsoft. لمزيد من المعلومات، راجع تأمين الاتصالات في معالجات الاستيراد.

التحقق من وجود مساحة

يبدأ العديد من العملاء بالخدمة المجانية. يقتصر المستوى الحر على ثلاثة فهارس وثلاثة مصادر للبيانات وثلاثة مفهرسات. تأكد من أن لديك مساحة للعناصر الإضافية قبل أن تبدأ. ينشئ هذا التشغيل السريع أحد كل كائن.

تحقق من علامة التبويب استخدام النظرة العامة > للخدمة لمعرفة عدد الفهارس والمفهرسات ومصادر البيانات الموجودة لديك بالفعل.

لقطة شاشة لصفحة نظرة عامة لمثيل Azure الذكاء الاصطناعي خدمة البحث في مدخل Microsoft Azure، تعرض عدد الفهارس والمفهرسات ومصادر البيانات.

بدء تشغيل المعالج

  1. سجل الدخول إلى مدخل Microsoft Azure باستخدام حساب Azure الخاص بك، وانتقل إلى Azure الذكاء الاصطناعي خدمة البحث.

  2. في صفحة Overview ، حدد Import data لبدء تشغيل المعالج.

    لقطة شاشة توضح كيفية فتح معالج استيراد البيانات في مدخل Microsoft Azure.

إنشاء فهرس وتحميله

في هذا القسم، قم بإنشاء فهرس وتحميله في أربع خطوات.

الاتصال بمصدر البيانات

ينشئ المعالج اتصال مصدر بيانات لعينة من البيانات التي تستضيفها Microsoft على Azure Cosmos DB. يتم استرداد البيانات النموذجية هذه التي يتم الوصول إليها عبر نقطة نهاية عامة. لا تحتاج إلى حساب Azure Cosmos DB الخاص بك أو ملفات المصدر لتشغيل هذا التشغيل السريع.

  1. في الاتصال ببياناتك، قم بتوسيع القائمة المنسدلة مصدر البيانات وحدد عينات.

  2. في قائمة العينات المضمنة، حدد hotels-sample.

    لقطة شاشة توضح كيفية تحديد مصدر بيانات نموذج الفنادق في معالج استيراد البيانات.

  3. حدد التالي: إضافة المهارات المعرفية (اختياري) للمتابعة.

تخطي التكوين للمهارات المعرفية

يدعم معالج استيراد البيانات إنشاء مجموعة مهارات وإثراء الذكاء الاصطناعي في الفهرسة.

  1. بالنسبة لهذا التشغيل السريع، تجاهل خيارات تكوين الإثراء الذكاء الاصطناعي في علامة التبويب Add cognitive skills .

  2. حدد تخطي إلى: تخصيص الفهرس الهدف للمتابعة.

    لقطة شاشة توضح كيفية التخطي إلى علامة التبويب تخصيص الفهرس الهدف في معالج استيراد البيانات.

تلميح

هل أنت مهتم بالإثراء الذكاء الاصطناعي؟ جرب هذا التشغيل السريع: إنشاء مجموعة مهارات في مدخل Microsoft Azure

تكوين الفهرس

يستنتج المعالج مخططا لمؤشر نموذج الفنادق المضمن. اتبع هذه الخطوات لتكوين الفهرس:

  1. اقبل القيم التي أنشأها النظام لاسم الفهرس (hotels-sample-index) وحقل المفتاح (HotelId).

  2. اقبل القيم التي أنشأها النظام لكافة سمات الحقول.

  3. حدد التالي: إنشاء مفهرس للمتابعة.

لقطة شاشة تعرض تعريف الفهرس الذي تم إنشاؤه لمصدر بيانات نموذج الفنادق في معالج استيراد البيانات.

كحد أدنى، يتطلب الفهرس اسم فهرس ومجموعة من الحقول. يجب وضع علامة على حقل واحد كمفتاح مستند لتعريف كل مستند بشكل فريد. القيمة هي دائما سلسلة. يقوم المعالج بالفحص بحثا عن حقول سلسلة فريدة ويختار حقلا للمفتاح.

يحتوي كل حقل على اسم ونوع بيانات وسمات تتحكم في كيفية استخدام الحقل في فهرس البحث. تمكن خانات الاختيار السمات التالية أو تعطلها:

  • قابل للاسترداد: الحقول التي تم إرجاعها في استجابة استعلام.
  • قابل للتصفية: الحقول التي تقبل تعبير عامل تصفية.
  • قابل للفرز: الحقول التي تقبل تعبير orderby.
  • Facetable: الحقول المستخدمة في بنية تنقل ذات واجهة.
  • قابل للبحث: الحقول المستخدمة في البحث عن النص الكامل. سلاسل قابلة للبحث. غالبًا ما يتم تحديد الحقول الرقمية والحقول المنطقية على أنها حقول غير قابلة للبحث.

يتم إسناد السلاسل على أنها قابلة للاسترداد وقابلة للبحث. تنسب الأعداد الصحيحة على أنها قابلة للاسترداد، وقابلة للتصفية، وقابلة للفرز، وقابلة للواجهة.

تؤثر السمات على التخزين. تستهلك الحقول القابلة للتصفية مساحة تخزين إضافية، ولكن لا تستهلك القابلة للاسترداد . لمزيد من المعلومات، راجع مثال يوضح الآثار المترتبة على التخزين للسمات والمقترحين.

إذا كنت تريد الإكمال التلقائي أو الاستعلامات المقترحة، فحدد محللات اللغة أو المقترحات.

تكوين المفهرس وتشغيله

تقوم الخطوة الأخيرة بتكوين المفهرس وتشغيله. يعرف هذا الكائن عملية قابلة للتنفيذ. يتم إنشاء مصدر البيانات والفهرس والمفهرس في هذه الخطوة.

  1. اقبل القيمة التي أنشأها النظام لاسم المفهرس (hotels-sample-indexer).

  2. لهذا التشغيل السريع، استخدم الخيار الافتراضي لتشغيل المفهرس مرة واحدة، على الفور. البيانات المستضافة ثابتة لذلك لا يتم تمكين تعقب التغييرات لها.

  3. حدد إرسال لإنشاء المفهرس وتشغيله في وقت واحد.

    لقطة شاشة توضح كيفية تكوين المفهرس لمصدر بيانات نموذج الفنادق في معالج استيراد البيانات.

مراقبة تقدم المفهرس

يمكنك مراقبة إنشاء المفهرس أو الفهرس في المدخل. توفر صفحة نظرة عامة على الخدمة ارتباطات إلى الموارد التي تم إنشاؤها في الذكاء الاصطناعي خدمة البحث Azure.

  1. على اليسار، حدد Indexers.

    لقطة شاشة توضح إنشاء المفهرس قيد التقدم في مدخل Microsoft Azure.

    قد يستغرق تحديث نتائج الصفحة في مدخل Microsoft Azure بضع دقائق. يجب أن تشاهد المفهرس الذي تم إنشاؤه حديثا في القائمة بحالة قيد التقدم أو Success. تعرض القائمة أيضا عدد المستندات المفهرسة.

التحقق من نتائج فهرس البحث

  1. على اليسار، حدد فهارس.

  2. حدد hotels-sample-index.

    انتظر حتى يتم تحديث صفحة مدخل Microsoft Azure. يجب أن تشاهد الفهرس مع عدد المستندات وحجم التخزين.

    لقطة شاشة لقائمة الفهارس على لوحة معلومات Azure الذكاء الاصطناعي خدمة البحث في مدخل Microsoft Azure.

  3. حدد علامة التبويب Fields لعرض مخطط الفهرس.

    تحقق لمعرفة الحقول القابلة للتصفية أو الفرز بحيث تعرف الاستعلامات التي يجب كتابتها.

    لقطة شاشة تعرض تعريف المخطط لفهرس في الذكاء الاصطناعي خدمة البحث Azure في مدخل Microsoft Azure.

إضافة حقول أو تغييرها

في علامة التبويب حقول ، يمكنك إنشاء حقل جديد باستخدام إضافة حقل باسم ونوع بيانات معتمد وإسنادات.

من الصعب تغيير الحقول الموجودة. الحقول الموجودة لها تمثيل فعلي في الفهرس بحيث لا تكون قابلة للتعديل، ولا حتى في التعليمات البرمجية. لتغيير حقل موجود بشكل أساسي، تحتاج إلى إنشاء حقل جديد يحل محل الحقل الأصلي. يمكن إضافة بنيات أخرى، مثل ملفات تعريف النقاط وخيارات CORS، إلى فهرس في أي وقت.

لفهم ما يمكنك تحريره وما لا يمكنك تحريره بوضوح أثناء تصميم الفهرس، خذ دقيقة لعرض خيارات تعريف الفهرس. تشير الخيارات الرمادية في قائمة الحقول إلى القيم التي لا يمكن تعديلها أو حذفها.

الاستعلام باستخدام مستكشف Search

لديك الآن فهرس بحث يمكن الاستعلام فيه باستخدام مستكشف البحث. يرسل مستكشف البحث استدعاءات REST التي تتوافق مع Search POST REST API. تدعم الأداة بناء جملة استعلام بسيط وبناء جملة استعلام Lucene الكامل.

  1. في علامة التبويب مستكشف البحث، أدخل نصا للبحث فيه.

    لقطة شاشة توضح كيفية إدخال استعلام وتشغيله في أداة Search Explorer.

  2. استخدم الخريطة المصغرة للانتقال بسرعة إلى مناطق غير مرئية من الإخراج.

    لقطة شاشة تعرض نتائج طويلة لاستعلام في أداة Search Explorer والخريطة المصغرة.

  3. لتحديد بناء الجملة، قم بالتبديل إلى طريقة عرض JSON.

    لقطة شاشة لمحدد طريقة عرض JSON.

مثال على استعلامات لفهرس عينة الفنادق

تفترض الأمثلة التالية طريقة عرض JSON وإصدار واجهة برمجة تطبيقات REST 2024-05-01-preview.

تلميح

تدعم طريقة عرض JSON الآن intellisense لإكمال اسم المعلمة. ضع المؤشر داخل طريقة عرض JSON واكتب حرف مسافة لإظهار قائمة بجميع معلمات الاستعلام، أو اكتب حرفا واحدا مثل "s" لإظهار معلمات الاستعلام فقط بدءا من "s". لا يستبعد Intellisense المعلمات غير الصالحة، لذا استخدم أفضل تقدير.

أمثلة التصفية

يمكن تصفية مواقف السيارات والعلامات وتاريخ التجديد والتصنيف والموقع.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

تفترض عوامل التصفية المنطقية "صواب" بشكل افتراضي.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

يستند البحث الجغرافي المكاني إلى عامل تصفية. تقوم geo.distance الدالة بتصفية جميع النتائج للبيانات الموضعية استنادا إلى الإحداثيات و geography'POINT المحددةLocation. يبحث الاستعلام عن الفنادق التي تقع على بعد 5 كيلومترات من إحداثيات -122.12 47.67خط الطول العرضي ، وهي "ريدموند، واشنطن، الولايات المتحدة الأمريكية". يعرض الاستعلام العدد الإجمالي للمطابقات &$count=true مع أسماء الفنادق ومواقع العناوين.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

أمثلة على بناء جملة Lucene الكامل

بناء الجملة الافتراضي هو بناء جملة بسيط، ولكن إذا كنت تريد البحث الغامض أو تعزيز المصطلح أو التعبيرات العادية، فحدد بناء الجملة الكامل.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

بشكل افتراضي، تفشل مصطلحات الاستعلام التي بها أخطاء إملائية Seattle مثل seatle إرجاع التطابقات في بحث نموذجي. queryType=full تستدعي المعلمة محلل استعلام Lucene الكامل، والذي يدعم معامل tilde~. عند وجود هذه المعلمات، يقوم الاستعلام بإجراء بحث غامض عن الكلمة الأساسية المحددة. يبحث الاستعلام عن نتائج مطابقة مع نتائج مشابهة للكلمة الأساسية ولكنها ليست مطابقة تماما لها.

خذ دقيقة لتجربة بعض هذه الاستعلامات النموذجية للفهرس الخاص بك. لمعرفة المزيد حول الاستعلامات، راجع الاستعلام في Azure الذكاء الاصطناعي Search.

تنظيف الموارد

عند العمل في اشتراكك الخاص، من الجيد في نهاية المشروع تحديد ما إذا كنت لا تزال بحاجة إلى الموارد التي أنشأتها. الموارد المتبقية قيد التشغيل يمكن أن تكلفك المال. يمكنك حذف الموارد بشكل فردي أو حذف مجموعة الموارد لحذف تشكيلة الموارد بأكملها.

يمكنك العثور على الموارد وإدارتها للخدمة في مدخل Microsoft Azure ضمن All resources أو Resource groups في الجزء الأيمن.

إذا كنت تستخدم خدمة مجانية، فتذكر أن الحد هو ثلاثة فهارس ومفهرسات ومصادر بيانات. يمكنك حذف العناصر الفردية في مدخل Microsoft Azure للبقاء تحت الحد.

الخطوات التالية

جرب معالج مدخل Microsoft Azure لإنشاء تطبيق ويب جاهز للاستخدام يتم تشغيله في مستعرض. استخدم هذا المعالج على الفهرس الصغير الذي أنشأته في هذا التشغيل السريع، أو استخدم إحدى مجموعات البيانات النموذجية المضمنة للحصول على تجربة بحث أكثر ثراء.