إرجاع إجابة دلالية في Azure الذكاء الاصطناعي Search

عند استدعاء الترتيب الدلالي والتسميات التوضيحية، يمكنك بشكل اختياري استخراج المحتوى من المستندات الأكثر مطابقة التي "تجيب" على الاستعلام مباشرة. يمكن تضمين إجابة واحدة أو أكثر في الاستجابة، والتي يمكنك عرضها بعد ذلك في صفحة بحث لتحسين تجربة المستخدم لتطبيقك.

الإجابة الدلالية هي محتوى حرفي في فهرس البحث الذي تعرف عليه نموذج فهم القراءة كإجابة للاستعلام الذي تم طرحه في الطلب. إنها ليست إجابة تم إنشاؤها. للحصول على إرشادات حول نموذج تفاعل المستخدم على نمط الدردشة الذي يستخدم الذكاء الاصطناعي التوليدية لإنشاء إجابات من المحتوى الخاص بك، راجع استرداد الجيل المعزز (RAG).

في هذه المقالة، تعرف على كيفية طلب إجابة دلالية، وتفكيك الاستجابة، ومعرفة خصائص المحتوى الأكثر ملاءمة لإنتاج إجابات عالية الجودة.

المتطلبات الأساسية

تنطبق جميع المتطلبات الأساسية التي تنطبق على الاستعلامات الدلالية أيضا على الإجابات، بما في ذلك مستوى الخدمة والمنطقة.

  • يجب أن يتضمن منطق الاستعلام معلمات الاستعلام الدلالي "queryType=semantic"، بالإضافة إلى معلمة "answers". تتم مناقشة المعلمات المطلوبة في هذه المقالة.

  • يجب أن تكون سلاسل الاستعلام التي أدخلها المستخدم قابلة للتعرف عليها كسؤال (ماذا، أين، متى، كيف).

  • يجب أن تحتوي مستندات البحث في الفهرس على نص له خصائص إجابة، ويجب أن يكون هذا النص موجودا في أحد الحقول المدرجة في التكوين الدلالي. على سبيل المثال، بالنظر إلى استعلام "ما هو جدول التجزئة"، إذا لم تحتوي أي من الحقول في التكوين الدلالي على مقاطع تتضمن "جدول التجزئة هو ..."، فمن غير المحتمل إرجاع إجابة.

إشعار

بدءا من 2021-04-30-Preview، في طلبات "semanticConfiguration" إنشاء أو تحديث الفهرس (معاينة)، مطلوب لتحديد حقول الإدخال للتصنيف الدلالي.

ما هي الإجابة الدلالية؟

الإجابة الدلالية هي بنية فرعية لاستجابة استعلام دلالي. يتكون من مقطع حرفي واحد أو أكثر من مستند بحث، تمت صياغته كإجابة على استعلام يبدو كسؤال. لإرجاع إجابة، يجب أن تكون العبارات أو الجمل موجودة في مستند بحث له خصائص اللغة للإجابة، ويجب طرح الاستعلام نفسه كسؤال.

يستخدم Azure الذكاء الاصطناعي Search نموذج فهم قراءة الجهاز للتعرف على أفضل إجابة واختيارها. ينتج النموذج مجموعة من الإجابات المحتملة من المحتوى المتوفر، وعندما يصل إلى مستوى ثقة عال بما فيه الكفاية، فإنه يقترح واحدة كإجابة.

يتم إرجاع الإجابات ككائن مستقل من المستوى الأعلى في حمولة استجابة الاستعلام التي يمكنك اختيار عرضها على صفحات البحث، إلى جانب نتائج البحث. من الناحية الهيكلية، إنه عنصر صفيف داخل الاستجابة يتكون من نص ومفتاح مستند ودرجة ثقة.

صياغة استعلام REST ل "إجابات"

لإرجاع إجابة دلالية، يجب أن يحتوي الاستعلام على المعلمات الدلالية "queryType""queryLanguage""semanticConfiguration"و"answers". لا يضمن تحديد هذه المعلمات إجابة، ولكن يجب أن يتضمنها الطلب حتى تحدث معالجة الإجابات.

{
    "search": "how do clouds form",
    "queryType": "semantic",
    "queryLanguage": "en-us",
    "semanticConfiguration": "my-semantic-config",
    "answers": "extractive|count-3",
    "captions": "extractive|highlight-true",
    "count": "true"
}
  • يجب ألا تكون سلسلة الاستعلام خالية ويجب صياغتها كسؤال.

  • "queryType" يجب تعيين إلى "دلالي.

  • "queryLanguage"يجب أن تكون إحدى القيم من قائمة اللغات المدعومة (REST API).

  • "semanticConfiguration" يحدد حقول السلسلة التي توفر رموزا مميزة لنموذج الاستخراج. تنتج الحقول نفسها التي تنتج التسميات التوضيحية أيضا إجابات. راجع إنشاء تكوين دلالي للحصول على التفاصيل.

  • بالنسبة إلى "answers"، فإن بناء المعلمة هو "answers": "extractive"، حيث يكون العدد الافتراضي للإجابات التي تم إرجاعها واحدا. يمكنك زيادة عدد الإجابات عن طريق إضافة count كما هو موضح في المثال أعلاه، بحد أقصى 10. يعتمد ما إذا كنت بحاجة إلى أكثر من إجابة واحدة على تجربة المستخدم لتطبيقك وكيفية عرض النتائج.

فك حزمة "إجابة" من الاستجابة

يتم توفير الإجابات في "@search.answers" الصفيف، الذي يظهر أولا في استجابة الاستعلام. تتضمن كل إجابة في الصفيف ما يلي:

  • مفتاح المستند
  • نص أو محتوى الإجابة، أو في نص عادي أو بتنسيق
  • درجة الثقة

إذا كانت الإجابة غير محددة، تظهر الاستجابة ك "@search.answers": []. يتبع صفيف الإجابات صفيف القيمة، وهو الاستجابة القياسية في استعلام دلالي.

نظرا للاستعلام "كيف تتشكل السحب"، يوضح المثال التالي إجابة:

{
    "@search.answers": [
        {
            "key": "4123",
            "text": "Sunlight heats the land all day, warming that moist air and causing it to rise high into the   atmosphere until it cools and condenses into water droplets. Clouds generally form where air is ascending (over land in this case),   but not where it is descending (over the river).",
            "highlights": "Sunlight heats the land all day, warming that moist air and causing it to rise high into the   atmosphere until it cools and condenses into water droplets. Clouds generally form<em> where air is ascending</em> (over land in this case),   but not where it is<em> descending</em> (over the river).",
            "score": 0.94639826
        }
    ],
    "value": [
        {
            "@search.score": 0.5479723,
            "@search.rerankerScore": 1.0321671911515296,
            "@search.captions": [
                {
                    "text": "Like all clouds, it forms when the air reaches its dew point—the temperature at which an air mass is cool enough for its water vapor to condense into liquid droplets. This false-color image shows valley fog, which is common in the Pacific Northwest of North America.",
                    "highlights": "Like all<em> clouds</em>, it<em> forms</em> when the air reaches its dew point—the temperature at    which an air mass is cool enough for its water vapor to condense into liquid droplets. This false-color image shows valley<em> fog</em>, which is common in the Pacific Northwest of North America."
                }
            ],
            "title": "Earth Atmosphere",
            "content": "Fog is essentially a cloud lying on the ground. Like all clouds, it forms when the air reaches its dew point—the temperature at  \n\nwhich an air mass is cool enough for its water vapor to condense into liquid droplets.\n\nThis false-color image shows valley fog, which is common in the Pacific Northwest of North America. On clear winter nights, the \n\nground and overlying air cool off rapidly, especially at high elevations. Cold air is denser than warm air, and it sinks down into the \n\nvalleys. The moist air in the valleys gets chilled to its dew point, and fog forms. If undisturbed by winds, such fog may persist for \n\ndays. The Terra satellite captured this image of foggy valleys northeast of Vancouver in February 2010.\n\n\n",
            "locations": [
                "Pacific Northwest",
                "North America",
                "Vancouver"
            ]
        }
    ]
}

عند تصميم صفحة نتائج بحث تتضمن إجابات، تأكد من معالجة الحالات التي لم يتم العثور على الإجابات فيها.

ضمن @search.answers:

  • "المفتاح" هو مفتاح المستند أو معرف المطابقة. بالنظر إلى مفتاح المستند، يمكنك استخدام واجهة برمجة تطبيقات مستند البحث لاسترداد أي من أجزاء مستند البحث أو جميعها لتضمينها في صفحة البحث أو صفحة التفاصيل.

  • يوفر "النص" و "التمييزات" محتوى متطابقا، في كل من النص العادي ومع التمييزات.

    بشكل افتراضي، يتم تصميم التمييزات على أنها <em>، والتي يمكنك تجاوزها باستخدام معلمات highlightPreTag الحالية وتمييزPostTag. كما هو ملاحظ في مكان آخر، فإن جوهر الإجابة هو محتوى حرفي من مستند بحث. يبحث نموذج الاستخراج عن خصائص الإجابة للعثور على المحتوى المناسب، ولكنه لا يقوم بإنشاء لغة جديدة في الاستجابة.

  • "score" هي درجة ثقة تعكس قوة الإجابة. إذا كانت هناك إجابات متعددة في الاستجابة، يتم استخدام هذه النتيجة لتحديد الترتيب. يمكن اشتقاق أفضل الإجابات والتسميات التوضيحية العليا من مستندات بحث مختلفة، حيث تنشأ الإجابة العليا من مستند واحد، والتسمية التوضيحية العليا من مستند آخر، ولكن بشكل عام تظهر نفس المستندات في المواضع العليا داخل كل صفيف.

تتبع الإجابات صفيف "القيمة" ، الذي يتضمن دائما الدرجات والتسميات التوضيحية وأي حقول قابلة للاسترداد بشكل افتراضي. إذا حددت معلمة التحديد، فإن صفيف "القيمة" يقتصر على الحقول التي حددتها. راجع تكوين الترتيب الدلالي للحصول على التفاصيل.

تلميحات لإنتاج إجابات عالية الجودة

للحصول على أفضل النتائج، قم بإرجاع إجابات دلالية على مجموعة مستندات لها الخصائص التالية:

  • يجب أن يتضمن "التكوين الدلالي" حقولا توفر نصا كافيا يمكن العثور فيه على إجابة. يجب إدراج الحقول التي من المرجح أن تحتوي على إجابات أولا في "الحقول ذات الأولوية". يمكن أن يظهر النص الحرفي فقط من مستند كإجابة.

  • يجب ألا تكون سلاسل الاستعلام خالية (search=*) ويجب أن تحتوي السلسلة على خصائص سؤال، مثل "ما هو" أو "كيفية"، بدلا من البحث عن الكلمات الأساسية التي تتكون من مصطلحات أو عبارات بترتيب عشوائي. إذا لم تظهر سلسلة الاستعلام على أنها سؤال، يتم تخطي معالجة الإجابة، حتى إذا حدد الطلب "إجابات" كمعلمة استعلام.

  • الاستخراج الدلالي والتلخيص له حدود على عدد الرموز المميزة لكل مستند يمكن تحليلها في الوقت المناسب. من الناحية العملية، إذا كان لديك مستندات كبيرة تصل إلى مئات الصفحات، فحاول تقسيم المحتوى إلى مستندات أصغر أولا.

الخطوات التالية