نسخ البيانات إلى فهرس Azure الذكاء الاصطناعي Search باستخدام Azure Data Factory أو Synapse Analytics

ينطبق على: Azure Data Factory Azure Synapse Analytics

تلميح

جرب Data Factory في Microsoft Fabric، وهو حل تحليلي متكامل للمؤسسات. يغطي Microsoft Fabric كل شيء بدءا من حركة البيانات إلى علم البيانات والتحليلات في الوقت الحقيقي والمعلومات المهنية وإعداد التقارير. تعرف على كيفية بدء إصدار تجريبي جديد مجانا!

توضح هذه المقالة كيفية استخدام نشاط النسخ في Azure Data Factory أو مسار Synapse Analytics لنسخ البيانات إلى فهرس Azure الذكاء الاصطناعي Search. تعتمد هذه المقالة على مقالة نظرة عامة على نشاط النسخ التي تقدم نظرة عامة على نشاط النسخ.

القدرات المدعومة

موصل Azure الذكاء الاصطناعي Search هذا مدعوم للقدرات التالية:

القدرات المدعومة IR نقطة النهاية الخاصة المُدارة
نشاط النسخ (-/sink) (1) (2)

① وقت تشغيل تكامل Azure ② وقت تشغيل التكامل المستضاف ذاتيًا

يمكنك نسخ البيانات من أي مخزن بيانات مصدر معتمد إلى فهرس البحث. للحصول على قائمة بمخازن البيانات المدعومة كمصادر/متلقيات بواسطة نشاط النسخ، راجع جدول مخازن البيانات المدعومة.

الشروع في العمل

لتنفيذ نشاط النسخ باستخدام أحد المسارات، يمكنك استخدام إحدى الأدوات أو عدد تطوير البرامج التالية:

إنشاء خدمة مرتبطة بـ Azure Search باستخدام واجهة المستخدم

استخدم الخطوات التالية لإنشاء خدمة مرتبطة بـ Azure Search في واجهة مستخدم مدخل Microsoft Azure.

  1. استعرض للوصول إلى علامة التبويب "Manage" في مصنع بيانات Azure أو مساحة عمل Synapse، وحدد "Linked Services"، ثم انقر فوق "New":

  2. ابحث عن "Search" وحدد موصل Azure Search.

    تحديد موصل Azure Search.

  3. قم بتكوين تفاصيل الخدمة، واختبر الاتصال، وأنشئ الخدمة المرتبطة الجديدة.

    تكوين خدمة مرتبطة إلى Azure Search.

تفاصيل تكوين الموصل

توفر الأقسام التالية تفاصيل حول الخصائص المستخدمة لتعريف كيانات Data Factory الخاصة بموصل Azure الذكاء الاصطناعي Search.

خصائص الخدمة المرتبطة

يتم دعم الخصائص التالية لخدمة Azure الذكاء الاصطناعي Search المرتبطة:

الخاصية الوصف مطلوب
النوع يجب تعيين خاصية النوع إلى: AzureSearch ‏‏نعم‬
عنوان URL "URL" لخدمة البحث. ‏‏نعم‬
المفتاح مفتاح المسؤول لخدمة البحث. ضع علامة على هذا الحقل باعتباره SecureString لتخزينه بشكل آمن، أو قم بالإشارة إلى بيانات سرية مخزنة في Azure Key Vault. ‏‏نعم‬
connectVia Integration Runtime الذي سيتم استخدامه للاتصال بمخزن البيانات. يمكنك استخدام Azure Integration Runtime أو وقت تشغيل التكامل المستضاف ذاتياً (إذا كان مخزن البيانات موجوداً في شبكة خاصة). إذا لم يتم تحديده، فإنه يستخدم Azure Integration Runtime الافتراضي. لا

هام

عند نسخ البيانات من مخزن بيانات سحابي إلى فهرس البحث، في خدمة Azure الذكاء الاصطناعي Search المرتبطة، تحتاج إلى الرجوع إلى وقت تشغيل تكامل Azure مع منطقة صريحة في connactVia. قم بتعيين المنطقة كمنطقة تواجد خدمة البحث الخاصة بك. تعرف على المزيد من Azure Integration Runtime.

مثال:

{
    "name": "AzureSearchLinkedService",
    "properties": {
        "type": "AzureSearch",
        "typeProperties": {
            "url": "https://<service>.search.windows.net",
            "key": {
                "type": "SecureString",
                "value": "<AdminKey>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

خصائص مجموعة البيانات

للحصول على قائمة كاملة بالأقسام والخصائص المتوفرة لتعريف مجموعات البيانات، راجع مقالة مجموعات البيانات. يوفر هذا القسم قائمة بالخصائص التي تدعمها مجموعة بيانات Azure الذكاء الاصطناعي Search.

لنسخ البيانات إلى Azure الذكاء الاصطناعي Search، يتم دعم الخصائص التالية:

الخاصية الوصف مطلوب
النوع يجب تعيين خاصية نوع مجموعة البيانات إلى: AzureSearchIndex ‏‏نعم‬
indexName اسم فهرس البحث. لا تنشئ الخدمة الفهرس. يجب أن يكون الفهرس موجودا في Azure الذكاء الاصطناعي Search. ‏‏نعم‬

مثال:

{
    "name": "AzureSearchIndexDataset",
    "properties": {
        "type": "AzureSearchIndex",
        "typeProperties" : {
            "indexName": "products"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Azure AI Search linked service name>",
            "type": "LinkedServiceReference"
        }
   }
}

انسخ خصائص النشاط

للحصول على قائمة كاملة بالأقسام والخصائص المتوفرة لتعريف الأنشطة، راجع مقالة التدفقات. يوفر هذا القسم قائمة بالخصائص التي يدعمها مصدر Azure الذكاء الاصطناعي Search.

Azure الذكاء الاصطناعي Search كمتلقي

لنسخ البيانات إلى Azure الذكاء الاصطناعي Search، قم بتعيين نوع المصدر في نشاط النسخ إلى AzureSearchIndexSink. تُدعم الخصائص التالية في قسم متلقي نشاط النسخ:

الخاصية الوصف مطلوب
النوع يجب تعيين خاصية نوع مصدر نشاط النسخ إلى: AzureSearchIndexSink ‏‏نعم‬
writeBehavior تحديد ما إذا كان سيتم دمج مستند موجود بالفعل في الفهرس أو استبداله. يرجى مراجعة خاصية WriteBehavior.

القيم المسموح بها هي Merge (افتراضي)، وUpload.
لا
writeBatchSize تحميل البيانات إلى فهرس البحث عندما يصل حجم المخزن المؤقت إلى writeBatchSize. راجع خاصية WriteBatchSize للمزيد من التفاصيل.

القيم المسموح بها هي: عدد صحيح 1 إلى 1,000؛ الافتراضي هو 1000.
لا
maxConcurrentConnections الحد الأعلى للاتصالات المتزامنة التي تم إنشاؤها إلى مخزن البيانات أثناء تشغيل النشاط. حدد قيمة فقط عندما تريد تحديد الاتصالات المتزامنة. لا

خاصية WriteBehavior

يقوم AzureSearchSink بالإدراج أو التحديث "upsert" عند كتابة البيانات. بمعنى آخر، عند كتابة مستند، إذا كان مفتاح المستند موجودا بالفعل في فهرس البحث، يقوم Azure الذكاء الاصطناعي Search بتحديث المستند الموجود بدلا من طرح استثناء تعارض.

يوفر AzureSearchSink سلوكين upsert التاليين (باستخدام AzureSearch SDK):

  • Merge: ضم جميع الأعمدة في المستند الجديد مع المستند الموجود. بالنسبة للأعمدة ذات القيمة الفارغة في المستند الجديد، يتم الاحتفاظ بالقيمة الموجودة في المستند الحالي.
  • Upload: يحل المستند الجديد محل المستند الموجود. بالنسبة للأعمدة غير المحددة في المستند الجديد، يتم تعيين القيمة إلى قيمة خالية سواء كانت هناك قيمة غير خالية في المستند الموجود أم لا.

السلوك الافتراضي هو Merge.

خاصية WriteBatchSize

يدعم Azure الذكاء الاصطناعي خدمة البحث كتابة المستندات كدفعة. يمكن أن تحتوي الدُفعة على من 1 إلى 1000 إجراء. يعالج الإجراء مستنداً واحداً لتنفيذ عملية التحميل/الدمج.

مثال:

"activities":[
    {
        "name": "CopyToAzureSearch",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure AI Search output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzureSearchIndexSink",
                "writeBehavior": "Merge"
            }
        }
    }
]

دعم نوع البيانات

يحدد الجدول التالي ما إذا كان نوع بيانات Azure الذكاء الاصطناعي Search مدعوما أم لا.

نوع بيانات Azure الذكاء الاصطناعي Search مدعوم في Azure الذكاء الاصطناعي Search Sink
السلسلة‬ Y
Int32 Y
Int64 Y
مزدوج Y
Boolean Y
DataTimeOffset Y
صفيف السلسلة N
GeographyPoint N

لا يتوفر حالياً دعم أنواع البيانات الأخرى مثل ComplexType. للحصول على قائمة كاملة من أنواع البيانات المدعومة من Azure الذكاء الاصطناعي Search، راجع أنواع البيانات المدعومة (Azure الذكاء الاصطناعي Search).

للحصول على قائمة بمخازن البيانات المدعومة من نشاط النسخ كمصادر ومواضع تلقي، راجع مخازن البيانات المدعومة.