نسخ البيانات إلى فهرس Azure الذكاء الاصطناعي Search باستخدام Azure Data Factory أو Synapse Analytics
ينطبق على: Azure Data Factory Azure Synapse Analytics
تلميح
جرب Data Factory في Microsoft Fabric، وهو حل تحليلي متكامل للمؤسسات. يغطي Microsoft Fabric كل شيء بدءا من حركة البيانات إلى علم البيانات والتحليلات في الوقت الحقيقي والمعلومات المهنية وإعداد التقارير. تعرف على كيفية بدء إصدار تجريبي جديد مجانا!
توضح هذه المقالة كيفية استخدام نشاط النسخ في Azure Data Factory أو مسار Synapse Analytics لنسخ البيانات إلى فهرس Azure الذكاء الاصطناعي Search. تعتمد هذه المقالة على مقالة نظرة عامة على نشاط النسخ التي تقدم نظرة عامة على نشاط النسخ.
القدرات المدعومة
موصل Azure الذكاء الاصطناعي Search هذا مدعوم للقدرات التالية:
القدرات المدعومة | IR | نقطة النهاية الخاصة المُدارة |
---|---|---|
نشاط النسخ (-/sink) | (1) (2) | ✓ |
① وقت تشغيل تكامل Azure ② وقت تشغيل التكامل المستضاف ذاتيًا
يمكنك نسخ البيانات من أي مخزن بيانات مصدر معتمد إلى فهرس البحث. للحصول على قائمة بمخازن البيانات المدعومة كمصادر/متلقيات بواسطة نشاط النسخ، راجع جدول مخازن البيانات المدعومة.
الشروع في العمل
لتنفيذ نشاط النسخ باستخدام أحد المسارات، يمكنك استخدام إحدى الأدوات أو عدد تطوير البرامج التالية:
- أداة نسخ البيانات
- مدخل Azure
- The .NET SDK
- عدة تطوير برامج Python
- Azure PowerShell
- واجهة برمجة تطبيقات REST
- قالب Azure Resource Manager
إنشاء خدمة مرتبطة بـ Azure Search باستخدام واجهة المستخدم
استخدم الخطوات التالية لإنشاء خدمة مرتبطة بـ Azure Search في واجهة مستخدم مدخل Microsoft Azure.
استعرض للوصول إلى علامة التبويب "Manage" في مصنع بيانات Azure أو مساحة عمل Synapse، وحدد "Linked Services"، ثم انقر فوق "New":
ابحث عن "Search" وحدد موصل Azure Search.
قم بتكوين تفاصيل الخدمة، واختبر الاتصال، وأنشئ الخدمة المرتبطة الجديدة.
تفاصيل تكوين الموصل
توفر الأقسام التالية تفاصيل حول الخصائص المستخدمة لتعريف كيانات Data Factory الخاصة بموصل Azure الذكاء الاصطناعي Search.
خصائص الخدمة المرتبطة
يتم دعم الخصائص التالية لخدمة Azure الذكاء الاصطناعي Search المرتبطة:
الخاصية | الوصف | مطلوب |
---|---|---|
النوع | يجب تعيين خاصية النوع إلى: AzureSearch | نعم |
عنوان URL | "URL" لخدمة البحث. | نعم |
المفتاح | مفتاح المسؤول لخدمة البحث. ضع علامة على هذا الحقل باعتباره SecureString لتخزينه بشكل آمن، أو قم بالإشارة إلى بيانات سرية مخزنة في Azure Key Vault. | نعم |
connectVia | Integration Runtime الذي سيتم استخدامه للاتصال بمخزن البيانات. يمكنك استخدام Azure Integration Runtime أو وقت تشغيل التكامل المستضاف ذاتياً (إذا كان مخزن البيانات موجوداً في شبكة خاصة). إذا لم يتم تحديده، فإنه يستخدم Azure Integration Runtime الافتراضي. | لا |
هام
عند نسخ البيانات من مخزن بيانات سحابي إلى فهرس البحث، في خدمة Azure الذكاء الاصطناعي Search المرتبطة، تحتاج إلى الرجوع إلى وقت تشغيل تكامل Azure مع منطقة صريحة في connactVia. قم بتعيين المنطقة كمنطقة تواجد خدمة البحث الخاصة بك. تعرف على المزيد من Azure Integration Runtime.
مثال:
{
"name": "AzureSearchLinkedService",
"properties": {
"type": "AzureSearch",
"typeProperties": {
"url": "https://<service>.search.windows.net",
"key": {
"type": "SecureString",
"value": "<AdminKey>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
خصائص مجموعة البيانات
للحصول على قائمة كاملة بالأقسام والخصائص المتوفرة لتعريف مجموعات البيانات، راجع مقالة مجموعات البيانات. يوفر هذا القسم قائمة بالخصائص التي تدعمها مجموعة بيانات Azure الذكاء الاصطناعي Search.
لنسخ البيانات إلى Azure الذكاء الاصطناعي Search، يتم دعم الخصائص التالية:
الخاصية | الوصف | مطلوب |
---|---|---|
النوع | يجب تعيين خاصية نوع مجموعة البيانات إلى: AzureSearchIndex | نعم |
indexName | اسم فهرس البحث. لا تنشئ الخدمة الفهرس. يجب أن يكون الفهرس موجودا في Azure الذكاء الاصطناعي Search. | نعم |
مثال:
{
"name": "AzureSearchIndexDataset",
"properties": {
"type": "AzureSearchIndex",
"typeProperties" : {
"indexName": "products"
},
"schema": [],
"linkedServiceName": {
"referenceName": "<Azure AI Search linked service name>",
"type": "LinkedServiceReference"
}
}
}
انسخ خصائص النشاط
للحصول على قائمة كاملة بالأقسام والخصائص المتوفرة لتعريف الأنشطة، راجع مقالة التدفقات. يوفر هذا القسم قائمة بالخصائص التي يدعمها مصدر Azure الذكاء الاصطناعي Search.
Azure الذكاء الاصطناعي Search كمتلقي
لنسخ البيانات إلى Azure الذكاء الاصطناعي Search، قم بتعيين نوع المصدر في نشاط النسخ إلى AzureSearchIndexSink. تُدعم الخصائص التالية في قسم متلقي نشاط النسخ:
الخاصية | الوصف | مطلوب |
---|---|---|
النوع | يجب تعيين خاصية نوع مصدر نشاط النسخ إلى: AzureSearchIndexSink | نعم |
writeBehavior | تحديد ما إذا كان سيتم دمج مستند موجود بالفعل في الفهرس أو استبداله. يرجى مراجعة خاصية WriteBehavior. القيم المسموح بها هي Merge (افتراضي)، وUpload. |
لا |
writeBatchSize | تحميل البيانات إلى فهرس البحث عندما يصل حجم المخزن المؤقت إلى writeBatchSize. راجع خاصية WriteBatchSize للمزيد من التفاصيل. القيم المسموح بها هي: عدد صحيح 1 إلى 1,000؛ الافتراضي هو 1000. |
لا |
maxConcurrentConnections | الحد الأعلى للاتصالات المتزامنة التي تم إنشاؤها إلى مخزن البيانات أثناء تشغيل النشاط. حدد قيمة فقط عندما تريد تحديد الاتصالات المتزامنة. | لا |
خاصية WriteBehavior
يقوم AzureSearchSink بالإدراج أو التحديث "upsert" عند كتابة البيانات. بمعنى آخر، عند كتابة مستند، إذا كان مفتاح المستند موجودا بالفعل في فهرس البحث، يقوم Azure الذكاء الاصطناعي Search بتحديث المستند الموجود بدلا من طرح استثناء تعارض.
يوفر AzureSearchSink سلوكين upsert التاليين (باستخدام AzureSearch SDK):
- Merge: ضم جميع الأعمدة في المستند الجديد مع المستند الموجود. بالنسبة للأعمدة ذات القيمة الفارغة في المستند الجديد، يتم الاحتفاظ بالقيمة الموجودة في المستند الحالي.
- Upload: يحل المستند الجديد محل المستند الموجود. بالنسبة للأعمدة غير المحددة في المستند الجديد، يتم تعيين القيمة إلى قيمة خالية سواء كانت هناك قيمة غير خالية في المستند الموجود أم لا.
السلوك الافتراضي هو Merge.
خاصية WriteBatchSize
يدعم Azure الذكاء الاصطناعي خدمة البحث كتابة المستندات كدفعة. يمكن أن تحتوي الدُفعة على من 1 إلى 1000 إجراء. يعالج الإجراء مستنداً واحداً لتنفيذ عملية التحميل/الدمج.
مثال:
"activities":[
{
"name": "CopyToAzureSearch",
"type": "Copy",
"inputs": [
{
"referenceName": "<input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<Azure AI Search output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "<source type>"
},
"sink": {
"type": "AzureSearchIndexSink",
"writeBehavior": "Merge"
}
}
}
]
دعم نوع البيانات
يحدد الجدول التالي ما إذا كان نوع بيانات Azure الذكاء الاصطناعي Search مدعوما أم لا.
نوع بيانات Azure الذكاء الاصطناعي Search | مدعوم في Azure الذكاء الاصطناعي Search Sink |
---|---|
السلسلة | Y |
Int32 | Y |
Int64 | Y |
مزدوج | Y |
Boolean | Y |
DataTimeOffset | Y |
صفيف السلسلة | N |
GeographyPoint | N |
لا يتوفر حالياً دعم أنواع البيانات الأخرى مثل ComplexType. للحصول على قائمة كاملة من أنواع البيانات المدعومة من Azure الذكاء الاصطناعي Search، راجع أنواع البيانات المدعومة (Azure الذكاء الاصطناعي Search).
المحتوى ذو الصلة
للحصول على قائمة بمخازن البيانات المدعومة من نشاط النسخ كمصادر ومواضع تلقي، راجع مخازن البيانات المدعومة.