IndexingParametersConfiguration interface
قاموس لخصائص التكوين الخاصة بمفهرس. كل اسم هو اسم خاصية معينة. يجب أن تكون كل قيمة من نوع بدائي.
الخصائص
allow |
إذا كان صحيحا، فسينشئ مسارا «document»file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند. |
data |
يحدد البيانات المراد استخراجها من تخزين Azure blob ويخبر المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs. |
delimited |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|"). |
delimited |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس. |
document |
بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية. |
excluded |
قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة. |
execution |
يحدد البيئة التي يجب أن ينفذ فيها المفهرس. |
fail |
بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة. |
fail |
بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا. |
first |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس. |
image |
تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا. |
indexed |
قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيقات معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد. |
index |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا لمعالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم على أنها أخطاء بشكل افتراضي. للحصول على حدود على حجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
parsing |
يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob. |
pdf |
تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob. |
query |
يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss". |
تفاصيل الخاصية
allowSkillsetToReadFileData
إذا كان صحيحا، فسينشئ مسارا «document»file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.
allowSkillsetToReadFileData?: boolean
قيمة الخاصية
boolean
dataToExtract
يحدد البيانات المراد استخراجها من تخزين Azure blob ويخبر المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.
dataToExtract?: BlobIndexerDataToExtract
قيمة الخاصية
delimitedTextDelimiter
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").
delimitedTextDelimiter?: string
قيمة الخاصية
string
delimitedTextHeaders
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.
delimitedTextHeaders?: string
قيمة الخاصية
string
documentRoot
بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.
documentRoot?: string
قيمة الخاصية
string
excludedFileNameExtensions
قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.
excludedFileNameExtensions?: string
قيمة الخاصية
string
executionEnvironment
يحدد البيئة التي يجب أن ينفذ فيها المفهرس.
executionEnvironment?: IndexerExecutionEnvironment
قيمة الخاصية
failOnUnprocessableDocument
بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.
failOnUnprocessableDocument?: boolean
قيمة الخاصية
boolean
failOnUnsupportedContentType
بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.
failOnUnsupportedContentType?: boolean
قيمة الخاصية
boolean
firstLineContainsHeaders
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.
firstLineContainsHeaders?: boolean
قيمة الخاصية
boolean
imageAction
تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.
imageAction?: BlobIndexerImageAction
قيمة الخاصية
indexedFileNameExtensions
قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيقات معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.
indexedFileNameExtensions?: string
قيمة الخاصية
string
indexStorageMetadataOnlyForOversizedDocuments
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا لمعالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم على أنها أخطاء بشكل افتراضي. للحصول على حدود على حجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
قيمة الخاصية
boolean
parsingMode
يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.
parsingMode?: BlobIndexerParsingMode
قيمة الخاصية
pdfTextRotationAlgorithm
تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.
pdfTextRotationAlgorithm?: BlobIndexerPDFTextRotationAlgorithm
قيمة الخاصية
queryTimeout
يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".
queryTimeout?: string
قيمة الخاصية
string