IndexingParametersConfiguration interface

قاموس لخصائص التكوين الخاصة بمفهرس. كل اسم هو اسم خاصية معينة. يجب أن تكون كل قيمة من نوع بدائي.

الخصائص

allowSkillsetToReadFileData

إذا كان صحيحا، فسينشئ مسارا «document»file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.

dataToExtract

يحدد البيانات المراد استخراجها من تخزين Azure blob ويخبر المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.

delimitedTextDelimiter

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").

delimitedTextHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.

documentRoot

بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.

excludedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.

executionEnvironment

يحدد البيئة التي يجب أن ينفذ فيها المفهرس.

failOnUnprocessableDocument

بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.

failOnUnsupportedContentType

بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.

firstLineContainsHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.

imageAction

تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.

indexedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيقات معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.

indexStorageMetadataOnlyForOversizedDocuments

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا لمعالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم على أنها أخطاء بشكل افتراضي. للحصول على حدود على حجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

parsingMode

يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.

pdfTextRotationAlgorithm

تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.

queryTimeout

يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".

تفاصيل الخاصية

allowSkillsetToReadFileData

إذا كان صحيحا، فسينشئ مسارا «document»file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.

allowSkillsetToReadFileData?: boolean

قيمة الخاصية

boolean

dataToExtract

يحدد البيانات المراد استخراجها من تخزين Azure blob ويخبر المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.

dataToExtract?: BlobIndexerDataToExtract

قيمة الخاصية

delimitedTextDelimiter

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").

delimitedTextDelimiter?: string

قيمة الخاصية

string

delimitedTextHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.

delimitedTextHeaders?: string

قيمة الخاصية

string

documentRoot

بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.

documentRoot?: string

قيمة الخاصية

string

excludedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.

excludedFileNameExtensions?: string

قيمة الخاصية

string

executionEnvironment

يحدد البيئة التي يجب أن ينفذ فيها المفهرس.

executionEnvironment?: IndexerExecutionEnvironment

قيمة الخاصية

failOnUnprocessableDocument

بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.

failOnUnprocessableDocument?: boolean

قيمة الخاصية

boolean

failOnUnsupportedContentType

بالنسبة إلى Azure blobs، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.

failOnUnsupportedContentType?: boolean

قيمة الخاصية

boolean

firstLineContainsHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.

firstLineContainsHeaders?: boolean

قيمة الخاصية

boolean

imageAction

تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.

imageAction?: BlobIndexerImageAction

قيمة الخاصية

indexedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيقات معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.

indexedFileNameExtensions?: string

قيمة الخاصية

string

indexStorageMetadataOnlyForOversizedDocuments

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا لمعالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم على أنها أخطاء بشكل افتراضي. للحصول على حدود على حجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

قيمة الخاصية

boolean

parsingMode

يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.

parsingMode?: BlobIndexerParsingMode

قيمة الخاصية

pdfTextRotationAlgorithm

تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.

pdfTextRotationAlgorithm?: BlobIndexerPDFTextRotationAlgorithm

قيمة الخاصية

queryTimeout

يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".

queryTimeout?: string

قيمة الخاصية

string