IndexingParametersConfiguration interface

الحزمة:: @azure/search-documents

قاموس لخصائص التكوين الخاصة بمفهرس. كل اسم هو اسم خاصية معينة. يجب أن تكون كل قيمة من نوع بدائي.

الخصائص

allowSkillsetToReadFileData	إذا كان صحيحا، فسينشئ مسارا /document/file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.
dataToExtract	تحديد البيانات المراد استخراجها من تخزين Azure blob وإخبار المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.
delimitedTextDelimiter	بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "\|").
delimitedTextHeaders	بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.
documentRoot	بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.
excludedFileNameExtensions	قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.
executionEnvironment	تحديد البيئة التي يجب أن ينفذ فيها المفهرس.
failOnUnprocessableDocument	بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، اضبط على false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.
failOnUnsupportedContentType	بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.
firstLineContainsHeaders	بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.
imageAction	تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.
indexedFileNameExtensions	قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيق معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.
indexStorageMetadataOnlyForOversizedDocuments	بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا بحيث لا يمكن معالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم كأخطاء بشكل افتراضي. للحصول على حدود لحجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
parsingMode	يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.
pdfTextRotationAlgorithm	تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.
queryTimeout	يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".

تفاصيل الخاصية

allowSkillsetToReadFileData

إذا كان صحيحا، فسينشئ مسارا /document/file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.

allowSkillsetToReadFileData?: boolean

قيمة الخاصية

boolean

dataToExtract

تحديد البيانات المراد استخراجها من تخزين Azure blob وإخبار المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

قيمة الخاصية

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").

delimitedTextDelimiter?: string

قيمة الخاصية

string

delimitedTextHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.

delimitedTextHeaders?: string

قيمة الخاصية

string

documentRoot

بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.

documentRoot?: string

قيمة الخاصية

string

excludedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.

excludedFileNameExtensions?: string

قيمة الخاصية

string

executionEnvironment

تحديد البيئة التي يجب أن ينفذ فيها المفهرس.

executionEnvironment?: "standard" | "private"

قيمة الخاصية

"standard" | "private"

failOnUnprocessableDocument

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، اضبط على false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.

failOnUnprocessableDocument?: boolean

قيمة الخاصية

boolean

failOnUnsupportedContentType

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.

failOnUnsupportedContentType?: boolean

قيمة الخاصية

boolean

firstLineContainsHeaders

بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.

firstLineContainsHeaders?: boolean

قيمة الخاصية

boolean

imageAction

تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

قيمة الخاصية

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيق معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.

indexedFileNameExtensions?: string

قيمة الخاصية

string

indexStorageMetadataOnlyForOversizedDocuments

بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا بحيث لا يمكن معالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم كأخطاء بشكل افتراضي. للحصول على حدود لحجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

قيمة الخاصية

boolean

parsingMode

يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

قيمة الخاصية

pdfTextRotationAlgorithm

تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

قيمة الخاصية

"none" | "detectAngles"

queryTimeout

يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".

queryTimeout?: string

قيمة الخاصية

string

مشاركة عبر

IndexingParametersConfiguration interface

الخصائص

تفاصيل الخاصية

allowSkillsetToReadFileData

قيمة الخاصية

dataToExtract

قيمة الخاصية

delimitedTextDelimiter

قيمة الخاصية

delimitedTextHeaders

قيمة الخاصية

documentRoot

قيمة الخاصية

excludedFileNameExtensions

قيمة الخاصية

executionEnvironment

قيمة الخاصية

failOnUnprocessableDocument

قيمة الخاصية

failOnUnsupportedContentType

قيمة الخاصية

firstLineContainsHeaders

قيمة الخاصية

imageAction

قيمة الخاصية

indexedFileNameExtensions

قيمة الخاصية

indexStorageMetadataOnlyForOversizedDocuments

قيمة الخاصية

parsingMode

قيمة الخاصية

pdfTextRotationAlgorithm

قيمة الخاصية

queryTimeout

قيمة الخاصية