IndexingParametersConfiguration interface
قاموس لخصائص التكوين الخاصة بمفهرس. كل اسم هو اسم خاصية معينة. يجب أن تكون كل قيمة من نوع بدائي.
الخصائص
| allow |
إذا كان صحيحا، فسينشئ مسارا /document/file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند. |
| data |
تحديد البيانات المراد استخراجها من تخزين Azure blob وإخبار المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs. |
| delimited |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|"). |
| delimited |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس. |
| document |
بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية. |
| excluded |
قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة. |
| execution |
تحديد البيئة التي يجب أن ينفذ فيها المفهرس. |
| fail |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، اضبط على false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة. |
| fail |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا. |
| first |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس. |
| image |
تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا. |
| indexed |
قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيق معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد. |
| index |
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا بحيث لا يمكن معالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم كأخطاء بشكل افتراضي. للحصول على حدود لحجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
| parsing |
يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob. |
| pdf |
تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob. |
| query |
يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss". |
تفاصيل الخاصية
allowSkillsetToReadFileData
إذا كان صحيحا، فسينشئ مسارا /document/file_data يمثل كائنا يمثل بيانات الملف الأصلية التي تم تنزيلها من مصدر بيانات الكائن الثنائي كبير الحجم. يسمح لك هذا بتمرير بيانات الملف الأصلية إلى مهارة مخصصة للمعالجة داخل مسار الإثراء، أو إلى مهارة استخراج المستند.
allowSkillsetToReadFileData?: boolean
قيمة الخاصية
boolean
dataToExtract
تحديد البيانات المراد استخراجها من تخزين Azure blob وإخبار المفهرس بالبيانات التي يجب استخراجها من محتوى الصورة عند تعيين "imageAction" إلى قيمة أخرى غير "none". ينطبق هذا على محتوى الصورة المضمنة في .PDF أو تطبيق آخر، أو ملفات الصور مثل .jpg .png، في Azure blobs.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
قيمة الخاصية
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل CSV، يحدد محدد حرف واحد في نهاية السطر لملفات CSV حيث يبدأ كل سطر مستندا جديدا (على سبيل المثال، "|").
delimitedTextDelimiter?: string
قيمة الخاصية
string
delimitedTextHeaders
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، تحدد قائمة محددة بفاصلة من رؤوس الأعمدة، وهي مفيدة لتعيين حقول المصدر إلى حقول الوجهة في فهرس.
delimitedTextHeaders?: string
قيمة الخاصية
string
documentRoot
بالنسبة إلى صفائف JSON، نظرا لمستند منظم أو شبه منظم، يمكنك تحديد مسار إلى الصفيف باستخدام هذه الخاصية.
documentRoot?: string
قيمة الخاصية
string
excludedFileNameExtensions
قائمة محددة بفاصلة من ملحقات اسم الملف لتجاهلها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك استبعاد ".png، .mp4" لتخطي هذه الملفات أثناء الفهرسة.
excludedFileNameExtensions?: string
قيمة الخاصية
string
executionEnvironment
تحديد البيئة التي يجب أن ينفذ فيها المفهرس.
executionEnvironment?: "standard" | "private"
قيمة الخاصية
"standard" | "private"
failOnUnprocessableDocument
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، اضبط على false إذا كنت تريد متابعة الفهرسة إذا فشل المستند في الفهرسة.
failOnUnprocessableDocument?: boolean
قيمة الخاصية
boolean
failOnUnsupportedContentType
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين إلى false إذا كنت تريد متابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، ولا تعرف جميع أنواع المحتوى (ملحقات الملفات) مسبقا.
failOnUnsupportedContentType?: boolean
قيمة الخاصية
boolean
firstLineContainsHeaders
بالنسبة إلى الكائنات الثنائية كبيرة الحجم CSV، يشير إلى أن السطر الأول (غير الفارغ) من كل كائن ثنائي كبير الحجم يحتوي على رؤوس.
firstLineContainsHeaders?: boolean
قيمة الخاصية
boolean
imageAction
تحديد كيفية معالجة الصور المضمنة وملفات الصور في تخزين Azure blob. يتطلب تعيين تكوين "imageAction" إلى أي قيمة أخرى غير "none" إرفاق مجموعة مهارات بهذا المفهرس أيضا.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
قيمة الخاصية
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
قائمة محددة بفاصلة من ملحقات اسم الملف لتحديدها عند المعالجة من تخزين Azure blob. على سبيل المثال، يمكنك التركيز على الفهرسة على ملفات تطبيق معينة ".docx، .pptx، .msg" لتضمين أنواع الملفات هذه على وجه التحديد.
indexedFileNameExtensions?: string
قيمة الخاصية
string
indexStorageMetadataOnlyForOversizedDocuments
بالنسبة إلى الكائنات الثنائية كبيرة الحجم ل Azure، قم بتعيين هذه الخاصية إلى true لفهرسة بيانات تعريف التخزين لمحتوى الكائن الثنائي كبير جدا بحيث لا يمكن معالجته. يتم التعامل مع الكائنات الثنائية كبيرة الحجم كأخطاء بشكل افتراضي. للحصول على حدود لحجم الكائن الثنائي كبير الحجم، راجع https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
قيمة الخاصية
boolean
parsingMode
يمثل وضع التحليل للفهرسة من مصدر بيانات Azure blob.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
قيمة الخاصية
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
تحديد خوارزمية استخراج النص من ملفات PDF في تخزين Azure blob.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
قيمة الخاصية
"none" | "detectAngles"
queryTimeout
يزيد المهلة إلى ما بعد المهلة الافتراضية البالغة 5 دقائق لمصادر بيانات قاعدة بيانات Azure SQL، المحددة بالتنسيق "hh:mm:ss".
queryTimeout?: string
قيمة الخاصية
string